Conversie en optimalisatie
Conversie en optimalisatie
Aspose.PDF FOSS for .NET biedt converters voor het omzetten van PDF’s naar HTML,
Markdown, SVG en platte tekst. Het optimalisatiesubsysteem verkleint de bestandsgrootte
en zorgt voor PDF/A-naleving via PdfFormatConversionOptions.
PDF naar HTML
PdfToHtmlConverter exporteert PDF‑pagina’s als HTML‑documenten.
var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");
// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");HtmlSaveOptions biedt controle over beeldverwerking, lettertype-embedden en lay-outstrategie.
PDF naar Markdown
PdfToMarkdownConverter exporteert PDF-inhoud als Markdown-tekst.
var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");
// Single page
converter.SavePageAsMarkdown(1, "page1.md");PDF naar SVG
PdfToSvgConverter rendert elke pagina als een schaalbare vectorafbeelding.
var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");PDF naar tekst
PdfToTextConverter extraheert platte tekst uit PDF-pagina’s.
var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");PDF/A-conformiteit
PdfFormatConversionOptions valideert en converteert documenten naar PDF/A-standaarden.
using var doc = Document.Open(pdfBytes);
var options = new PdfFormatConversionOptions(
"log.xml",
PdfFormat.PDF_A_1B,
ConvertErrorAction.Delete);
doc.Convert(options);
doc.Save("pdfa.pdf");Kopniveau controle
HeadingLevels configureert welke kopniveaus worden herkend tijdens HTML- of Markdown-conversie.
var levels = new HeadingLevels();
levels.AddLevels(1, 3); // Recognize H1 through H3Tips en Best Practices
- Gebruik
PdfToHtmlConvertervoor webpublicatie enPdfToMarkdownConvertervoor documentatieworkflows. - PDF/A-conversie kan functies (JavaScript, encryptie) verwijderen die in strijd zijn met de standaard — gebruik
ConvertErrorAction.DeleteofConvertErrorAction.None. - Voor grote documenten, converteer pagina voor pagina om het geheugen te beheren.
HtmlSaveOptionsbepaalt of afbeeldingen inline worden ingebed of als externe bestanden worden opgeslagen.- SVG-uitvoer is ideaal voor weergave van individuele pagina’s in hoge resolutie.
Veelvoorkomende problemen
| Probleem | Oorzaak | Oplossing |
|---|---|---|
| HTML-uitvoer mist afbeeldingen | Afbeeldingen niet ingesloten; externe paden onjuist | Configureer HtmlSaveOptions voor ingesloten afbeeldingen |
| PDF/A-conversie verwijdert annotaties | Annotaties niet toegestaan in het doel-PDF/A-profiel | Gebruik PDF/A-2 of PDF/A-3 die annotaties toestaan |
| Tekstextractie verliest opmaak | Platte-tekstuitvoer heeft geen opmaak per ontwerp | Gebruik in plaats daarvan HTML- of Markdown-conversie |
FAQ
Welke PDF/A-profielen worden ondersteund?
PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A en PDF/A-3B-profielen worden ondersteund via PdfFormat enumeratiewaarden.
Kan ik een enkele pagina naar HTML converteren?
Ja. Gebruik PdfToHtmlConverter.SavePageAsHtml.
Behoudt Markdown-conversie tabellen?
De converter probeert tabelstructuren weer te geven als Markdown‑tabellen, maar complexe lay‑outs kunnen nabewerking vereisen.
API-referentieoverzicht
| Class / Method | Description |
|---|---|
PdfToHtmlConverter | PDF naar HTML converteren |
PdfToHtmlConverter.SaveAsHtml | Volledig document exporteren als HTML |
PdfToMarkdownConverter | PDF naar Markdown converteren |
PdfToSvgConverter | PDF-pagina’s naar SVG converteren |
PdfToTextConverter | Platte tekst uit PDF extraheren |
HtmlSaveOptions | Opties voor HTML-export (afbeeldingen, lettertypen, lay‑out) |
HeadingLevels | Herkende kopniveaus configureren |
PdfFormatConversionOptions | PDF/A‑validatie‑ en conversieopties |