Conversie en optimalisatie

Conversie en optimalisatie

Conversie en optimalisatie

Aspose.PDF FOSS for .NET biedt converters voor het omzetten van PDF’s naar HTML, Markdown, SVG en platte tekst. Het optimalisatiesubsysteem verkleint de bestandsgrootte en zorgt voor PDF/A-naleving via PdfFormatConversionOptions.


PDF naar HTML

PdfToHtmlConverter exporteert PDF‑pagina’s als HTML‑documenten.

var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");

// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");

HtmlSaveOptions biedt controle over beeldverwerking, lettertype-embedden en lay-outstrategie.


PDF naar Markdown

PdfToMarkdownConverter exporteert PDF-inhoud als Markdown-tekst.

var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");

// Single page
converter.SavePageAsMarkdown(1, "page1.md");

PDF naar SVG

PdfToSvgConverter rendert elke pagina als een schaalbare vectorafbeelding.

var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");

PDF naar tekst

PdfToTextConverter extraheert platte tekst uit PDF-pagina’s.

var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");

PDF/A-conformiteit

PdfFormatConversionOptions valideert en converteert documenten naar PDF/A-standaarden.

using var doc = Document.Open(pdfBytes);

var options = new PdfFormatConversionOptions(
    "log.xml",
    PdfFormat.PDF_A_1B,
    ConvertErrorAction.Delete);

doc.Convert(options);
doc.Save("pdfa.pdf");

Kopniveau controle

HeadingLevels configureert welke kopniveaus worden herkend tijdens HTML- of Markdown-conversie.

var levels = new HeadingLevels();
levels.AddLevels(1, 3);  // Recognize H1 through H3

Tips en Best Practices

  • Gebruik PdfToHtmlConverter voor webpublicatie en PdfToMarkdownConverter voor documentatieworkflows.
  • PDF/A-conversie kan functies (JavaScript, encryptie) verwijderen die in strijd zijn met de standaard — gebruik ConvertErrorAction.Delete of ConvertErrorAction.None.
  • Voor grote documenten, converteer pagina voor pagina om het geheugen te beheren.
  • HtmlSaveOptions bepaalt of afbeeldingen inline worden ingebed of als externe bestanden worden opgeslagen.
  • SVG-uitvoer is ideaal voor weergave van individuele pagina’s in hoge resolutie.

Veelvoorkomende problemen

ProbleemOorzaakOplossing
HTML-uitvoer mist afbeeldingenAfbeeldingen niet ingesloten; externe paden onjuistConfigureer HtmlSaveOptions voor ingesloten afbeeldingen
PDF/A-conversie verwijdert annotatiesAnnotaties niet toegestaan in het doel-PDF/A-profielGebruik PDF/A-2 of PDF/A-3 die annotaties toestaan
Tekstextractie verliest opmaakPlatte-tekstuitvoer heeft geen opmaak per ontwerpGebruik in plaats daarvan HTML- of Markdown-conversie

FAQ

Welke PDF/A-profielen worden ondersteund?

PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A en PDF/A-3B-profielen worden ondersteund via PdfFormat enumeratiewaarden.

Kan ik een enkele pagina naar HTML converteren?

Ja. Gebruik PdfToHtmlConverter.SavePageAsHtml.

Behoudt Markdown-conversie tabellen?

De converter probeert tabelstructuren weer te geven als Markdown‑tabellen, maar complexe lay‑outs kunnen nabewerking vereisen.


API-referentieoverzicht

Class / MethodDescription
PdfToHtmlConverterPDF naar HTML converteren
PdfToHtmlConverter.SaveAsHtmlVolledig document exporteren als HTML
PdfToMarkdownConverterPDF naar Markdown converteren
PdfToSvgConverterPDF-pagina’s naar SVG converteren
PdfToTextConverterPlatte tekst uit PDF extraheren
HtmlSaveOptionsOpties voor HTML-export (afbeeldingen, lettertypen, lay‑out)
HeadingLevelsHerkende kopniveaus configureren
PdfFormatConversionOptionsPDF/A‑validatie‑ en conversieopties

Zie ook

 Nederlands