Konvertering og optimering

Konvertering og optimering

Konvertering og optimering

Aspose.PDF FOSS for .NET leverer konvertere til at omdanne PDF’er til HTML, Markdown, SVG og almindelig tekst. Optimeringsundersystemet reducerer filstørrelsen og sikrer PDF/A-overholdelse gennem PdfFormatConversionOptions.


PDF til HTML

PdfToHtmlConverter eksporterer PDF‑sider som HTML‑dokumenter.

var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");

// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");

HtmlSaveOptions giver kontrol over billedhåndtering, skrifttypeindlejring og layoutstrategi.


PDF til Markdown

PdfToMarkdownConverter eksporterer PDF-indhold som Markdown-tekst.

var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");

// Single page
converter.SavePageAsMarkdown(1, "page1.md");

PDF til SVG

PdfToSvgConverter gengiver hver side som en skalerbar vektorgrafik.

var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");

PDF til tekst

PdfToTextConverter udtrækker ren tekst fra PDF‑sider.

var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");

PDF/A overholdelse

PdfFormatConversionOptions validerer og konverterer dokumenter til PDF/A-standarder.

using var doc = Document.Open(pdfBytes);

var options = new PdfFormatConversionOptions(
    "log.xml",
    PdfFormat.PDF_A_1B,
    ConvertErrorAction.Delete);

doc.Convert(options);
doc.Save("pdfa.pdf");

Kontrol af overskriftsniveau

HeadingLevels konfigurerer, hvilke overskriftsniveauer der genkendes under HTML- eller Markdown-konvertering.

var levels = new HeadingLevels();
levels.AddLevels(1, 3);  // Recognize H1 through H3

Tips og bedste praksis

  • Brug PdfToHtmlConverter til webpublicering og PdfToMarkdownConverter til dokumentationsarbejdsgange.
  • PDF/A-konvertering kan fjerne funktioner (JavaScript, kryptering), der overtræder standarden — brug ConvertErrorAction.Delete eller ConvertErrorAction.None.
  • For store dokumenter, konverter side for side for at håndtere hukommelsen.
  • HtmlSaveOptions styrer, om billeder er indlejret inline eller gemt som eksterne filer.
  • SVG-output er ideel til højopløsningsvisning af individuelle sider.

Almindelige problemer

ProblemÅrsagLøsning
HTML-output mangler billederBilleder er ikke indlejret; eksterne stier er forkerteKonfigurer HtmlSaveOptions for indlejrede billeder
PDF/A-konvertering fjerner annotationerAnnotationer er ikke tilladt i mål-PDF/A-profilenBrug PDF/A-2 eller PDF/A-3, som tillader annotationer
Tekstudtræk mister formateringRen-tekst output har ingen formatering som designBrug HTML- eller Markdown-konvertering i stedet

FAQ

Hvilke PDF/A-profiler understøttes?

PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A og PDF/A-3B profiler understøttes via PdfFormat enumerationsværdier.

Kan jeg konvertere en enkelt side til HTML?

Ja. Brug PdfToHtmlConverter.SavePageAsHtml.

Bevarer Markdown‑konvertering tabeller?

Konverteren forsøger at gengive tabelstrukturer som Markdown‑tabeller, men komplekse layout kan kræve efterbehandling.


API Referencens oversigt

Class / MethodDescription
PdfToHtmlConverterKonverter PDF til HTML
PdfToHtmlConverter.SaveAsHtmlEksporter hele dokumentet som HTML
PdfToMarkdownConverterKonverter PDF til Markdown
PdfToSvgConverterKonverter PDF-sider til SVG
PdfToTextConverterUdtræk ren tekst fra PDF
HtmlSaveOptionsIndstillinger for HTML-eksport (billeder, skrifttyper, layout)
HeadingLevelsKonfigurer genkendte overskriftsniveauer
PdfFormatConversionOptionsPDF/A-validerings- og konverteringsindstillinger

Se også

 Dansk