Konvertering og optimering
Konvertering og optimering
Aspose.PDF FOSS for .NET leverer konvertere til at omdanne PDF’er til HTML,
Markdown, SVG og almindelig tekst. Optimeringsundersystemet reducerer filstørrelsen
og sikrer PDF/A-overholdelse gennem PdfFormatConversionOptions.
PDF til HTML
PdfToHtmlConverter eksporterer PDF‑sider som HTML‑dokumenter.
var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");
// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");HtmlSaveOptions giver kontrol over billedhåndtering, skrifttypeindlejring og layoutstrategi.
PDF til Markdown
PdfToMarkdownConverter eksporterer PDF-indhold som Markdown-tekst.
var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");
// Single page
converter.SavePageAsMarkdown(1, "page1.md");PDF til SVG
PdfToSvgConverter gengiver hver side som en skalerbar vektorgrafik.
var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");PDF til tekst
PdfToTextConverter udtrækker ren tekst fra PDF‑sider.
var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");PDF/A overholdelse
PdfFormatConversionOptions validerer og konverterer dokumenter til PDF/A-standarder.
using var doc = Document.Open(pdfBytes);
var options = new PdfFormatConversionOptions(
"log.xml",
PdfFormat.PDF_A_1B,
ConvertErrorAction.Delete);
doc.Convert(options);
doc.Save("pdfa.pdf");Kontrol af overskriftsniveau
HeadingLevels konfigurerer, hvilke overskriftsniveauer der genkendes under HTML- eller Markdown-konvertering.
var levels = new HeadingLevels();
levels.AddLevels(1, 3); // Recognize H1 through H3Tips og bedste praksis
- Brug
PdfToHtmlConvertertil webpublicering ogPdfToMarkdownConvertertil dokumentationsarbejdsgange. - PDF/A-konvertering kan fjerne funktioner (JavaScript, kryptering), der overtræder standarden — brug
ConvertErrorAction.DeleteellerConvertErrorAction.None. - For store dokumenter, konverter side for side for at håndtere hukommelsen.
HtmlSaveOptionsstyrer, om billeder er indlejret inline eller gemt som eksterne filer.- SVG-output er ideel til højopløsningsvisning af individuelle sider.
Almindelige problemer
| Problem | Årsag | Løsning |
|---|---|---|
| HTML-output mangler billeder | Billeder er ikke indlejret; eksterne stier er forkerte | Konfigurer HtmlSaveOptions for indlejrede billeder |
| PDF/A-konvertering fjerner annotationer | Annotationer er ikke tilladt i mål-PDF/A-profilen | Brug PDF/A-2 eller PDF/A-3, som tillader annotationer |
| Tekstudtræk mister formatering | Ren-tekst output har ingen formatering som design | Brug HTML- eller Markdown-konvertering i stedet |
FAQ
Hvilke PDF/A-profiler understøttes?
PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A og PDF/A-3B profiler understøttes via PdfFormat enumerationsværdier.
Kan jeg konvertere en enkelt side til HTML?
Ja. Brug PdfToHtmlConverter.SavePageAsHtml.
Bevarer Markdown‑konvertering tabeller?
Konverteren forsøger at gengive tabelstrukturer som Markdown‑tabeller, men komplekse layout kan kræve efterbehandling.
API Referencens oversigt
| Class / Method | Description |
|---|---|
PdfToHtmlConverter | Konverter PDF til HTML |
PdfToHtmlConverter.SaveAsHtml | Eksporter hele dokumentet som HTML |
PdfToMarkdownConverter | Konverter PDF til Markdown |
PdfToSvgConverter | Konverter PDF-sider til SVG |
PdfToTextConverter | Udtræk ren tekst fra PDF |
HtmlSaveOptions | Indstillinger for HTML-eksport (billeder, skrifttyper, layout) |
HeadingLevels | Konfigurer genkendte overskriftsniveauer |
PdfFormatConversionOptions | PDF/A-validerings- og konverteringsindstillinger |