Konverzija i optimizacija
Konverzija i optimizacija
Aspose.PDF FOSS za .NET pruža pretvarače za transformiranje PDF-ova u HTML,
Markdown, SVG i običan tekst. Sustav za optimizaciju smanjuje veličinu datoteke
i osigurava usklađenost s PDF/A putem PdfFormatConversionOptions.
PDF u HTML
PdfToHtmlConverter izvozi PDF stranice kao HTML dokumente.
var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");
// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");HtmlSaveOptions pruža kontrolu nad upravljanjem slikama, ugrađivanjem fontova i strategijom rasporeda.
PDF u Markdown
PdfToMarkdownConverter izvozi PDF sadržaj kao Markdown tekst.
var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");
// Single page
converter.SavePageAsMarkdown(1, "page1.md");PDF u SVG
PdfToSvgConverter renderira svaku stranicu kao skalabilnu vektorsku grafiku.
var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");PDF u tekst
PdfToTextConverter izvlači običan tekst iz PDF stranica.
var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");Usklađenost s PDF/A
PdfFormatConversionOptions provjerava i pretvara dokumente u PDF/A standarde.
using var doc = Document.Open(pdfBytes);
var options = new PdfFormatConversionOptions(
"log.xml",
PdfFormat.PDF_A_1B,
ConvertErrorAction.Delete);
doc.Convert(options);
doc.Save("pdfa.pdf");Upravljanje razinom naslova
HeadingLevels konfigurira koje razine naslova se prepoznaju tijekom
HTML ili Markdown konverzije.
var levels = new HeadingLevels();
levels.AddLevels(1, 3); // Recognize H1 through H3Savjeti i najbolje prakse
- Koristite
PdfToHtmlConverterza web objavljivanje iPdfToMarkdownConverterza radne tokove dokumentacije. - PDF/A konverzija može ukloniti značajke (JavaScript, enkripcija) koje krše standard — koristite
ConvertErrorAction.DeleteiliConvertErrorAction.None. - Za velike dokumente, pretvarajte stranicu po stranicu kako biste upravljali memorijom.
HtmlSaveOptionskontrolira hoće li se slike ugraditi inline ili spremiti kao vanjske datoteke.- SVG izlaz je idealan za prikaz visoke rezolucije pojedinačnih stranica.
Uobičajeni problemi
| Problem | Uzrok | Rješenje |
|---|---|---|
| HTML izlaz nedostaju slike | Slike nisu ugrađene; vanjski putovi netočni | Konfigurirajte HtmlSaveOptions za ugrađene slike |
| PDF/A konverzija uklanja bilješke | Bilješke nisu dopuštene u odabranom PDF/A profilu | Koristite PDF/A-2 ili PDF/A-3 koji dopuštaju bilješke |
| Ekstrakcija teksta gubi formatiranje | Izlaz običnog teksta nema formatiranje po dizajnu | Umjesto toga koristite konverziju u HTML ili Markdown |
FAQ
Koji PDF/A profili su podržani?
PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A i PDF/A-3B profili su podržani putem vrijednosti nabrajanja PdfFormat.
Mogu li pretvoriti jednu stranicu u HTML?
Da. Koristite PdfToHtmlConverter.SavePageAsHtml.
Zadržava li pretvorba Markdowna tablice?
Pretvarač pokušava prikazati strukture tablica kao Markdown tablice, ali složeni rasporedi mogu zahtijevati naknadnu obradu.
API Sažetak referencije
| Class / Method | Description |
|---|---|
PdfToHtmlConverter | Pretvori PDF u HTML |
PdfToHtmlConverter.SaveAsHtml | Izvezi cijeli dokument kao HTML |
PdfToMarkdownConverter | Pretvori PDF u Markdown |
PdfToSvgConverter | Pretvori PDF stranice u SVG |
PdfToTextConverter | Izvuci običan tekst iz PDF-a |
HtmlSaveOptions | Opcije za izvoz HTML-a (slike, fontovi, raspored) |
HeadingLevels | Konfiguriraj prepoznate razine naslova |
PdfFormatConversionOptions | Opcije za validaciju i konverziju PDF/A |