Konverzija i optimizacija
Konverzija i optimizacija
Aspose.PDF FOSS for .NET pruža konvertore za pretvaranje PDF‑ova u HTML,
Markdown, SVG i običan tekst. Optimizacioni podsistem smanjuje veličinu fajla
i osigurava PDF/A usklađenost kroz PdfFormatConversionOptions.
PDF u HTML
PdfToHtmlConverter izvozi PDF stranice kao HTML dokumente.
var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");
// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");HtmlSaveOptions pruža kontrolu nad upravljanjem slikama, ugrađivanjem fontova i strategijom rasporeda.
PDF u Markdown
PdfToMarkdownConverter izveze PDF sadržaj kao Markdown tekst.
var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");
// Single page
converter.SavePageAsMarkdown(1, "page1.md");PDF u SVG
PdfToSvgConverter renderuje svaku stranicu kao skalabilnu vektorsku grafiku.
var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");PDF u tekst
PdfToTextConverter извлачи чисти текст из PDF страница.
var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");PDF/A usklađenost
PdfFormatConversionOptions validira i konvertuje dokumente u PDF/A standarde.
using var doc = Document.Open(pdfBytes);
var options = new PdfFormatConversionOptions(
"log.xml",
PdfFormat.PDF_A_1B,
ConvertErrorAction.Delete);
doc.Convert(options);
doc.Save("pdfa.pdf");Контрола нивоа наслова
HeadingLevels konfiguriše koje nivoe naslova prepoznaje tokom HTML ili Markdown konverzije.
var levels = new HeadingLevels();
levels.AddLevels(1, 3); // Recognize H1 through H3Saveti i najbolje prakse
- Koristite
PdfToHtmlConverterza web objavljivanje iPdfToMarkdownConverterza radne tokove dokumentacije. - PDF/A konverzija može ukloniti funkcije (JavaScript, enkripcija) koje krše standard — koristite
ConvertErrorAction.DeleteiliConvertErrorAction.None. - Za velike dokumente, konvertujte stranicu po stranicu kako biste upravljali memorijom.
HtmlSaveOptionskontroliše da li su slike ugrađene inline ili sačuvane kao eksterni fajlovi.- SVG izlaz je idealan za prikaz pojedinačnih stranica u visokoj rezoluciji.
Uobičajeni problemi
| Problem | Uzrok | Rešenje |
|---|---|---|
| HTML izlaz bez slika | Slike nisu ugrađene; eksterni putanje netačne | Konfigurišite HtmlSaveOptions za ugrađene slike |
| PDF/A konverzija uklanja anotacije | Anotacije nisu dozvoljene u ciljanom PDF/A profilu | Koristite PDF/A-2 ili PDF/A-3 koji dozvoljavaju anotacije |
| Ekstrakcija teksta gubi formatiranje | Izlaz običnog teksta nema formatiranje po dizajnu | Koristite HTML ili Markdown konverziju umesto toga |
ČPP
Koji PDF/A profili su podržani?
PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A i PDF/A-3B profili su podržani kroz PdfFormat vrednosti enumeracije.
Могу ли да конвертујем једну страницу у HTML?
Da. Koristite PdfToHtmlConverter.SavePageAsHtml.
Da li konverzija Markdown-a čuva tabele?
Konverter pokušava da prikaže strukture tabela kao Markdown tabele, ali složeni rasporedi mogu zahtevati naknadnu obradu.
Sažetak API referencije
| Class / Method | Description |
|---|---|
PdfToHtmlConverter | Pretvori PDF u HTML |
PdfToHtmlConverter.SaveAsHtml | Izvezi ceo dokument kao HTML |
PdfToMarkdownConverter | Pretvori PDF u Markdown |
PdfToSvgConverter | Pretvori PDF stranice u SVG |
PdfToTextConverter | Izvuci običan tekst iz PDF-a |
HtmlSaveOptions | Opcije za izvoz HTML-a (slike, fontovi, raspored) |
HeadingLevels | Konfiguriši prepoznate nivoe naslova |
PdfFormatConversionOptions | Opcije za validaciju i konverziju PDF/A |