Konverzija i optimizacija

Konverzija i optimizacija

Konverzija i optimizacija

Aspose.PDF FOSS for .NET pruža konvertore za pretvaranje PDF‑ova u HTML, Markdown, SVG i običan tekst. Optimizacioni podsistem smanjuje veličinu fajla i osigurava PDF/A usklađenost kroz PdfFormatConversionOptions.


PDF u HTML

PdfToHtmlConverter izvozi PDF stranice kao HTML dokumente.

var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");

// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");

HtmlSaveOptions pruža kontrolu nad upravljanjem slikama, ugrađivanjem fontova i strategijom rasporeda.


PDF u Markdown

PdfToMarkdownConverter izveze PDF sadržaj kao Markdown tekst.

var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");

// Single page
converter.SavePageAsMarkdown(1, "page1.md");

PDF u SVG

PdfToSvgConverter renderuje svaku stranicu kao skalabilnu vektorsku grafiku.

var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");

PDF u tekst

PdfToTextConverter извлачи чисти текст из PDF страница.

var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");

PDF/A usklađenost

PdfFormatConversionOptions validira i konvertuje dokumente u PDF/A standarde.

using var doc = Document.Open(pdfBytes);

var options = new PdfFormatConversionOptions(
    "log.xml",
    PdfFormat.PDF_A_1B,
    ConvertErrorAction.Delete);

doc.Convert(options);
doc.Save("pdfa.pdf");

Контрола нивоа наслова

HeadingLevels konfiguriše koje nivoe naslova prepoznaje tokom HTML ili Markdown konverzije.

var levels = new HeadingLevels();
levels.AddLevels(1, 3);  // Recognize H1 through H3

Saveti i najbolje prakse

  • Koristite PdfToHtmlConverter za web objavljivanje i PdfToMarkdownConverter za radne tokove dokumentacije.
  • PDF/A konverzija može ukloniti funkcije (JavaScript, enkripcija) koje krše standard — koristite ConvertErrorAction.Delete ili ConvertErrorAction.None.
  • Za velike dokumente, konvertujte stranicu po stranicu kako biste upravljali memorijom.
  • HtmlSaveOptions kontroliše da li su slike ugrađene inline ili sačuvane kao eksterni fajlovi.
  • SVG izlaz je idealan za prikaz pojedinačnih stranica u visokoj rezoluciji.

Uobičajeni problemi

ProblemUzrokRešenje
HTML izlaz bez slikaSlike nisu ugrađene; eksterni putanje netačneKonfigurišite HtmlSaveOptions za ugrađene slike
PDF/A konverzija uklanja anotacijeAnotacije nisu dozvoljene u ciljanom PDF/A profiluKoristite PDF/A-2 ili PDF/A-3 koji dozvoljavaju anotacije
Ekstrakcija teksta gubi formatiranjeIzlaz običnog teksta nema formatiranje po dizajnuKoristite HTML ili Markdown konverziju umesto toga

ČPP

Koji PDF/A profili su podržani?

PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A i PDF/A-3B profili su podržani kroz PdfFormat vrednosti enumeracije.

Могу ли да конвертујем једну страницу у HTML?

Da. Koristite PdfToHtmlConverter.SavePageAsHtml.

Da li konverzija Markdown-a čuva tabele?

Konverter pokušava da prikaže strukture tabela kao Markdown tabele, ali složeni rasporedi mogu zahtevati naknadnu obradu.


Sažetak API referencije

Class / MethodDescription
PdfToHtmlConverterPretvori PDF u HTML
PdfToHtmlConverter.SaveAsHtmlIzvezi ceo dokument kao HTML
PdfToMarkdownConverterPretvori PDF u Markdown
PdfToSvgConverterPretvori PDF stranice u SVG
PdfToTextConverterIzvuci običan tekst iz PDF-a
HtmlSaveOptionsOpcije za izvoz HTML-a (slike, fontovi, raspored)
HeadingLevelsKonfiguriši prepoznate nivoe naslova
PdfFormatConversionOptionsOpcije za validaciju i konverziju PDF/A

Vidi takođe

 Српски