Konverzija i optimizacija

Konverzija i optimizacija

Konverzija i optimizacija

Aspose.PDF FOSS za .NET pruža pretvarače za transformiranje PDF-ova u HTML, Markdown, SVG i običan tekst. Sustav za optimizaciju smanjuje veličinu datoteke i osigurava usklađenost s PDF/A putem PdfFormatConversionOptions.


PDF u HTML

PdfToHtmlConverter izvozi PDF stranice kao HTML dokumente.

var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");

// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");

HtmlSaveOptions pruža kontrolu nad upravljanjem slikama, ugrađivanjem fontova i strategijom rasporeda.


PDF u Markdown

PdfToMarkdownConverter izvozi PDF sadržaj kao Markdown tekst.

var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");

// Single page
converter.SavePageAsMarkdown(1, "page1.md");

PDF u SVG

PdfToSvgConverter renderira svaku stranicu kao skalabilnu vektorsku grafiku.

var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");

PDF u tekst

PdfToTextConverter izvlači običan tekst iz PDF stranica.

var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");

Usklađenost s PDF/A

PdfFormatConversionOptions provjerava i pretvara dokumente u PDF/A standarde.

using var doc = Document.Open(pdfBytes);

var options = new PdfFormatConversionOptions(
    "log.xml",
    PdfFormat.PDF_A_1B,
    ConvertErrorAction.Delete);

doc.Convert(options);
doc.Save("pdfa.pdf");

Upravljanje razinom naslova

HeadingLevels konfigurira koje razine naslova se prepoznaju tijekom HTML ili Markdown konverzije.

var levels = new HeadingLevels();
levels.AddLevels(1, 3);  // Recognize H1 through H3

Savjeti i najbolje prakse

  • Koristite PdfToHtmlConverter za web objavljivanje i PdfToMarkdownConverter za radne tokove dokumentacije.
  • PDF/A konverzija može ukloniti značajke (JavaScript, enkripcija) koje krše standard — koristite ConvertErrorAction.Delete ili ConvertErrorAction.None.
  • Za velike dokumente, pretvarajte stranicu po stranicu kako biste upravljali memorijom.
  • HtmlSaveOptions kontrolira hoće li se slike ugraditi inline ili spremiti kao vanjske datoteke.
  • SVG izlaz je idealan za prikaz visoke rezolucije pojedinačnih stranica.

Uobičajeni problemi

ProblemUzrokRješenje
HTML izlaz nedostaju slikeSlike nisu ugrađene; vanjski putovi netočniKonfigurirajte HtmlSaveOptions za ugrađene slike
PDF/A konverzija uklanja bilješkeBilješke nisu dopuštene u odabranom PDF/A profiluKoristite PDF/A-2 ili PDF/A-3 koji dopuštaju bilješke
Ekstrakcija teksta gubi formatiranjeIzlaz običnog teksta nema formatiranje po dizajnuUmjesto toga koristite konverziju u HTML ili Markdown

FAQ

Koji PDF/A profili su podržani?

PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A i PDF/A-3B profili su podržani putem vrijednosti nabrajanja PdfFormat.

Mogu li pretvoriti jednu stranicu u HTML?

Da. Koristite PdfToHtmlConverter.SavePageAsHtml.

Zadržava li pretvorba Markdowna tablice?

Pretvarač pokušava prikazati strukture tablica kao Markdown tablice, ali složeni rasporedi mogu zahtijevati naknadnu obradu.


API Sažetak referencije

Class / MethodDescription
PdfToHtmlConverterPretvori PDF u HTML
PdfToHtmlConverter.SaveAsHtmlIzvezi cijeli dokument kao HTML
PdfToMarkdownConverterPretvori PDF u Markdown
PdfToSvgConverterPretvori PDF stranice u SVG
PdfToTextConverterIzvuci običan tekst iz PDF-a
HtmlSaveOptionsOpcije za izvoz HTML-a (slike, fontovi, raspored)
HeadingLevelsKonfiguriraj prepoznate razine naslova
PdfFormatConversionOptionsOpcije za validaciju i konverziju PDF/A

Vidi također

 Hrvatski