Átalakítás és optimalizálás

Átalakítás és optimalizálás

Átalakítás és optimalizálás

Aspose.PDF FOSS for .NET konvertereket biztosít a PDF-ek HTML-re, Markdown-ra, SVG-re és egyszerű szövegre. Az optimalizációs alrendszer csökkenti a fájlméretet és biztosítja a PDF/A megfelelőséget a PdfFormatConversionOptions.


PDF HTML-re

PdfToHtmlConverter exportál PDF oldalakat HTML dokumentumokként.

var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");

// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");

HtmlSaveOptions szabályozást biztosít a képfeldolgozás, a betűtípus beágyazás és az elrendezési stratégia felett.


PDF Markdown formátumba

PdfToMarkdownConverter exportálja a PDF tartalmat Markdown szövegként.

var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");

// Single page
converter.SavePageAsMarkdown(1, "page1.md");

PDF → SVG

PdfToSvgConverter minden oldalt skálázható vektorgrafikaként jelenít meg.

var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");

PDF szöveggé

PdfToTextConverter kinyeri a sima szöveget a PDF oldalakból.

var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");

PDF/A megfelelőség

PdfFormatConversionOptions ellenőrzi és átalakítja a dokumentumokat PDF/A szabványoknak megfelelően.

using var doc = Document.Open(pdfBytes);

var options = new PdfFormatConversionOptions(
    "log.xml",
    PdfFormat.PDF_A_1B,
    ConvertErrorAction.Delete);

doc.Convert(options);
doc.Save("pdfa.pdf");

Fejléc-szintű vezérlés

HeadingLevels beállítja, hogy mely címsorszintek legyenek felismert a HTML vagy Markdown átalakítás során.

var levels = new HeadingLevels();
levels.AddLevels(1, 3);  // Recognize H1 through H3

Tippek és bevált gyakorlatok

  • Használja a PdfToHtmlConverter-t webes közzétételhez, és a PdfToMarkdownConverter-t dokumentációs munkafolyamatokhoz.
  • A PDF/A konverzió eltávolíthat olyan funkciókat (JavaScript, encryption), amelyek megsértik a szabványt — használja a ConvertErrorAction.Delete-t vagy a ConvertErrorAction.None-t.
  • Nagy dokumentumok esetén konvertáljon oldalanként a memória kezeléséhez.
  • A HtmlSaveOptions szabályozza, hogy a képek beágyazottak legyenek-e vagy külső fájlként legyenek mentve.
  • Az SVG kimenet ideális az egyes oldalak nagy felbontású megjelenítéséhez.

Gyakori problémák

ProblémaOkMegoldás
HTML kimenetben hiányoznak a képekA képek nincsenek beágyazva; a külső útvonalak helytelenekÁllítsa be a HtmlSaveOptions-t a beágyazott képekhez
PDF/A konverzió eltávolítja a megjegyzéseketA megjegyzések nem engedélyezettek a cél PDF/A profilbanHasználjon PDF/A-2 vagy PDF/A-3 profilt, amely engedélyezi a megjegyzéseket
A szöveg kinyerése elveszíti a formázástA egyszerű szöveg kimenet tervezés szerint nem tartalmaz formázástHasználjon helyette HTML vagy Markdown konverziót

GYIK

Mely PDF/A profilok támogatottak?

A PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A és PDF/A-3B profilok támogatottak a PdfFormat enumerációs értékeken keresztül.

Átalakíthatok egyetlen oldalt HTML-re?

Igen. Használja PdfToHtmlConverter.SavePageAsHtml.

Megőrzi a Markdown konverzió a táblázatokat?

A konverter megpróbálja a táblázatszerkezeteket Markdown táblázatokként megjeleníteni, de a komplex elrendezésekhez utófeldolgozásra lehet szükség.


API Referencia Összefoglaló

Class / MethodDescription
PdfToHtmlConverterPDF konvertálása HTML-re
PdfToHtmlConverter.SaveAsHtmlTeljes dokumentum exportálása HTML-ként
PdfToMarkdownConverterPDF konvertálása Markdownra
PdfToSvgConverterPDF oldalak konvertálása SVG-re
PdfToTextConverterEgyszerű szöveg kinyerése PDF-ből
HtmlSaveOptionsHTML exportálási beállítások (képek, betűtípusok, elrendezés)
HeadingLevelsFelismert címsor szintek konfigurálása
PdfFormatConversionOptionsPDF/A validálási és konvertálási beállítások

Lásd még

 Magyar