Átalakítás és optimalizálás
Átalakítás és optimalizálás
Aspose.PDF FOSS for .NET konvertereket biztosít a PDF-ek HTML-re,
Markdown-ra, SVG-re és egyszerű szövegre. Az optimalizációs alrendszer csökkenti a fájlméretet
és biztosítja a PDF/A megfelelőséget a PdfFormatConversionOptions.
PDF HTML-re
PdfToHtmlConverter exportál PDF oldalakat HTML dokumentumokként.
var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");
// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");HtmlSaveOptions szabályozást biztosít a képfeldolgozás, a betűtípus beágyazás és az elrendezési stratégia felett.
PDF Markdown formátumba
PdfToMarkdownConverter exportálja a PDF tartalmat Markdown szövegként.
var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");
// Single page
converter.SavePageAsMarkdown(1, "page1.md");PDF → SVG
PdfToSvgConverter minden oldalt skálázható vektorgrafikaként jelenít meg.
var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");PDF szöveggé
PdfToTextConverter kinyeri a sima szöveget a PDF oldalakból.
var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");PDF/A megfelelőség
PdfFormatConversionOptions ellenőrzi és átalakítja a dokumentumokat PDF/A szabványoknak megfelelően.
using var doc = Document.Open(pdfBytes);
var options = new PdfFormatConversionOptions(
"log.xml",
PdfFormat.PDF_A_1B,
ConvertErrorAction.Delete);
doc.Convert(options);
doc.Save("pdfa.pdf");Fejléc-szintű vezérlés
HeadingLevels beállítja, hogy mely címsorszintek legyenek felismert a HTML vagy Markdown átalakítás során.
var levels = new HeadingLevels();
levels.AddLevels(1, 3); // Recognize H1 through H3Tippek és bevált gyakorlatok
- Használja a
PdfToHtmlConverter-t webes közzétételhez, és aPdfToMarkdownConverter-t dokumentációs munkafolyamatokhoz. - A PDF/A konverzió eltávolíthat olyan funkciókat (JavaScript, encryption), amelyek megsértik a szabványt — használja a
ConvertErrorAction.Delete-t vagy aConvertErrorAction.None-t. - Nagy dokumentumok esetén konvertáljon oldalanként a memória kezeléséhez.
- A
HtmlSaveOptionsszabályozza, hogy a képek beágyazottak legyenek-e vagy külső fájlként legyenek mentve. - Az SVG kimenet ideális az egyes oldalak nagy felbontású megjelenítéséhez.
Gyakori problémák
| Probléma | Ok | Megoldás |
|---|---|---|
| HTML kimenetben hiányoznak a képek | A képek nincsenek beágyazva; a külső útvonalak helytelenek | Állítsa be a HtmlSaveOptions-t a beágyazott képekhez |
| PDF/A konverzió eltávolítja a megjegyzéseket | A megjegyzések nem engedélyezettek a cél PDF/A profilban | Használjon PDF/A-2 vagy PDF/A-3 profilt, amely engedélyezi a megjegyzéseket |
| A szöveg kinyerése elveszíti a formázást | A egyszerű szöveg kimenet tervezés szerint nem tartalmaz formázást | Használjon helyette HTML vagy Markdown konverziót |
GYIK
Mely PDF/A profilok támogatottak?
A PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A és PDF/A-3B profilok támogatottak a PdfFormat enumerációs értékeken keresztül.
Átalakíthatok egyetlen oldalt HTML-re?
Igen. Használja PdfToHtmlConverter.SavePageAsHtml.
Megőrzi a Markdown konverzió a táblázatokat?
A konverter megpróbálja a táblázatszerkezeteket Markdown táblázatokként megjeleníteni, de a komplex elrendezésekhez utófeldolgozásra lehet szükség.
API Referencia Összefoglaló
| Class / Method | Description |
|---|---|
PdfToHtmlConverter | PDF konvertálása HTML-re |
PdfToHtmlConverter.SaveAsHtml | Teljes dokumentum exportálása HTML-ként |
PdfToMarkdownConverter | PDF konvertálása Markdownra |
PdfToSvgConverter | PDF oldalak konvertálása SVG-re |
PdfToTextConverter | Egyszerű szöveg kinyerése PDF-ből |
HtmlSaveOptions | HTML exportálási beállítások (képek, betűtípusok, elrendezés) |
HeadingLevels | Felismert címsor szintek konfigurálása |
PdfFormatConversionOptions | PDF/A validálási és konvertálási beállítások |