Konvertēšana un optimizācija
Konvertēšana un optimizācija
Aspose.PDF FOSS for .NET nodrošina konvertētājus PDF pārveidošanai uz HTML,
Markdown, SVG, un vienkāršu tekstu. Optimizācijas apakšsistēma samazina faila lielumu
un nodrošina PDF/A atbilstību caur PdfFormatConversionOptions.
PDF uz HTML
PdfToHtmlConverter eksportē PDF lapas kā HTML dokumentus.
var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");
// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");HtmlSaveOptions nodrošina kontroli pār attēlu apstrādi, fontu iegulšanu un izkārtojuma stratēģiju.
PDF uz Markdown
PdfToMarkdownConverter eksportē PDF saturu kā Markdown tekstu.
var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");
// Single page
converter.SavePageAsMarkdown(1, "page1.md");PDF uz SVG
PdfToSvgConverter attēlo katru lapu kā mērogojamu vektorgrafiku.
var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");PDF uz tekstu
PdfToTextConverter izgūst vienkāršu tekstu no PDF lapām.
var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");PDF/A atbilstība
PdfFormatConversionOptions pārbauda un konvertē dokumentus uz PDF/A standartiem.
using var doc = Document.Open(pdfBytes);
var options = new PdfFormatConversionOptions(
"log.xml",
PdfFormat.PDF_A_1B,
ConvertErrorAction.Delete);
doc.Convert(options);
doc.Save("pdfa.pdf");Virsraksta līmeņa vadība
HeadingLevels konfigurē, kuri virsrakstu līmeņi tiek atpazīti
HTML vai Markdown konvertēšanas laikā.
var levels = new HeadingLevels();
levels.AddLevels(1, 3); // Recognize H1 through H3Padomi un labākā prakse
- Izmantojiet
PdfToHtmlConvertertīmekļa publicēšanai unPdfToMarkdownConverterdokumentācijas darba plūsmām. - PDF/A konvertēšana var noņemt funkcijas (JavaScript, šifrēšanu), kas pārkāpj standartu — izmantojiet
ConvertErrorAction.DeletevaiConvertErrorAction.None. - Lieliem dokumentiem konvertējiet lapu pa lapai, lai pārvaldītu atmiņu.
HtmlSaveOptionskontrolē, vai attēli tiek iekļauti iekļautā veidā vai saglabāti kā ārējie faili.- SVG izvade ir ideāla individuālu lapu augstas izšķirtspējas attēlošanai.
Biežāk sastopamās problēmas
| Problēma | Iemesls | Risinājums |
|---|---|---|
| HTML izvade trūkst attēlu | Attēli nav iekļauti; ārējie ceļi nepareizi | Konfigurējiet HtmlSaveOptions iekļautajiem attēliem |
| PDF/A konvertēšana noņem anotācijas | Anotācijas nav atļautas mērķa PDF/A profilā | Izmantojiet PDF/A-2 vai PDF/A-3, kas ļauj anotācijas |
| Teksta izvilkšana zaudē formatējumu | Vienkāršā teksta izvade nav formatēta pēc dizaina | Izmantojiet HTML vai Markdown konvertēšanu |
BUJ
Kuri PDF/A profili tiek atbalstīti?
PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A, un PDF/A-3B profili tiek atbalstīti, izmantojot PdfFormat uzskaitīšanas vērtības.
Vai es varu konvertēt vienu lapu uz HTML?
Jā. Izmantojiet PdfToHtmlConverter.SavePageAsHtml.
Vai Markdown pārveidošana saglabā tabulas?
Pārveidotājs mēģina attēlot tabulu struktūras kā Markdown tabulas, taču sarežģīti izkārtojumi var prasīt pēcapstrādi.
API atsauču kopsavilkums
| Class / Method | Description |
|---|---|
PdfToHtmlConverter | Pārvērst PDF uz HTML |
PdfToHtmlConverter.SaveAsHtml | Eksportēt visu dokumentu kā HTML |
PdfToMarkdownConverter | Pārvērst PDF uz Markdown |
PdfToSvgConverter | Pārvērst PDF lapas uz SVG |
PdfToTextConverter | Izvilkt vienkāršu tekstu no PDF |
HtmlSaveOptions | HTML eksportēšanas iespējas (attēli, fonti, izkārtojums) |
HeadingLevels | Konfigurēt atpazītās virsrakstu līmeņus |
PdfFormatConversionOptions | PDF/A validācijas un konvertēšanas iespējas |