Konvertēšana un optimizācija

Konvertēšana un optimizācija

Konvertēšana un optimizācija

Aspose.PDF FOSS for .NET nodrošina konvertētājus PDF pārveidošanai uz HTML, Markdown, SVG, un vienkāršu tekstu. Optimizācijas apakšsistēma samazina faila lielumu un nodrošina PDF/A atbilstību caur PdfFormatConversionOptions.


PDF uz HTML

PdfToHtmlConverter eksportē PDF lapas kā HTML dokumentus.

var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");

// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");

HtmlSaveOptions nodrošina kontroli pār attēlu apstrādi, fontu iegulšanu un izkārtojuma stratēģiju.


PDF uz Markdown

PdfToMarkdownConverter eksportē PDF saturu kā Markdown tekstu.

var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");

// Single page
converter.SavePageAsMarkdown(1, "page1.md");

PDF uz SVG

PdfToSvgConverter attēlo katru lapu kā mērogojamu vektorgrafiku.

var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");

PDF uz tekstu

PdfToTextConverter izgūst vienkāršu tekstu no PDF lapām.

var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");

PDF/A atbilstība

PdfFormatConversionOptions pārbauda un konvertē dokumentus uz PDF/A standartiem.

using var doc = Document.Open(pdfBytes);

var options = new PdfFormatConversionOptions(
    "log.xml",
    PdfFormat.PDF_A_1B,
    ConvertErrorAction.Delete);

doc.Convert(options);
doc.Save("pdfa.pdf");

Virsraksta līmeņa vadība

HeadingLevels konfigurē, kuri virsrakstu līmeņi tiek atpazīti HTML vai Markdown konvertēšanas laikā.

var levels = new HeadingLevels();
levels.AddLevels(1, 3);  // Recognize H1 through H3

Padomi un labākā prakse

  • Izmantojiet PdfToHtmlConverter tīmekļa publicēšanai un PdfToMarkdownConverter dokumentācijas darba plūsmām.
  • PDF/A konvertēšana var noņemt funkcijas (JavaScript, šifrēšanu), kas pārkāpj standartu — izmantojiet ConvertErrorAction.Delete vai ConvertErrorAction.None.
  • Lieliem dokumentiem konvertējiet lapu pa lapai, lai pārvaldītu atmiņu.
  • HtmlSaveOptions kontrolē, vai attēli tiek iekļauti iekļautā veidā vai saglabāti kā ārējie faili.
  • SVG izvade ir ideāla individuālu lapu augstas izšķirtspējas attēlošanai.

Biežāk sastopamās problēmas

ProblēmaIemeslsRisinājums
HTML izvade trūkst attēluAttēli nav iekļauti; ārējie ceļi nepareiziKonfigurējiet HtmlSaveOptions iekļautajiem attēliem
PDF/A konvertēšana noņem anotācijasAnotācijas nav atļautas mērķa PDF/A profilāIzmantojiet PDF/A-2 vai PDF/A-3, kas ļauj anotācijas
Teksta izvilkšana zaudē formatējumuVienkāršā teksta izvade nav formatēta pēc dizainaIzmantojiet HTML vai Markdown konvertēšanu

BUJ

Kuri PDF/A profili tiek atbalstīti?

PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A, un PDF/A-3B profili tiek atbalstīti, izmantojot PdfFormat uzskaitīšanas vērtības.

Vai es varu konvertēt vienu lapu uz HTML?

Jā. Izmantojiet PdfToHtmlConverter.SavePageAsHtml.

Vai Markdown pārveidošana saglabā tabulas?

Pārveidotājs mēģina attēlot tabulu struktūras kā Markdown tabulas, taču sarežģīti izkārtojumi var prasīt pēcapstrādi.


API atsauču kopsavilkums

Class / MethodDescription
PdfToHtmlConverterPārvērst PDF uz HTML
PdfToHtmlConverter.SaveAsHtmlEksportēt visu dokumentu kā HTML
PdfToMarkdownConverterPārvērst PDF uz Markdown
PdfToSvgConverterPārvērst PDF lapas uz SVG
PdfToTextConverterIzvilkt vienkāršu tekstu no PDF
HtmlSaveOptionsHTML eksportēšanas iespējas (attēli, fonti, izkārtojums)
HeadingLevelsKonfigurēt atpazītās virsrakstu līmeņus
PdfFormatConversionOptionsPDF/A validācijas un konvertēšanas iespējas

Skatīt arī

 Latviešu