Konversi dan Optimisasi

Konversi dan Optimisasi

Konversi dan Optimisasi

Aspose.PDF FOSS for .NET menyediakan konverter untuk mengubah PDF menjadi HTML, Markdown, SVG, dan teks biasa. Subsystem optimisasi mengurangi ukuran file dan memastikan kepatuhan PDF/A melalui PdfFormatConversionOptions.


PDF ke HTML

PdfToHtmlConverter mengekspor halaman PDF sebagai dokumen HTML.

var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");

// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");

HtmlSaveOptions menyediakan kontrol atas penanganan gambar, penyematan font, dan strategi tata letak.


PDF ke Markdown

PdfToMarkdownConverter mengekspor konten PDF sebagai teks Markdown.

var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");

// Single page
converter.SavePageAsMarkdown(1, "page1.md");

PDF ke SVG

PdfToSvgConverter merender setiap halaman sebagai grafik vektor yang dapat diskalakan.

var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");

PDF ke teks

PdfToTextConverter mengekstrak teks biasa dari halaman PDF.

var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");

Kepatuhan PDF/A

PdfFormatConversionOptions memvalidasi dan mengonversi dokumen ke standar PDF/A.

using var doc = Document.Open(pdfBytes);

var options = new PdfFormatConversionOptions(
    "log.xml",
    PdfFormat.PDF_A_1B,
    ConvertErrorAction.Delete);

doc.Convert(options);
doc.Save("pdfa.pdf");

Kontrol tingkat heading

HeadingLevels mengonfigurasi level heading mana yang dikenali selama konversi HTML atau Markdown.

var levels = new HeadingLevels();
levels.AddLevels(1, 3);  // Recognize H1 through H3

Tips dan Praktik Terbaik

  • Gunakan PdfToHtmlConverter untuk penerbitan web dan PdfToMarkdownConverter untuk alur kerja dokumentasi.
  • Konversi PDF/A dapat menghapus fitur (JavaScript, enkripsi) yang melanggar standar — gunakan ConvertErrorAction.Delete atau ConvertErrorAction.None.
  • Untuk dokumen besar, konversi per halaman untuk mengelola memori.
  • HtmlSaveOptions mengontrol apakah gambar disematkan secara inline atau disimpan sebagai file eksternal.
  • Output SVG ideal untuk tampilan resolusi tinggi dari halaman individual.

Masalah Umum

MasalahPenyebabSolusi
Output HTML kehilangan gambarGambar tidak disematkan; jalur eksternal tidak benarKonfigurasikan HtmlSaveOptions untuk gambar yang disematkan
Konversi PDF/A menghapus anotasiAnotasi tidak diizinkan dalam profil PDF/A targetGunakan PDF/A-2 atau PDF/A-3 yang mengizinkan anotasi
Ekstraksi teks kehilangan formatOutput teks biasa tidak memiliki format secara desainGunakan konversi HTML atau Markdown sebagai gantinya

FAQ

Profil PDF/A mana yang didukung?

profil PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A, dan PDF/A-3B didukung melalui nilai enumerasi PdfFormat.

Apakah saya dapat mengonversi satu halaman ke HTML?

Ya. Gunakan PdfToHtmlConverter.SavePageAsHtml.

Apakah konversi Markdown mempertahankan tabel?

Konverter berusaha merender struktur tabel sebagai tabel Markdown, tetapi tata letak yang kompleks mungkin memerlukan pemrosesan lanjutan.


Ringkasan Referensi API

Class / MethodDescription
PdfToHtmlConverterKonversi PDF ke HTML
PdfToHtmlConverter.SaveAsHtmlEkspor seluruh dokumen sebagai HTML
PdfToMarkdownConverterKonversi PDF ke Markdown
PdfToSvgConverterKonversi halaman PDF ke SVG
PdfToTextConverterEkstrak teks biasa dari PDF
HtmlSaveOptionsOpsi untuk ekspor HTML (gambar, font, tata letak)
HeadingLevelsKonfigurasikan tingkat heading yang dikenali
PdfFormatConversionOptionsOpsi validasi dan konversi PDF/A

Lihat Juga

 Bahasa Indonesia