Konversi dan Optimisasi
Konversi dan Optimisasi
Aspose.PDF FOSS for .NET menyediakan konverter untuk mengubah PDF menjadi HTML,
Markdown, SVG, dan teks biasa. Subsystem optimisasi mengurangi ukuran file
dan memastikan kepatuhan PDF/A melalui PdfFormatConversionOptions.
PDF ke HTML
PdfToHtmlConverter mengekspor halaman PDF sebagai dokumen HTML.
var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");
// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");HtmlSaveOptions menyediakan kontrol atas penanganan gambar, penyematan font, dan strategi tata letak.
PDF ke Markdown
PdfToMarkdownConverter mengekspor konten PDF sebagai teks Markdown.
var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");
// Single page
converter.SavePageAsMarkdown(1, "page1.md");PDF ke SVG
PdfToSvgConverter merender setiap halaman sebagai grafik vektor yang dapat diskalakan.
var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");PDF ke teks
PdfToTextConverter mengekstrak teks biasa dari halaman PDF.
var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");Kepatuhan PDF/A
PdfFormatConversionOptions memvalidasi dan mengonversi dokumen ke standar PDF/A.
using var doc = Document.Open(pdfBytes);
var options = new PdfFormatConversionOptions(
"log.xml",
PdfFormat.PDF_A_1B,
ConvertErrorAction.Delete);
doc.Convert(options);
doc.Save("pdfa.pdf");Kontrol tingkat heading
HeadingLevels mengonfigurasi level heading mana yang dikenali selama konversi HTML atau Markdown.
var levels = new HeadingLevels();
levels.AddLevels(1, 3); // Recognize H1 through H3Tips dan Praktik Terbaik
- Gunakan
PdfToHtmlConverteruntuk penerbitan web danPdfToMarkdownConverteruntuk alur kerja dokumentasi. - Konversi PDF/A dapat menghapus fitur (JavaScript, enkripsi) yang melanggar standar — gunakan
ConvertErrorAction.DeleteatauConvertErrorAction.None. - Untuk dokumen besar, konversi per halaman untuk mengelola memori.
HtmlSaveOptionsmengontrol apakah gambar disematkan secara inline atau disimpan sebagai file eksternal.- Output SVG ideal untuk tampilan resolusi tinggi dari halaman individual.
Masalah Umum
| Masalah | Penyebab | Solusi |
|---|---|---|
| Output HTML kehilangan gambar | Gambar tidak disematkan; jalur eksternal tidak benar | Konfigurasikan HtmlSaveOptions untuk gambar yang disematkan |
| Konversi PDF/A menghapus anotasi | Anotasi tidak diizinkan dalam profil PDF/A target | Gunakan PDF/A-2 atau PDF/A-3 yang mengizinkan anotasi |
| Ekstraksi teks kehilangan format | Output teks biasa tidak memiliki format secara desain | Gunakan konversi HTML atau Markdown sebagai gantinya |
FAQ
Profil PDF/A mana yang didukung?
profil PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A, dan PDF/A-3B didukung melalui nilai enumerasi PdfFormat.
Apakah saya dapat mengonversi satu halaman ke HTML?
Ya. Gunakan PdfToHtmlConverter.SavePageAsHtml.
Apakah konversi Markdown mempertahankan tabel?
Konverter berusaha merender struktur tabel sebagai tabel Markdown, tetapi tata letak yang kompleks mungkin memerlukan pemrosesan lanjutan.
Ringkasan Referensi API
| Class / Method | Description |
|---|---|
PdfToHtmlConverter | Konversi PDF ke HTML |
PdfToHtmlConverter.SaveAsHtml | Ekspor seluruh dokumen sebagai HTML |
PdfToMarkdownConverter | Konversi PDF ke Markdown |
PdfToSvgConverter | Konversi halaman PDF ke SVG |
PdfToTextConverter | Ekstrak teks biasa dari PDF |
HtmlSaveOptions | Opsi untuk ekspor HTML (gambar, font, tata letak) |
HeadingLevels | Konfigurasikan tingkat heading yang dikenali |
PdfFormatConversionOptions | Opsi validasi dan konversi PDF/A |