Dönüştürme ve Optimizasyon
Dönüştürme ve Optimizasyon
Aspose.PDF FOSS for .NET, PDF’leri HTML, Markdown, SVG ve düz metne dönüştürmek için dönüştürücüler sağlar. Optimizasyon alt sistemi dosya boyutunu azaltır ve PDF/A uyumluluğunu PdfFormatConversionOptions aracılığıyla sağlar.
PDF’den HTML’ye
PdfToHtmlConverter PDF sayfalarını HTML belgeleri olarak dışa aktarır.
var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");
// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");HtmlSaveOptions görüntü işleme, yazı tipi gömme ve yerleşim stratejisi üzerinde kontrol sağlar.
PDF’den Markdown’a
PdfToMarkdownConverter PDF içeriğini Markdown metni olarak dışa aktarır.
var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");
// Single page
converter.SavePageAsMarkdown(1, "page1.md");PDF’den SVG’ye
PdfToSvgConverter her sayfayı ölçeklenebilir vektör grafik olarak render eder.
var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");PDF’den metne
PdfToTextConverter PDF sayfalarından düz metin çıkarır.
var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");PDF/A uyumluluğu
PdfFormatConversionOptions belgeleri PDF/A standartlarına doğrular ve dönüştürür.
using var doc = Document.Open(pdfBytes);
var options = new PdfFormatConversionOptions(
"log.xml",
PdfFormat.PDF_A_1B,
ConvertErrorAction.Delete);
doc.Convert(options);
doc.Save("pdfa.pdf");Başlık düzeyi kontrolü
HeadingLevels HTML veya Markdown dönüşümü sırasında hangi başlık seviyelerinin tanındığını yapılandırır.
var levels = new HeadingLevels();
levels.AddLevels(1, 3); // Recognize H1 through H3İpuçları ve En İyi Uygulamalar
- Web yayıncılığı için
PdfToHtmlConverterve belge iş akışları içinPdfToMarkdownConverterkullanın. - PDF/A dönüşümü, standarda aykırı olan (JavaScript, şifreleme) özellikleri kaldırabilir —
ConvertErrorAction.DeleteveyaConvertErrorAction.Nonekullanın. - Büyük belgeler için, belleği yönetmek amacıyla sayfa sayfa dönüştürün.
HtmlSaveOptions, görüntülerin satır içi gömülüp gömülmeyeceğini veya harici dosyalar olarak kaydedilip kaydedilmeyeceğini kontrol eder.- SVG çıktısı, tek tek sayfaların yüksek çözünürlüklü görüntülenmesi için idealdir.
Yaygın Sorunlar
| Sorun | Neden | Çözüm |
|---|---|---|
| HTML çıktısında resimler eksik | Resimler gömülmemiş; dış yollar hatalı | Gömülü resimler için HtmlSaveOptions yapılandırın |
| PDF/A dönüşümü ek açıklamaları kaldırıyor | Hedef PDF/A profilinde ek açıklamalara izin verilmez | Ek açıklamalara izin veren PDF/A-2 veya PDF/A-3 kullanın |
| Metin çıkarımı biçimlendirmeyi kaybediyor | Düz metin çıktısı tasarım gereği biçimlendirme içermez | Bunun yerine HTML veya Markdown dönüşümünü kullanın |
SSS
Hangi PDF/A profilleri destekleniyor?
PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A ve PDF/A-3B profilleri PdfFormat enum değerleri aracılığıyla desteklenir.
Tek bir sayfayı HTML’ye dönüştürebilir miyim?
Evet. PdfToHtmlConverter.SavePageAsHtml kullanın.
Markdown dönüşümü tabloları korur mu?
Dönüştürücü, tablo yapılarını Markdown tabloları olarak render etmeye çalışır, ancak karmaşık düzenler ek işleme gerektirebilir.
API Referans Özeti
| Class / Method | Description |
|---|---|
PdfToHtmlConverter | PDF’yi HTML’ye dönüştür |
PdfToHtmlConverter.SaveAsHtml | Tüm belgeyi HTML olarak dışa aktar |
PdfToMarkdownConverter | PDF’yi Markdown’a dönüştür |
PdfToSvgConverter | PDF sayfalarını SVG’ye dönüştür |
PdfToTextConverter | PDF’den düz metin çıkar |
HtmlSaveOptions | HTML dışa aktarım seçenekleri (görseller, yazı tipleri, düzen) |
HeadingLevels | Tanınan başlık seviyelerini yapılandır |
PdfFormatConversionOptions | PDF/A doğrulama ve dönüştürme seçenekleri |