Dönüştürme ve Optimizasyon

Dönüştürme ve Optimizasyon

Dönüştürme ve Optimizasyon

Aspose.PDF FOSS for .NET, PDF’leri HTML, Markdown, SVG ve düz metne dönüştürmek için dönüştürücüler sağlar. Optimizasyon alt sistemi dosya boyutunu azaltır ve PDF/A uyumluluğunu PdfFormatConversionOptions aracılığıyla sağlar.


PDF’den HTML’ye

PdfToHtmlConverter PDF sayfalarını HTML belgeleri olarak dışa aktarır.

var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");

// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");

HtmlSaveOptions görüntü işleme, yazı tipi gömme ve yerleşim stratejisi üzerinde kontrol sağlar.


PDF’den Markdown’a

PdfToMarkdownConverter PDF içeriğini Markdown metni olarak dışa aktarır.

var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");

// Single page
converter.SavePageAsMarkdown(1, "page1.md");

PDF’den SVG’ye

PdfToSvgConverter her sayfayı ölçeklenebilir vektör grafik olarak render eder.

var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");

PDF’den metne

PdfToTextConverter PDF sayfalarından düz metin çıkarır.

var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");

PDF/A uyumluluğu

PdfFormatConversionOptions belgeleri PDF/A standartlarına doğrular ve dönüştürür.

using var doc = Document.Open(pdfBytes);

var options = new PdfFormatConversionOptions(
    "log.xml",
    PdfFormat.PDF_A_1B,
    ConvertErrorAction.Delete);

doc.Convert(options);
doc.Save("pdfa.pdf");

Başlık düzeyi kontrolü

HeadingLevels HTML veya Markdown dönüşümü sırasında hangi başlık seviyelerinin tanındığını yapılandırır.

var levels = new HeadingLevels();
levels.AddLevels(1, 3);  // Recognize H1 through H3

İpuçları ve En İyi Uygulamalar

  • Web yayıncılığı için PdfToHtmlConverter ve belge iş akışları için PdfToMarkdownConverter kullanın.
  • PDF/A dönüşümü, standarda aykırı olan (JavaScript, şifreleme) özellikleri kaldırabilir — ConvertErrorAction.Delete veya ConvertErrorAction.None kullanın.
  • Büyük belgeler için, belleği yönetmek amacıyla sayfa sayfa dönüştürün.
  • HtmlSaveOptions, görüntülerin satır içi gömülüp gömülmeyeceğini veya harici dosyalar olarak kaydedilip kaydedilmeyeceğini kontrol eder.
  • SVG çıktısı, tek tek sayfaların yüksek çözünürlüklü görüntülenmesi için idealdir.

Yaygın Sorunlar

SorunNedenÇözüm
HTML çıktısında resimler eksikResimler gömülmemiş; dış yollar hatalıGömülü resimler için HtmlSaveOptions yapılandırın
PDF/A dönüşümü ek açıklamaları kaldırıyorHedef PDF/A profilinde ek açıklamalara izin verilmezEk açıklamalara izin veren PDF/A-2 veya PDF/A-3 kullanın
Metin çıkarımı biçimlendirmeyi kaybediyorDüz metin çıktısı tasarım gereği biçimlendirme içermezBunun yerine HTML veya Markdown dönüşümünü kullanın

SSS

Hangi PDF/A profilleri destekleniyor?

PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A ve PDF/A-3B profilleri PdfFormat enum değerleri aracılığıyla desteklenir.

Tek bir sayfayı HTML’ye dönüştürebilir miyim?

Evet. PdfToHtmlConverter.SavePageAsHtml kullanın.

Markdown dönüşümü tabloları korur mu?

Dönüştürücü, tablo yapılarını Markdown tabloları olarak render etmeye çalışır, ancak karmaşık düzenler ek işleme gerektirebilir.


API Referans Özeti

Class / MethodDescription
PdfToHtmlConverterPDF’yi HTML’ye dönüştür
PdfToHtmlConverter.SaveAsHtmlTüm belgeyi HTML olarak dışa aktar
PdfToMarkdownConverterPDF’yi Markdown’a dönüştür
PdfToSvgConverterPDF sayfalarını SVG’ye dönüştür
PdfToTextConverterPDF’den düz metin çıkar
HtmlSaveOptionsHTML dışa aktarım seçenekleri (görseller, yazı tipleri, düzen)
HeadingLevelsTanınan başlık seviyelerini yapılandır
PdfFormatConversionOptionsPDF/A doğrulama ve dönüştürme seçenekleri

Ayrıca Bakınız

 Türkçe