การแปลงและการเพิ่มประสิทธิภาพ

การแปลงและการเพิ่มประสิทธิภาพ

การแปลงและการเพิ่มประสิทธิภาพ

Aspose.PDF FOSS for .NET มีตัวแปลงสำหรับการแปลง PDF ไปเป็น HTML, Markdown, SVG, และข้อความธรรมดา. ระบบย่อยการเพิ่มประสิทธิภาพช่วยลดขนาดไฟล์ และรับประกันการปฏิบัติตาม PDF/A ผ่าน PdfFormatConversionOptions.


PDF เป็น HTML

PdfToHtmlConverter ส่งออกหน้า PDF เป็นเอกสาร HTML.

var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");

// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");

HtmlSaveOptions ให้การควบคุมการจัดการภาพ, การฝังฟอนต์, และกลยุทธ์การจัดวาง.


PDF เป็น Markdown

PdfToMarkdownConverter ส่งออกเนื้อหา PDF เป็นข้อความ Markdown

var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");

// Single page
converter.SavePageAsMarkdown(1, "page1.md");

PDF เป็น SVG

PdfToSvgConverter แสดงแต่ละหน้าเป็นกราฟิกเวกเตอร์ที่ปรับขนาดได้.

var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");

PDF เป็นข้อความ

PdfToTextConverter สกัดข้อความธรรมดาจากหน้า PDF.

var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");

การปฏิบัติตาม PDF/A

PdfFormatConversionOptions ตรวจสอบและแปลงเอกสารเป็นมาตรฐาน PDF/A.

using var doc = Document.Open(pdfBytes);

var options = new PdfFormatConversionOptions(
    "log.xml",
    PdfFormat.PDF_A_1B,
    ConvertErrorAction.Delete);

doc.Convert(options);
doc.Save("pdfa.pdf");

การควบคุมระดับหัวเรื่อง

HeadingLevels กำหนดระดับหัวข้อที่ได้รับการรับรู้ระหว่างการแปลงเป็น HTML หรือ Markdown.

var levels = new HeadingLevels();
levels.AddLevels(1, 3);  // Recognize H1 through H3

เคล็ดลับและแนวทางปฏิบัติที่ดีที่สุด

  • ใช้ PdfToHtmlConverter สำหรับการเผยแพร่บนเว็บและ PdfToMarkdownConverter สำหรับกระบวนการทำเอกสาร.
  • การแปลง PDF/A อาจลบคุณลักษณะ (JavaScript, encryption) ที่ขัดต่อมาตรฐาน — ใช้ ConvertErrorAction.Delete หรือ ConvertErrorAction.None.
  • สำหรับเอกสารขนาดใหญ่ ให้แปลงทีละหน้าเพื่อจัดการหน่วยความจำ.
  • HtmlSaveOptions ควบคุมว่าภาพจะฝังในบรรทัดหรือบันทึกเป็นไฟล์ภายนอก.
  • ผลลัพธ์ SVG เหมาะสำหรับการแสดงผลความละเอียดสูงของแต่ละหน้า.

ปัญหาทั่วไป

ปัญหาสาเหตุวิธีแก้
ผลลัพธ์ HTML ขาดรูปภาพรูปภาพไม่ได้ฝัง; เส้นทางภายนอกไม่ถูกต้องกำหนดค่า HtmlSaveOptions เพื่อฝังรูปภาพ
การแปลง PDF/A ลบคำอธิบายประกอบคำอธิบายประกอบไม่อนุญาตในโปรไฟล์ PDF/A เป้าหมายใช้ PDF/A-2 หรือ PDF/A-3 ที่อนุญาตคำอธิบายประกอบ
การสกัดข้อความสูญเสียการจัดรูปแบบผลลัพธ์ข้อความธรรมดาไม่มีการจัดรูปแบบตามการออกแบบใช้การแปลงเป็น HTML หรือ Markdown แทน

คำถามที่พบบ่อย

โปรไฟล์ PDF/A ใดที่รองรับ?

PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A, และ PDF/A-3B โปรไฟล์ได้รับการสนับสนุนผ่านค่า enumeration PdfFormat.

ฉันสามารถแปลงหน้าเดียวเป็น HTML ได้หรือไม่?

ใช่. ใช้ PdfToHtmlConverter.SavePageAsHtml.

การแปลง Markdown รักษาตารางไว้หรือไม่?

ตัวแปลงพยายามเรนเดอร์โครงสร้างตารางเป็นตาราง Markdown แต่รูปแบบที่ซับซ้อนอาจต้องการการประมวลผลต่อภายหลัง.


สรุปการอ้างอิง API

Class / MethodDescription
PdfToHtmlConverterแปลง PDF เป็น HTML
PdfToHtmlConverter.SaveAsHtmlส่งออกเอกสารทั้งหมดเป็น HTML
PdfToMarkdownConverterแปลง PDF เป็น Markdown
PdfToSvgConverterแปลงหน้าของ PDF เป็น SVG
PdfToTextConverterดึงข้อความธรรมดาจาก PDF
HtmlSaveOptionsตัวเลือกสำหรับการส่งออก HTML (รูปภาพ, ฟอนต์, การจัดวาง)
HeadingLevelsกำหนดระดับหัวข้อที่รับรู้
PdfFormatConversionOptionsตัวเลือกการตรวจสอบความถูกต้องและการแปลง PDF/A

ดูเพิ่มเติม

 ภาษาไทย