การแปลงและการเพิ่มประสิทธิภาพ
การแปลงและการเพิ่มประสิทธิภาพ
Aspose.PDF FOSS for .NET มีตัวแปลงสำหรับการแปลง PDF ไปเป็น HTML,
Markdown, SVG, และข้อความธรรมดา. ระบบย่อยการเพิ่มประสิทธิภาพช่วยลดขนาดไฟล์
และรับประกันการปฏิบัติตาม PDF/A ผ่าน PdfFormatConversionOptions.
PDF เป็น HTML
PdfToHtmlConverter ส่งออกหน้า PDF เป็นเอกสาร HTML.
var converter = new PdfToHtmlConverter();
converter.SaveAsHtml("input.pdf", "output.html");
// Or save each page separately
converter.SaveAllPagesAsHtml("input.pdf", "output_dir");HtmlSaveOptions ให้การควบคุมการจัดการภาพ, การฝังฟอนต์, และกลยุทธ์การจัดวาง.
PDF เป็น Markdown
PdfToMarkdownConverter ส่งออกเนื้อหา PDF เป็นข้อความ Markdown
var converter = new PdfToMarkdownConverter("input.pdf");
converter.SaveAsMarkdown("output.md");
// Single page
converter.SavePageAsMarkdown(1, "page1.md");PDF เป็น SVG
PdfToSvgConverter แสดงแต่ละหน้าเป็นกราฟิกเวกเตอร์ที่ปรับขนาดได้.
var converter = new PdfToSvgConverter();
converter.SaveAllPagesAsSvg("input.pdf", "output_dir");PDF เป็นข้อความ
PdfToTextConverter สกัดข้อความธรรมดาจากหน้า PDF.
var converter = new PdfToTextConverter();
converter.SaveAsText("input.pdf", "output.txt");การปฏิบัติตาม PDF/A
PdfFormatConversionOptions ตรวจสอบและแปลงเอกสารเป็นมาตรฐาน PDF/A.
using var doc = Document.Open(pdfBytes);
var options = new PdfFormatConversionOptions(
"log.xml",
PdfFormat.PDF_A_1B,
ConvertErrorAction.Delete);
doc.Convert(options);
doc.Save("pdfa.pdf");การควบคุมระดับหัวเรื่อง
HeadingLevels กำหนดระดับหัวข้อที่ได้รับการรับรู้ระหว่างการแปลงเป็น HTML หรือ Markdown.
var levels = new HeadingLevels();
levels.AddLevels(1, 3); // Recognize H1 through H3เคล็ดลับและแนวทางปฏิบัติที่ดีที่สุด
- ใช้
PdfToHtmlConverterสำหรับการเผยแพร่บนเว็บและPdfToMarkdownConverterสำหรับกระบวนการทำเอกสาร. - การแปลง PDF/A อาจลบคุณลักษณะ (JavaScript, encryption) ที่ขัดต่อมาตรฐาน — ใช้
ConvertErrorAction.DeleteหรือConvertErrorAction.None. - สำหรับเอกสารขนาดใหญ่ ให้แปลงทีละหน้าเพื่อจัดการหน่วยความจำ.
HtmlSaveOptionsควบคุมว่าภาพจะฝังในบรรทัดหรือบันทึกเป็นไฟล์ภายนอก.- ผลลัพธ์ SVG เหมาะสำหรับการแสดงผลความละเอียดสูงของแต่ละหน้า.
ปัญหาทั่วไป
| ปัญหา | สาเหตุ | วิธีแก้ |
|---|---|---|
| ผลลัพธ์ HTML ขาดรูปภาพ | รูปภาพไม่ได้ฝัง; เส้นทางภายนอกไม่ถูกต้อง | กำหนดค่า HtmlSaveOptions เพื่อฝังรูปภาพ |
| การแปลง PDF/A ลบคำอธิบายประกอบ | คำอธิบายประกอบไม่อนุญาตในโปรไฟล์ PDF/A เป้าหมาย | ใช้ PDF/A-2 หรือ PDF/A-3 ที่อนุญาตคำอธิบายประกอบ |
| การสกัดข้อความสูญเสียการจัดรูปแบบ | ผลลัพธ์ข้อความธรรมดาไม่มีการจัดรูปแบบตามการออกแบบ | ใช้การแปลงเป็น HTML หรือ Markdown แทน |
คำถามที่พบบ่อย
โปรไฟล์ PDF/A ใดที่รองรับ?
PDF/A-1A, PDF/A-1B, PDF/A-2A, PDF/A-2B, PDF/A-3A, และ PDF/A-3B โปรไฟล์ได้รับการสนับสนุนผ่านค่า enumeration PdfFormat.
ฉันสามารถแปลงหน้าเดียวเป็น HTML ได้หรือไม่?
ใช่. ใช้ PdfToHtmlConverter.SavePageAsHtml.
การแปลง Markdown รักษาตารางไว้หรือไม่?
ตัวแปลงพยายามเรนเดอร์โครงสร้างตารางเป็นตาราง Markdown แต่รูปแบบที่ซับซ้อนอาจต้องการการประมวลผลต่อภายหลัง.
สรุปการอ้างอิง API
| Class / Method | Description |
|---|---|
PdfToHtmlConverter | แปลง PDF เป็น HTML |
PdfToHtmlConverter.SaveAsHtml | ส่งออกเอกสารทั้งหมดเป็น HTML |
PdfToMarkdownConverter | แปลง PDF เป็น Markdown |
PdfToSvgConverter | แปลงหน้าของ PDF เป็น SVG |
PdfToTextConverter | ดึงข้อความธรรมดาจาก PDF |
HtmlSaveOptions | ตัวเลือกสำหรับการส่งออก HTML (รูปภาพ, ฟอนต์, การจัดวาง) |
HeadingLevels | กำหนดระดับหัวข้อที่รับรู้ |
PdfFormatConversionOptions | ตัวเลือกการตรวจสอบความถูกต้องและการแปลง PDF/A |