การจัดการหลัก
การจัดการหลัก
API การจัดการเอกสารหลักถูกสร้างขึ้นรอบคลาส Document ซึ่งโหลดเอกสาร Word และให้ save() สำหรับการแปลงรูปแบบและ get_text() สำหรับการสกัดข้อความ ใช้ค่าคงที่ SaveFormat หรืออ็อบเจ็กต์ตัวเลือกการบันทึก (PdfSaveOptions, MarkdownSaveOptions) เพื่อควบคุมผลลัพธ์.
การแปลงเอกสารเดี่ยว
โหลดเอกสารด้วยคลาส Document และเรียกใช้ save() พร้อมรูปแบบเป้าหมาย ส่งผ่านค่าคงที่ SaveFormat หรืออ็อบเจกต์ save-options สำหรับรูปแบบผลลัพธ์.
import aspose.words_foss as aw
doc = aw.Document("input.docx") # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)การแปลงแบบแบตช์เป็นรูปแบบทั้งหมด
แปลงไฟล์อินพุตเดียวเป็นหลายรูปแบบเอาต์พุตโดยการเรียก save() หลายครั้งพร้อมค่าคงที่ SaveFormat ที่แตกต่างกัน (SaveFormat.MARKDOWN, SaveFormat.PDF, SaveFormat.TEXT).
การส่งออก PDF พร้อมตัวเลือกการบันทึก
ใช้ PdfSaveOptions เพื่อควบคุมการส่งออก PDF อย่างละเอียด, หรือ SaveFormat.PDF สำหรับการตั้งค่าเริ่มต้น.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)การส่งออก Markdown
ส่งออกเอกสารเป็น Markdown โดยใช้ SaveFormat.MARKDOWN หรือ MarkdownSaveOptions สำหรับการควบคุมผลลัพธ์เพิ่มเติม.
import aspose.words_foss as aw
doc = aw.Document("input.docx") # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)การสกัดข้อความ
ดึงเนื้อหาเป็นข้อความธรรมดาผ่าน Document.get_text() หรือส่งออกเป็นข้อความธรรมดาผ่าน SaveFormat.TEXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()เอกสารที่มีรูปภาพ
เอกสารที่มีภาพฝังอยู่สามารถแปลงเป็นรูปแบบผลลัพธ์ที่รองรับทั้งหมดได้ กระบวนการแปลงจะรักษาเนื้อหาภาพไว้ตลอดกระบวนการส่งออก.
เคล็ดลับและแนวทางปฏิบัติที่ดีที่สุด
- ใช้ค่าสถิต
SaveFormatสำหรับการแปลงอย่างรวดเร็ว; ใช้วัตถุ save-options เมื่อคุณต้องการควบคุมการจัดรูปแบบ MarkdownSaveOptions.export_underline_formatting = Trueรักษาการจัดรูปแบบขีดเส้นใต้ในผลลัพธ์ Markdown- โหลดเอกสารเพียงครั้งเดียวและบันทึกเป็นหลายรูปแบบเพื่อหลีกเลี่ยงการอ่านไฟล์ซ้ำ
ปัญหาทั่วไป
| Issue | Cause | Fix |
|---|---|---|
ModuleNotFoundError | แพคเกจไม่ได้ติดตั้ง | เรียกใช้ pip install aspose-words-foss>=26.4.0 |
ข้อความว่างจาก get_text() | ไฟล์อินพุตว่างหรือเสียหาย | ตรวจสอบว่าไฟล์อินพุตเปิดได้อย่างถูกต้องในโปรแกรมประมวลผลคำ |
| ผลลัพธ์ PDF ขาดรูปภาพ | รูปแบบภาพไม่รองรับโดยตัวแปลง | ใช้ไฟล์ DOCX ที่มีรูปภาพฝังมาตรฐาน |
FAQ
ฉันจะแปลง DOCX เป็น PDF อย่างไร?
โหลดเอกสารด้วย aw.Document("input.docx") และเรียก doc.save("output.pdf", aw.SaveFormat.PDF).
ฉันสามารถแปลงหลายรูปแบบในการเรียกเดียวได้หรือไม่?
ใช่. เรียก doc.save() หลายครั้งพร้อมค่าคงที่ SaveFormat ที่แตกต่างกันเพื่อสร้าง Markdown, PDF และ plain text จากเอกสารที่โหลดเพียงไฟล์เดียว.
ฉันจะทำอย่างไรให้การจัดรูปแบบขีดเส้นใต้ใน Markdown คงอยู่?
สร้างอ็อบเจ็กต์ MarkdownSaveOptions, ตั้งค่า export_underline_formatting = True, และส่งผ่านไปยัง doc.save().
รูปแบบอินพุตที่รองรับคืออะไร?
ไลบรารีโหลดไฟล์ DOCX, DOC, RTF, TXT และ Markdown.
สรุปการอ้างอิง API
| Class / Method | Description |
|---|---|
Document | โหลดเอกสาร Word จาก DOCX, DOC, RTF, TXT หรือ Markdown |
Document.save() | บันทึกเอกสารเป็น PDF, Markdown หรือข้อความธรรมดา |
Document.get_text() | สกัดเนื้อหาข้อความธรรมดาจากเอกสารที่โหลด |
SaveFormat | ค่าคงที่สำหรับการเลือกรูปแบบผลลัพธ์ (PDF, MARKDOWN, TEXT) |
PdfSaveOptions | การควบคุมละเอียดสำหรับการส่งออก PDF |
MarkdownSaveOptions | การควบคุมละเอียดสำหรับการส่งออก Markdown |