คุณสมบัติ
คุณสมบัติ
Aspose.Words FOSS for Python เป็นไลบรารีสำหรับการแปลงเอกสารและการสกัดข้อความสำหรับเอกสาร Word. API สาธารณะทั้งหมดถูกสร้างขึ้นรอบคลาส Document.
รูปแบบไฟล์อินพุตที่รองรับ
คลาส Document โหลดไฟล์จากรูปแบบเหล่านี้โดยอัตโนมัติตามส่วนขยายของไฟล์:
| รูปแบบ | ส่วนขยาย |
|---|---|
| เอกสาร Word | .docx, .doc |
| ข้อความแบบจัดรูปแบบ | .rtf |
| ข้อความธรรมดา | .txt |
| มาร์กดาวน์ | .md |
รูปแบบผลลัพธ์และตัวเลือกการบันทึก
เรียก Document.save() พร้อมค่าคงที่ SaveFormat เพื่อการแปลงอย่างรวดเร็ว หรือส่งอ็อบเจ็กต์ save-options เพื่อการควบคุมอย่างละเอียด.
| ผลลัพธ์ | ค่าคงที่ SaveFormat | คลาสตัวเลือกการบันทึก |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — กำหนดระดับการปฏิบัติตามและคุณภาพ JPEG | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — ควบคุมการส่งออกการจัดรูปแบบขีดเส้นใต้ |
| Plain Text | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
สำหรับตัวอย่างโค้ดและรายละเอียดการกำหนดค่าตัวเลือกการบันทึก ดูที่ Core Management.
การสกัดข้อความ
Document.get_text() คืนค่าข้อความ plain-text เต็มของเอกสารใด ๆ ที่โหลดแล้วโดยไม่ต้องเขียนลงดิสก์.
การสนับสนุนรูปภาพ
เอกสารที่มีภาพฝังอยู่สามารถแปลงเป็นรูปแบบผลลัพธ์ที่รองรับทั้งหมดได้ กระบวนการแปลงจะรักษาเนื้อหาภาพไว้ตลอดกระบวนการส่งออก.
สรุป API
| คลาส / เมธอด | บทบาท |
|---|---|
Document | โหลดเอกสาร, แปลงรูปแบบ, สกัดข้อความ |
SaveFormat | ค่าคงที่รูปแบบผลลัพธ์ (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | การกำหนดค่าการส่งออก PDF |
MarkdownSaveOptions | การกำหนดค่าการส่งออก Markdown |