Pengurusan Teras
Pengurusan Teras
Kelas Document adalah API utama untuk memuatkan dokumen Word dan menukarkannya ke format lain. Halaman ini merangkumi aliran kerja penukaran format, konfigurasi pilihan simpan, dan pengekstrakan teks.
Memuat dan Menyimpan
Muatkan dokumen dengan Document() dan panggil save() dengan pemalar SaveFormat untuk menukar antara format. Input yang disokong: DOCX, DOC, RTF, TXT, Markdown. Output yang disokong: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Panggil save() berulang kali pada Document yang sama untuk menghasilkan pelbagai format output tanpa memuat semula.
Eksport PDF dengan PdfSaveOptions
Untuk output PDF lalai, hantarkan SaveFormat.PDF. Untuk kawalan terperinci, gunakan objek PdfSaveOptions:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions menerima tetapan untuk kualiti imej JPEG (0–100, lalai 100) dan tahap pematuhan piawaian PDF (lalai PDF/1.7).
Eksport Markdown dengan MarkdownSaveOptions
Untuk output Markdown lalai, berikan SaveFormat.MARKDOWN. Gunakan MarkdownSaveOptions apabila anda perlu mengawal tingkah laku pemformatan:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions menyokong kawalan pemeliharaan format garis bawah dalam output.
Ekstraksi Teks
Ekstrak teks biasa dari mana-mana dokumen yang dimuatkan dengan get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Untuk output fail teks, gunakan SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Isu Umum
| Isu | Punca | Penyelesaian |
|---|---|---|
ModuleNotFoundError | Pakej tidak dipasang | Jalankan pip install aspose-words-foss>=26.4.0 |
Teks kosong dari get_text() | Fail input kosong atau rosak | Sahkan fail input dibuka dengan betul dalam pemproses kata |
| Output PDF tiada imej | Format imej tidak disokong oleh penukar | Gunakan input DOCX dengan imej terbenam standard |
Ringkasan Rujukan API
| Class / Method | Description |
|---|---|
Document | Muat dokumen Word dari DOCX, DOC, RTF, TXT, atau Markdown |
Document.save() | Simpan ke PDF, Markdown, DOCX, DOC, atau teks biasa |
Document.get_text() | Ekstrak kandungan teks biasa |
SaveFormat | Pemalar: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Konfigurasikan pematuhan PDF dan kualiti JPEG |
MarkdownSaveOptions | Konfigurasikan eksport format garis bawah |