Pengurusan Teras

Pengurusan Teras

Kelas Document adalah API utama untuk memuatkan dokumen Word dan menukarkannya ke format lain. Halaman ini merangkumi aliran kerja penukaran format, konfigurasi pilihan simpan, dan pengekstrakan teks.


Memuat dan Menyimpan

Muatkan dokumen dengan Document() dan panggil save() dengan pemalar SaveFormat untuk menukar antara format. Input yang disokong: DOCX, DOC, RTF, TXT, Markdown. Output yang disokong: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Panggil save() berulang kali pada Document yang sama untuk menghasilkan pelbagai format output tanpa memuat semula.


Eksport PDF dengan PdfSaveOptions

Untuk output PDF lalai, hantarkan SaveFormat.PDF. Untuk kawalan terperinci, gunakan objek PdfSaveOptions:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions menerima tetapan untuk kualiti imej JPEG (0–100, lalai 100) dan tahap pematuhan piawaian PDF (lalai PDF/1.7).


Eksport Markdown dengan MarkdownSaveOptions

Untuk output Markdown lalai, berikan SaveFormat.MARKDOWN. Gunakan MarkdownSaveOptions apabila anda perlu mengawal tingkah laku pemformatan:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions menyokong kawalan pemeliharaan format garis bawah dalam output.


Ekstraksi Teks

Ekstrak teks biasa dari mana-mana dokumen yang dimuatkan dengan get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Untuk output fail teks, gunakan SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Isu Umum

IsuPuncaPenyelesaian
ModuleNotFoundErrorPakej tidak dipasangJalankan pip install aspose-words-foss>=26.4.0
Teks kosong dari get_text()Fail input kosong atau rosakSahkan fail input dibuka dengan betul dalam pemproses kata
Output PDF tiada imejFormat imej tidak disokong oleh penukarGunakan input DOCX dengan imej terbenam standard

Ringkasan Rujukan API

Class / MethodDescription
DocumentMuat dokumen Word dari DOCX, DOC, RTF, TXT, atau Markdown
Document.save()Simpan ke PDF, Markdown, DOCX, DOC, atau teks biasa
Document.get_text()Ekstrak kandungan teks biasa
SaveFormatPemalar: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsKonfigurasikan pematuhan PDF dan kualiti JPEG
MarkdownSaveOptionsKonfigurasikan eksport format garis bawah
 Bahasa Melayu