Manajemen Inti
Manajemen Inti
Kelas Document adalah API utama untuk memuat dokumen Word dan mengonversinya ke format lain. Halaman ini mencakup alur kerja konversi format, konfigurasi opsi penyimpanan, dan ekstraksi teks.
Memuat dan Menyimpan
Muat dokumen dengan Document() dan panggil save() dengan konstanta SaveFormat untuk mengonversi antar format. Input yang didukung: DOCX, DOC, RTF, TXT, Markdown. Output yang didukung: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Panggil save() beberapa kali pada Document yang sama untuk menghasilkan beberapa format output tanpa memuat ulang.
Ekspor PDF dengan PdfSaveOptions
Untuk output PDF default, berikan SaveFormat.PDF. Untuk kontrol yang lebih halus, gunakan objek PdfSaveOptions:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions menerima pengaturan untuk kualitas gambar JPEG (0–100, default 100) dan tingkat kepatuhan standar PDF (default PDF/1.7).
Ekspor Markdown dengan MarkdownSaveOptions
Untuk output Markdown default, gunakan SaveFormat.MARKDOWN. Gunakan MarkdownSaveOptions ketika Anda perlu mengontrol perilaku pemformatan:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions mendukung pengendalian pelestarian format underline dalam output.
Ekstraksi Teks
Ekstrak teks biasa dari dokumen apa pun yang dimuat dengan get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Untuk output file teks, gunakan SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Masalah Umum
| Issue | Cause | Fix |
|---|---|---|
ModuleNotFoundError | Paket tidak terpasang | Jalankan pip install aspose-words-foss>=26.4.0 |
Teks kosong dari get_text() | File input kosong atau rusak | Verifikasi bahwa file input terbuka dengan benar di pengolah kata |
| Output PDF kehilangan gambar | Format gambar tidak didukung oleh konverter | Gunakan input DOCX dengan gambar tersemat standar |
Ringkasan Referensi API
| Kelas / Metode | Deskripsi |
|---|---|
Document | Muat dokumen Word dari DOCX, DOC, RTF, TXT, atau Markdown |
Document.save() | Simpan ke PDF, Markdown, DOCX, DOC, atau teks biasa |
Document.get_text() | Ekstrak konten teks biasa |
SaveFormat | Konstanta: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Konfigurasikan kepatuhan PDF dan kualitas JPEG |
MarkdownSaveOptions | Konfigurasikan ekspor format garis bawah |