Manajemen Inti

Manajemen Inti

Kelas Document adalah API utama untuk memuat dokumen Word dan mengonversinya ke format lain. Halaman ini mencakup alur kerja konversi format, konfigurasi opsi penyimpanan, dan ekstraksi teks.


Memuat dan Menyimpan

Muat dokumen dengan Document() dan panggil save() dengan konstanta SaveFormat untuk mengonversi antar format. Input yang didukung: DOCX, DOC, RTF, TXT, Markdown. Output yang didukung: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Panggil save() beberapa kali pada Document yang sama untuk menghasilkan beberapa format output tanpa memuat ulang.


Ekspor PDF dengan PdfSaveOptions

Untuk output PDF default, berikan SaveFormat.PDF. Untuk kontrol yang lebih halus, gunakan objek PdfSaveOptions:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions menerima pengaturan untuk kualitas gambar JPEG (0–100, default 100) dan tingkat kepatuhan standar PDF (default PDF/1.7).


Ekspor Markdown dengan MarkdownSaveOptions

Untuk output Markdown default, gunakan SaveFormat.MARKDOWN. Gunakan MarkdownSaveOptions ketika Anda perlu mengontrol perilaku pemformatan:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions mendukung pengendalian pelestarian format underline dalam output.


Ekstraksi Teks

Ekstrak teks biasa dari dokumen apa pun yang dimuat dengan get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Untuk output file teks, gunakan SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Masalah Umum

IssueCauseFix
ModuleNotFoundErrorPaket tidak terpasangJalankan pip install aspose-words-foss>=26.4.0
Teks kosong dari get_text()File input kosong atau rusakVerifikasi bahwa file input terbuka dengan benar di pengolah kata
Output PDF kehilangan gambarFormat gambar tidak didukung oleh konverterGunakan input DOCX dengan gambar tersemat standar

Ringkasan Referensi API

Kelas / MetodeDeskripsi
DocumentMuat dokumen Word dari DOCX, DOC, RTF, TXT, atau Markdown
Document.save()Simpan ke PDF, Markdown, DOCX, DOC, atau teks biasa
Document.get_text()Ekstrak konten teks biasa
SaveFormatKonstanta: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsKonfigurasikan kepatuhan PDF dan kualitas JPEG
MarkdownSaveOptionsKonfigurasikan ekspor format garis bawah
 Bahasa Indonesia