Fitur
Fitur
Aspose.Words FOSS for Python adalah perpustakaan konversi dokumen dan ekstraksi teks untuk dokumen Word. Seluruh API publik dibangun di sekitar kelas Document.
Format Input yang Didukung
Kelas Document memuat file dari format-format ini secara otomatis berdasarkan ekstensi file:
| Format | Ekstensi |
|---|---|
| Dokumen Word | .docx, .doc |
| Teks Kaya | .rtf |
| Teks Biasa | .txt |
| Markdown | .md |
Format Output dan Opsi Penyimpanan
Panggil Document.save() dengan konstanta SaveFormat untuk konversi cepat, atau berikan objek save-options untuk kontrol yang lebih halus.
| Output | Konstanta SaveFormat | Kelas Opsi Penyimpanan |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — konfigurasikan tingkat kepatuhan, kualitas JPEG | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — kontrol ekspor format underline |
| Teks Biasa | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Untuk contoh kode dan detail konfigurasi opsi penyimpanan, lihat Core Management.
Ekstraksi Teks
Document.get_text() mengembalikan konten teks polos lengkap dari dokumen apa pun yang dimuat tanpa menulis ke disk.
Dukungan Gambar
Dokumen dengan gambar tersemat dapat dikonversi ke semua format output yang didukung. Pipeline konversi mempertahankan konten gambar melalui proses ekspor.
Ringkasan API
| Class / Method | Role |
|---|---|
Document | Muat dokumen, konversi format, ekstrak teks |
SaveFormat | Konstanta format output (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | Konfigurasi ekspor PDF |
MarkdownSaveOptions | Konfigurasi ekspor Markdown |