Pengurai
Pengurai
API Internal — Kelas‑kelas pada halaman ini digunakan secara internal oleh pipeline konversi dokumen. Sebagian besar pengembang berinteraksi dengan
Document.save()danDocument.get_text()sebagai gantinya. Lihat Core Management untuk API publik.
Aspose.Words FOSS for Python mencakup parser khusus yang mengekstrak data terstruktur dari internal DOCX. NumberingParser menangani definisi penomoran daftar, dan StyleParser mengekstrak gaya dokumen.
Pengurai Penomoran
NumberingParser membaca definisi penomoran dari paket DOCX dan mengeksposnya melalui API kueri. Gunakan parse_numbering_part() untuk memuat XML penomoran, kemudian kueri properti daftar dengan metode pembantu.
| Metode | Deskripsi |
|---|---|
NumberingParser.parse_numbering_part() | Mengurai elemen penomoran DOCX |
NumberingParser.get_list_info() | Mendapatkan informasi tentang daftar tertentu berdasarkan ID |
NumberingParser.get_level_info() | Mendapatkan detail level untuk daftar pada kedalaman tertentu |
NumberingParser.is_ordered_list() | Memeriksa apakah level daftar berurutan atau berbentuk bullet |
NumberingParser.get_start_value() | Mendapatkan nomor awal untuk level daftar |
NumberingParser.get_delimiter() | Mendapatkan string pemisah untuk level daftar |
Pengurai Gaya
StyleParser mengurai nama gaya menjadi objek ParsedStyle terstruktur. Ia mengidentifikasi heading, blockquote, blok kode, dan paragraf daftar dari nama gaya DOCX.
| Metode | Deskripsi |
|---|---|
StyleParser.parse() | Mengurai nama gaya menjadi objek ParsedStyle |
StyleParser.get_style_chain() | Mengurai rangkaian nama gaya untuk gaya yang diwarisi |
StyleParser.is_setext_heading() | Memeriksa apakah sebuah gaya adalah heading gaya Setext |
StyleParser.extract_all_styles() | Mengekstrak nama gaya individual dari rangkaian yang dipisahkan koma |
Model Data Penomoran
Data penomoran yang diurai disimpan dalam objek terstruktur:
| Kelas | Deskripsi |
|---|---|
NumberingInfo | Definisi penomoran dengan num_id, abstract_num_id, dan levels |
NumberingLevel | Definisi level dengan properti format, start, dan text |
ListInfo | Informasi tentang instance daftar tertentu |
ListLevelInfo | Detail pemformatan khusus level |
Tips dan Praktik Terbaik
- Panggil
parse_numbering_part()sekali setelah memuat dokumen untuk mengisi semua definisi daftar - Gunakan
is_ordered_list()untuk membedakan daftar bernomor dari daftar berpoin - Gunakan
get_style_chain()untuk mengurai rantai gaya yang diwariskan dalam satu panggilan - Pengurai penomoran dan gaya digunakan secara internal oleh pipeline konversi dokumen
Masalah Umum
| Issue | Cause | Fix |
|---|---|---|
| Definisi penomoran kosong | Dokumen tidak memiliki daftar | Periksa nilai kembali get_list_info() sebelum mengakses properti |
| Gaya hilang | Nama gaya tidak dikenali | Gunakan parse() dengan nama gaya yang dikenal |
| Level daftar tidak tepat | Parameter level salah | Level daftar diindeks dari nol |
Ringkasan Referensi API
| Kelas / Metode | Deskripsi |
|---|---|
NumberingParser.parse_numbering_part() | Mengurai definisi penomoran DOCX |
NumberingParser.get_list_info() | Menanyakan informasi daftar berdasarkan ID |
NumberingParser.is_ordered_list() | Memeriksa apakah tingkat daftar terurut |
StyleParser.parse() | Mengurai nama gaya menjadi informasi terstruktur |
StyleParser.get_style_chain() | Mengurai rangkaian nama gaya yang diwarisi |
NumberingInfo | Model data definisi penomoran |
NumberingLevel | Definisi tingkat dengan format dan nilai awal |