Pengurai

Pengurai

API Internal — Kelas‑kelas pada halaman ini digunakan secara internal oleh pipeline konversi dokumen. Sebagian besar pengembang berinteraksi dengan Document.save() dan Document.get_text() sebagai gantinya. Lihat Core Management untuk API publik.

Aspose.Words FOSS for Python mencakup parser khusus yang mengekstrak data terstruktur dari internal DOCX. NumberingParser menangani definisi penomoran daftar, dan StyleParser mengekstrak gaya dokumen.


Pengurai Penomoran

NumberingParser membaca definisi penomoran dari paket DOCX dan mengeksposnya melalui API kueri. Gunakan parse_numbering_part() untuk memuat XML penomoran, kemudian kueri properti daftar dengan metode pembantu.

MetodeDeskripsi
NumberingParser.parse_numbering_part()Mengurai elemen penomoran DOCX
NumberingParser.get_list_info()Mendapatkan informasi tentang daftar tertentu berdasarkan ID
NumberingParser.get_level_info()Mendapatkan detail level untuk daftar pada kedalaman tertentu
NumberingParser.is_ordered_list()Memeriksa apakah level daftar berurutan atau berbentuk bullet
NumberingParser.get_start_value()Mendapatkan nomor awal untuk level daftar
NumberingParser.get_delimiter()Mendapatkan string pemisah untuk level daftar

Pengurai Gaya

StyleParser mengurai nama gaya menjadi objek ParsedStyle terstruktur. Ia mengidentifikasi heading, blockquote, blok kode, dan paragraf daftar dari nama gaya DOCX.

MetodeDeskripsi
StyleParser.parse()Mengurai nama gaya menjadi objek ParsedStyle
StyleParser.get_style_chain()Mengurai rangkaian nama gaya untuk gaya yang diwarisi
StyleParser.is_setext_heading()Memeriksa apakah sebuah gaya adalah heading gaya Setext
StyleParser.extract_all_styles()Mengekstrak nama gaya individual dari rangkaian yang dipisahkan koma

Model Data Penomoran

Data penomoran yang diurai disimpan dalam objek terstruktur:

KelasDeskripsi
NumberingInfoDefinisi penomoran dengan num_id, abstract_num_id, dan levels
NumberingLevelDefinisi level dengan properti format, start, dan text
ListInfoInformasi tentang instance daftar tertentu
ListLevelInfoDetail pemformatan khusus level

Tips dan Praktik Terbaik

  • Panggil parse_numbering_part() sekali setelah memuat dokumen untuk mengisi semua definisi daftar
  • Gunakan is_ordered_list() untuk membedakan daftar bernomor dari daftar berpoin
  • Gunakan get_style_chain() untuk mengurai rantai gaya yang diwariskan dalam satu panggilan
  • Pengurai penomoran dan gaya digunakan secara internal oleh pipeline konversi dokumen

Masalah Umum

IssueCauseFix
Definisi penomoran kosongDokumen tidak memiliki daftarPeriksa nilai kembali get_list_info() sebelum mengakses properti
Gaya hilangNama gaya tidak dikenaliGunakan parse() dengan nama gaya yang dikenal
Level daftar tidak tepatParameter level salahLevel daftar diindeks dari nol

Ringkasan Referensi API

Kelas / MetodeDeskripsi
NumberingParser.parse_numbering_part()Mengurai definisi penomoran DOCX
NumberingParser.get_list_info()Menanyakan informasi daftar berdasarkan ID
NumberingParser.is_ordered_list()Memeriksa apakah tingkat daftar terurut
StyleParser.parse()Mengurai nama gaya menjadi informasi terstruktur
StyleParser.get_style_chain()Mengurai rangkaian nama gaya yang diwarisi
NumberingInfoModel data definisi penomoran
NumberingLevelDefinisi tingkat dengan format dan nilai awal
 Bahasa Indonesia