Parseri
Parseri
Internal API — Razredi na ovoj stranici koriste se interno u cjevovodu za pretvorbu dokumenata. Većina programera umjesto toga komunicira s
Document.save()iDocument.get_text(). Pogledajte Core Management za javni API.
Aspose.Words FOSS for Python uključuje specijalizirane parser-e koji izvlače strukturirane podatke iz internih dijelova DOCX-a. NumberingParser obrađuje definicije numeriranja popisa, a StyleParser izvlači stilove dokumenta.
Parser za numeriranje
NumberingParser čita definicije numeriranja iz DOCX paketa i izlaže ih putem API-ja za upite. Koristite parse_numbering_part() za učitavanje XML-a numeriranja, a zatim upitajte svojstva popisa pomoću pomoćnih metoda.
| Metoda | Opis |
|---|---|
NumberingParser.parse_numbering_part() | Parsiraj DOCX element numeriranja |
NumberingParser.get_list_info() | Dohvati informacije o određenom popisu po ID-u |
NumberingParser.get_level_info() | Dohvati detalje razine popisa na zadanoj dubini |
NumberingParser.is_ordered_list() | Provjeri je li razina popisa numerirana ili s oznakama |
NumberingParser.get_start_value() | Dohvati početni broj razine popisa |
NumberingParser.get_delimiter() | Dohvati string razdjelnika za razinu popisa |
Parser stilova
StyleParser parsira nazive stilova u strukturirane ParsedStyle objekte. Identificira naslove, blok citate, blokove koda i paragrafe popisa iz naziva stilova DOCX.
| Metoda | Opis |
|---|---|
StyleParser.parse() | Parsiraj naziv stila u objekt ParsedStyle |
StyleParser.get_style_chain() | Parsiraj lanac naziva stilova za naslijeđene stilove |
StyleParser.is_setext_heading() | Provjeri je li stil Setext‑stil zaglavlje |
StyleParser.extract_all_styles() | Izvuci pojedinačne nazive stilova iz lanaca odvojenih zarezom |
Model podataka za numeriranje
Podaci o parsiranom numeriranju pohranjeni su u strukturiranim objektima:
| Klasa | Opis |
|---|---|
NumberingInfo | Definicija numeriranja s num_id, abstract_num_id i levels |
NumberingLevel | Definicija razine s format, start i text svojstvima |
ListInfo | Informacije o određenoj instanci popisa |
ListLevelInfo | Detalji formatiranja specifični za razinu |
Savjeti i najbolje prakse
- Pozovite
parse_numbering_part()jednom nakon učitavanja dokumenta kako biste popunili sve definicije popisa - Koristite
is_ordered_list()za razlikovanje numeriranih popisa od nabrajnih popisa - Koristite
get_style_chain()za parsiranje naslijeđenih lanaca stilova u jednom pozivu - Parseri za numeriranje i stilove koriste se interno u cjevovodu za pretvorbu dokumenta
Uobičajeni problemi
| Issue | Cause | Fix |
|---|---|---|
| Prazne definicije numeriranja | Dokument nema popise | Provjerite povratnu vrijednost get_list_info() prije pristupa svojstvima |
| Nedostaje stil | Naziv stila nije prepoznat | Koristite parse() s poznatim nazivom stila |
| Neispravna razina popisa | Pogrešan parametar razine | Razine popisa su indeksirane od nule |
Sažetak API Reference
| Klasa / Metoda | Opis |
|---|---|
NumberingParser.parse_numbering_part() | Parsiranje definicija numeriranja DOCX |
NumberingParser.get_list_info() | Upit informacija o popisu po ID-u |
NumberingParser.is_ordered_list() | Provjeri je li razina popisa poredana |
StyleParser.parse() | Parsiranje naziva stila u strukturirane informacije |
StyleParser.get_style_chain() | Parsiranje lanca naslijeđenih naziva stilova |
NumberingInfo | Model podataka definicije numeriranja |
NumberingLevel | Definicija razine s formatom i početnom vrijednošću |