Elemzők
Elemzők
Internal API — Az ezen az oldalon található osztályok a dokumentumkonverziós csővezetékben belsőleg használatosak. A legtöbb fejlesztő a
Document.save()ésDocument.get_text()-vel dolgozik helyette. Lásd a Core Management a nyilvános API-hoz.
Aspose.Words FOSS for Python speciális elemzőket tartalmaz, amelyek strukturált adatokat nyernek ki a DOCX belső részeiből. A NumberingParser kezeli a listaszámozási definíciókat, és a StyleParser kinyeri a dokumentum stílusait.
Számozás elemző
NumberingParser beolvassa a számozási definíciókat egy DOCX csomagból, és egy lekérdezési API-n keresztül teszi elérhetővé őket. Használja a parse_numbering_part()‑t a számozási XML betöltéséhez, majd a segédmetódusokkal kérdezze le a lista tulajdonságait.
| Módszer | Leírás |
|---|---|
NumberingParser.parse_numbering_part() | A DOCX számozási elem feldolgozása |
NumberingParser.get_list_info() | Információ lekérése egy adott listáról azonosító alapján |
NumberingParser.get_level_info() | Szint részleteinek lekérése egy adott mélységű listához |
NumberingParser.is_ordered_list() | Ellenőrizze, hogy a lista szintje rendezett vagy felsorolásjelű |
NumberingParser.get_start_value() | A lista szintjének kezdő számának lekérése |
NumberingParser.get_delimiter() | A lista szintjének elválasztó karakterláncának lekérése |
Stílus elemző
StyleParser a stílusneveket strukturált ParsedStyle objektumokká dolgozza fel. Azonosítja a címsorokat, idézetblokkokat, kódrészeket és lista bekezdéseket a DOCX stílusnevekből.
| Módszer | Leírás |
|---|---|
StyleParser.parse() | A stílusnevet egy ParsedStyle objektummá alakítja |
StyleParser.get_style_chain() | Örökölt stílusokhoz a stílusnevek láncát elemzi |
StyleParser.is_setext_heading() | Ellenőrzi, hogy a stílus Setext‑stílusú címsor‑e |
StyleParser.extract_all_styles() | Kivonja az egyes stílusneveket egy vesszővel elválasztott láncból |
Számozási adatmodell
A feldolgozott számozási adatok strukturált objektumokban tárolódnak:
| Osztály | Leírás |
|---|---|
NumberingInfo | Számozási definíció a num_id, abstract_num_id és levels elemekkel |
NumberingLevel | Szintdefiníció a format, start és text tulajdonságokkal |
ListInfo | Információ egy konkrét lista példányról |
ListLevelInfo | Szintspecifikus formázási részletek |
Tippek és bevált gyakorlatok
- Hívja meg a
parse_numbering_part()-et egyszer a dokumentum betöltése után, hogy feltöltse az összes lista definíciót - Használja a
is_ordered_list()-t a számozott listák és a felsorolásos listák megkülönböztetésére - Használja a
get_style_chain()-t az örökölt stílusláncok egyetlen hívásban történő feldolgozásához - A számozási és stílusfeldolgozókat a dokumentumkonverziós csővezeték belsőleg használja
Gyakori problémák
| Probléma | Ok | Megoldás |
|---|---|---|
| Üres számozási definíciók | A dokumentumnak nincsenek listái | Ellenőrizze a get_list_info() visszatérési értékét a tulajdonságok elérése előtt |
| Hiányzó stílus | A stílus neve nem ismert | Használja a parse()‑t egy ismert stílusnévvel |
| Helytelen lista szint | Hibás szint paraméter | A lista szintek nullától indexeltek |
API Referencia Összefoglaló
| Osztály / Metódus | Leírás |
|---|---|
NumberingParser.parse_numbering_part() | DOCX számozási definíciók elemzése |
NumberingParser.get_list_info() | Lista információ lekérdezése ID alapján |
NumberingParser.is_ordered_list() | Ellenőrizze, hogy a lista szint rendezett-e |
StyleParser.parse() | Stílusnév elemzése strukturált információvá |
StyleParser.get_style_chain() | Örökölt stílusnevek láncának elemzése |
NumberingInfo | Számozási definíció adatmodell |
NumberingLevel | Szintdefiníció formátummal és kezdőértékkel |