Elemzők

Elemzők

Internal API — Az ezen az oldalon található osztályok a dokumentumkonverziós csővezetékben belsőleg használatosak. A legtöbb fejlesztő a Document.save() és Document.get_text()-vel dolgozik helyette. Lásd a Core Management a nyilvános API-hoz.

Aspose.Words FOSS for Python speciális elemzőket tartalmaz, amelyek strukturált adatokat nyernek ki a DOCX belső részeiből. A NumberingParser kezeli a listaszámozási definíciókat, és a StyleParser kinyeri a dokumentum stílusait.


Számozás elemző

NumberingParser beolvassa a számozási definíciókat egy DOCX csomagból, és egy lekérdezési API-n keresztül teszi elérhetővé őket. Használja a parse_numbering_part()‑t a számozási XML betöltéséhez, majd a segédmetódusokkal kérdezze le a lista tulajdonságait.

MódszerLeírás
NumberingParser.parse_numbering_part()A DOCX számozási elem feldolgozása
NumberingParser.get_list_info()Információ lekérése egy adott listáról azonosító alapján
NumberingParser.get_level_info()Szint részleteinek lekérése egy adott mélységű listához
NumberingParser.is_ordered_list()Ellenőrizze, hogy a lista szintje rendezett vagy felsorolásjelű
NumberingParser.get_start_value()A lista szintjének kezdő számának lekérése
NumberingParser.get_delimiter()A lista szintjének elválasztó karakterláncának lekérése

Stílus elemző

StyleParser a stílusneveket strukturált ParsedStyle objektumokká dolgozza fel. Azonosítja a címsorokat, idézetblokkokat, kódrészeket és lista bekezdéseket a DOCX stílusnevekből.

MódszerLeírás
StyleParser.parse()A stílusnevet egy ParsedStyle objektummá alakítja
StyleParser.get_style_chain()Örökölt stílusokhoz a stílusnevek láncát elemzi
StyleParser.is_setext_heading()Ellenőrzi, hogy a stílus Setext‑stílusú címsor‑e
StyleParser.extract_all_styles()Kivonja az egyes stílusneveket egy vesszővel elválasztott láncból

Számozási adatmodell

A feldolgozott számozási adatok strukturált objektumokban tárolódnak:

OsztályLeírás
NumberingInfoSzámozási definíció a num_id, abstract_num_id és levels elemekkel
NumberingLevelSzintdefiníció a format, start és text tulajdonságokkal
ListInfoInformáció egy konkrét lista példányról
ListLevelInfoSzintspecifikus formázási részletek

Tippek és bevált gyakorlatok

  • Hívja meg a parse_numbering_part()-et egyszer a dokumentum betöltése után, hogy feltöltse az összes lista definíciót
  • Használja a is_ordered_list()-t a számozott listák és a felsorolásos listák megkülönböztetésére
  • Használja a get_style_chain()-t az örökölt stílusláncok egyetlen hívásban történő feldolgozásához
  • A számozási és stílusfeldolgozókat a dokumentumkonverziós csővezeték belsőleg használja

Gyakori problémák

ProblémaOkMegoldás
Üres számozási definíciókA dokumentumnak nincsenek listáiEllenőrizze a get_list_info() visszatérési értékét a tulajdonságok elérése előtt
Hiányzó stílusA stílus neve nem ismertHasználja a parse()‑t egy ismert stílusnévvel
Helytelen lista szintHibás szint paraméterA lista szintek nullától indexeltek

API Referencia Összefoglaló

Osztály / MetódusLeírás
NumberingParser.parse_numbering_part()DOCX számozási definíciók elemzése
NumberingParser.get_list_info()Lista információ lekérdezése ID alapján
NumberingParser.is_ordered_list()Ellenőrizze, hogy a lista szint rendezett-e
StyleParser.parse()Stílusnév elemzése strukturált információvá
StyleParser.get_style_chain()Örökölt stílusnevek láncának elemzése
NumberingInfoSzámozási definíció adatmodell
NumberingLevelSzintdefiníció formátummal és kezdőértékkel
 Magyar