Parseri

Parseri

Internal API — Razredi na ovoj stranici koriste se interno u cjevovodu za pretvorbu dokumenata. Većina programera umjesto toga komunicira s Document.save() i Document.get_text(). Pogledajte Core Management za javni API.

Aspose.Words FOSS for Python uključuje specijalizirane parser-e koji izvlače strukturirane podatke iz internih dijelova DOCX-a. NumberingParser obrađuje definicije numeriranja popisa, a StyleParser izvlači stilove dokumenta.


Parser za numeriranje

NumberingParser čita definicije numeriranja iz DOCX paketa i izlaže ih putem API-ja za upite. Koristite parse_numbering_part() za učitavanje XML-a numeriranja, a zatim upitajte svojstva popisa pomoću pomoćnih metoda.

MetodaOpis
NumberingParser.parse_numbering_part()Parsiraj DOCX element numeriranja
NumberingParser.get_list_info()Dohvati informacije o određenom popisu po ID-u
NumberingParser.get_level_info()Dohvati detalje razine popisa na zadanoj dubini
NumberingParser.is_ordered_list()Provjeri je li razina popisa numerirana ili s oznakama
NumberingParser.get_start_value()Dohvati početni broj razine popisa
NumberingParser.get_delimiter()Dohvati string razdjelnika za razinu popisa

Parser stilova

StyleParser parsira nazive stilova u strukturirane ParsedStyle objekte. Identificira naslove, blok citate, blokove koda i paragrafe popisa iz naziva stilova DOCX.

MetodaOpis
StyleParser.parse()Parsiraj naziv stila u objekt ParsedStyle
StyleParser.get_style_chain()Parsiraj lanac naziva stilova za naslijeđene stilove
StyleParser.is_setext_heading()Provjeri je li stil Setext‑stil zaglavlje
StyleParser.extract_all_styles()Izvuci pojedinačne nazive stilova iz lanaca odvojenih zarezom

Model podataka za numeriranje

Podaci o parsiranom numeriranju pohranjeni su u strukturiranim objektima:

KlasaOpis
NumberingInfoDefinicija numeriranja s num_id, abstract_num_id i levels
NumberingLevelDefinicija razine s format, start i text svojstvima
ListInfoInformacije o određenoj instanci popisa
ListLevelInfoDetalji formatiranja specifični za razinu

Savjeti i najbolje prakse

  • Pozovite parse_numbering_part() jednom nakon učitavanja dokumenta kako biste popunili sve definicije popisa
  • Koristite is_ordered_list() za razlikovanje numeriranih popisa od nabrajnih popisa
  • Koristite get_style_chain() za parsiranje naslijeđenih lanaca stilova u jednom pozivu
  • Parseri za numeriranje i stilove koriste se interno u cjevovodu za pretvorbu dokumenta

Uobičajeni problemi

IssueCauseFix
Prazne definicije numeriranjaDokument nema popiseProvjerite povratnu vrijednost get_list_info() prije pristupa svojstvima
Nedostaje stilNaziv stila nije prepoznatKoristite parse() s poznatim nazivom stila
Neispravna razina popisaPogrešan parametar razineRazine popisa su indeksirane od nule

Sažetak API Reference

Klasa / MetodaOpis
NumberingParser.parse_numbering_part()Parsiranje definicija numeriranja DOCX
NumberingParser.get_list_info()Upit informacija o popisu po ID-u
NumberingParser.is_ordered_list()Provjeri je li razina popisa poredana
StyleParser.parse()Parsiranje naziva stila u strukturirane informacije
StyleParser.get_style_chain()Parsiranje lanca naslijeđenih naziva stilova
NumberingInfoModel podataka definicije numeriranja
NumberingLevelDefinicija razine s formatom i početnom vrijednošću
 Hrvatski