Jäsentimet

Parserit

Internal API — Tällä sivun luokkia käytetään sisäisesti asiakirjamuunnosputkessa. Useimmat kehittäjät käyttävät sen sijaan Document.save() ja Document.get_text(). Katso Core Management julkisesta API:sta.

Aspose.Words FOSS for Python sisältää erikoistuneita jäsennereitä, jotka poimivat rakenteellista dataa DOCX:n sisäosista. NumberingParser käsittelee luettelon numerointimäärittelyjä, ja StyleParser poimii asiakirjan tyylejä.


Numerointiparse

NumberingParser lukee numerointimäärittelyt DOCX‑paketista ja tarjoaa ne kysely‑API:n kautta. Käytä parse_numbering_part() numeroint XML:n lataamiseen, jonka jälkeen voit kysyä listan ominaisuuksia apumetodeilla.

MenetelmäKuvaus
NumberingParser.parse_numbering_part()Jäsennä DOCX-numerointielementti
NumberingParser.get_list_info()Hae tietoja tietystä listasta ID:n perusteella
NumberingParser.get_level_info()Hae tason tiedot listasta annetussa syvyydessä
NumberingParser.is_ordered_list()Tarkista, onko listan taso järjestetty vai luettelomerkitty
NumberingParser.get_start_value()Hae listatason aloitusnumero
NumberingParser.get_delimiter()Hae listatason erotinmerkkijono

Tyylijäsennin

StyleParser jäsentää tyylinimet rakenteellisiksi ParsedStyle-objekteiksi. Se tunnistaa otsikot, lohkokitaukset, koodilohkot ja luettelokappaleet DOCX-tyylinimistä.

MenetelmäKuvaus
StyleParser.parse()Jäsennä tyylin nimi ParsedStyle-objektiin
StyleParser.get_style_chain()Jäsennä tyylin nimiketju perittyjä tyylejä varten
StyleParser.is_setext_heading()Tarkista, onko tyyli Setext-tyylinen otsikko
StyleParser.extract_all_styles()Poimi yksittäiset tyylinimet pilkulla erotetusta ketjusta

Numerointidatan malli

Jäsennetyt numerointitiedot tallennetaan rakenteellisiin objekteihin:

LuokkaKuvaus
NumberingInfoNumeroinnin määritelmä, jossa on num_id, abstract_num_id ja levels
NumberingLevelTason määritelmä, jossa on format, start ja text ominaisuuksia
ListInfoTietoa tietystä listan esiintymästä
ListLevelInfoTason erityisiä muotoilutietoja

Vinkkejä ja parhaat käytännöt

  • Kutsu parse_numbering_part() kerran asiakirjan lataamisen jälkeen täyttääksesi kaikki luettelomääritelmät
  • Käytä is_ordered_list() erottaaksesi numeroidut luettelot luettelomerkeillä varustetuista luetteloista
  • Käytä get_style_chain() jäsentääksesi perittyjä tyyliketjuja yhdessä kutsussa
  • Numerointi- ja tyylijäsennereitä käytetään sisäisesti asiakirjan muunnosputkessa

Yleiset ongelmat

OngelmaSyyKorjaus
Tyhjät numerointimäärittelytAsiakirjassa ei ole luetteloitaTarkista get_list_info()-paluuarvo ennen ominaisuuksien käyttämistä
Puuttuva tyyliTyylin nimeä ei tunnistettuKäytä parse()-toimintoa tunnetulla tyylin nimellä
Virheellinen luettelotasoVäärä tasoparametriLuettelotasot alkavat nollasta

API-viitteiden yhteenveto

Luokka / MetodiKuvaus
NumberingParser.parse_numbering_part()Jäsennä DOCX-numerointimäärittelyt
NumberingParser.get_list_info()Hae luettelon tiedot ID:n perusteella
NumberingParser.is_ordered_list()Tarkista, onko luettelotaso järjestetty
StyleParser.parse()Jäsennä tyylin nimi rakenteelliseksi tiedoksi
StyleParser.get_style_chain()Jäsennä perittyjen tyylinimien ketju
NumberingInfoNumerointimäärittelyn tietomalli
NumberingLevelTason määrittely muodolla ja aloitusarvolla
 Suomi