Parsere

Parsere

Intern API — Klasserne på denne side bruges internt af dokumentkonverteringspipeline. De fleste udviklere interagerer i stedet med Document.save() og Document.get_text(). Se Core Management for den offentlige API.

Aspose.Words FOSS for Python inkluderer specialiserede parser, der udtrækker strukturerede data fra DOCX-interne filer. NumberingParser håndterer liste nummereringsdefinitioner, og StyleParser udtrækker dokumentstilarter.


Nummereringsparser

NumberingParser læser nummereringsdefinitionerne fra en DOCX-pakke og eksponerer dem via en forespørgsels-API. Brug parse_numbering_part() til at indlæse nummererings-XML, og forespørg derefter listeegenskaber med hjælpefunktioner.

MetodeBeskrivelse
NumberingParser.parse_numbering_part()Parse DOCX-nummereringselementet
NumberingParser.get_list_info()Hent information om en specifik liste ved ID
NumberingParser.get_level_info()Hent niveauoplysninger for en liste på en given dybde
NumberingParser.is_ordered_list()Kontroller om et liste‑niveau er ordnet eller punktformet
NumberingParser.get_start_value()Hent startnummeret for et liste‑niveau
NumberingParser.get_delimiter()Hent afgrænsningsstrengen for et liste‑niveau

Stilparser

StyleParser parser stilnavne til strukturerede ParsedStyle-objekter. Den identificerer overskrifter, blokcitater, kodeblokke og listeafsnit fra DOCX-stilnavne.

MetodeBeskrivelse
StyleParser.parse()Fortolk et stilnavn til et ParsedStyle-objekt
StyleParser.get_style_chain()Fortolk en kæde af stilnavne for arvede stilarter
StyleParser.is_setext_heading()Kontroller om en stil er en Setext-stiloverskrift
StyleParser.extract_all_styles()Udtræk individuelle stilnavne fra en kommasepareret kæde

Nummereringsdatamodel

Den analyserede nummereringsdata gemmes i strukturerede objekter:

KlasseBeskrivelse
NumberingInfoNummereringsdefinition med num_id, abstract_num_id og levels
NumberingLevelNiveaudefinition med format, start og text egenskaber
ListInfoInformation om en specifik listeinstans
ListLevelInfoNiveau‑specifikke formateringsdetaljer

Tips og bedste praksis

  • Kald parse_numbering_part() én gang efter indlæsning af et dokument for at udfylde alle liste-definitioner
  • Brug is_ordered_list() til at skelne nummererede lister fra punktopstillinger
  • Brug get_style_chain() til at parse arvede stilkæder i et enkelt kald
  • Nummerering og stilparsers bruges internt af dokumentkonverteringspipeline

Almindelige problemer

ProblemÅrsagLøsning
Tomme nummereringsdefinitionerDokumentet har ingen listerKontroller get_list_info() returværdien før du får adgang til egenskaber
Manglende stilStilnavn ikke genkendtBrug parse() med et kendt stilnavn
Forkert liste‑niveauForkert niveauparameterListe‑niveauer er nul‑indekseret

API-referencens oversigt

Klasse / MetodeBeskrivelse
NumberingParser.parse_numbering_part()Parse DOCX-nummereringsdefinitioner
NumberingParser.get_list_info()Forespørg listeinformation efter ID
NumberingParser.is_ordered_list()Kontroller om et listeniveau er ordnet
StyleParser.parse()Parse et stilnavn til struktureret information
StyleParser.get_style_chain()Parse en kæde af arvede stilnavne
NumberingInfoNummereringsdefinitionsdatamodel
NumberingLevelNiveaudefinition med format og startværdi
 Dansk