Funktioner
Funktioner
Aspose.Words FOSS for Python er et dokumentkonverterings- og tekstudtrækningsbibliotek for Word-dokumenter. Hele den offentlige API er bygget omkring Document-klassen.
Understøttede inputformater
Klassen Document indlæser filer fra disse formater automatisk baseret på filendelse:
| Format | Udvidelser |
|---|---|
| Word-dokument | .docx, .doc |
| Rich Text | .rtf |
| Almindelig tekst | .txt |
| Markdown | .md |
Outputformater og Gemmeindstillinger
Kald Document.save() med en SaveFormat-konstant for hurtig konvertering, eller send et save-options-objekt for finjusteret kontrol.
| Output | SaveFormat‑konstant | Save Options‑klasse |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — konfigurer overholdelsesniveau, JPEG‑kvalitet | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — kontroller eksport af understregningsformatering |
| Almindelig tekst | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
For kodeeksempler og konfigurationsdetaljer for gemmeindstillinger, se Core Management.
Tekstudtrækning
Document.get_text() returnerer det fulde ren‑tekstindhold af ethvert indlæst dokument uden at skrive til disk.
Billedunderstøttelse
Dokumenter med indlejrede billeder kan konverteres til alle understøttede outputformater. Konverteringspipeline bevarer billedindholdet gennem eksportprocessen.
API Resumé
| Klasse / Metode | Rolle |
|---|---|
Document | Indlæs dokumenter, konverter formater, udtræk tekst |
SaveFormat | Uddataformatkonstanter (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | PDF-eksportkonfiguration |
MarkdownSaveOptions | Markdown-eksportkonfiguration |