Funksjoner
Funksjoner
Aspose.Words FOSS for Python er et dokumentkonverterings- og tekstuttrekkingsbibliotek for Word-dokumenter. Hele det offentlige API-et er bygget rundt Document-klassen.
Støttede inndataformater
Document-klassen laster filer fra disse formatene automatisk basert på filtype:
| Format | Utvidelser |
|---|---|
| Word-dokument | .docx, .doc |
| Rik tekst | .rtf |
| Ren tekst | .txt |
| Markdown | .md |
Utdataformater og lagringsalternativer
Kall Document.save() med en SaveFormat‑konstant for rask konvertering, eller send inn et save‑options‑objekt for finjustert kontroll.
| Utdata | SaveFormat-konstant | Save Options-klasse |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — konfigurer samsvarsgrad, JPEG‑kvalitet | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — kontroller eksport av understrekingsformatering |
| Ren tekst | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
For kodeeksempler og detaljer om konfigurasjon av lagringsalternativer, se Core Management.
Tekstuttrekk
Document.get_text() returnerer det fullstendige plain‑text‑innholdet av ethvert lastet dokument uten å skrive til disk.
Bilde støtte
Dokumenter med innebygde bilder kan konverteres til alle støttede utdataformater. Konverteringspipeline bevarer bildeinnholdet gjennom eksportprosessen.
API‑sammendrag
| Klasse / Metode | Rolle |
|---|---|
Document | Last inn dokumenter, konverter formater, hent ut tekst |
SaveFormat | Konstanter for utdataformater (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | PDF-eksportkonfigurasjon |
MarkdownSaveOptions | Markdown-eksportkonfigurasjon |