Funktioner
Funktioner
Aspose.Words FOSS for Python är ett dokumentkonverterings- och textutvinningsbibliotek för Word-dokument. Hela det offentliga API:et är byggt kring klassen Document.
Stödda inmatningsformat
Klassen Document laddar filer från dessa format automatiskt baserat på filändelse:
| Format | Filändelser |
|---|---|
| Word-dokument | .docx, .doc |
| Rich Text | .rtf |
| Vanlig text | .txt |
| Markdown | .md |
Utdataformat och sparaalternativ
Anropa Document.save() med en SaveFormat-konstant för snabb konvertering, eller skicka ett save‑options object för finjusterad kontroll.
| Utdata | SaveFormat-konstant | Spara alternativklass |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — konfigurera efterlevnadsnivå, JPEG‑kvalitet | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — kontrollera export av understrykningens formatering |
| Vanlig text | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
För kodexempel och konfigurationsdetaljer för sparalternativ, se Core Management.
Textutvinning
Document.get_text() returnerar hela rentextinnehållet i vilket som helst laddat dokument utan att skriva till disk.
Bildstöd
Dokument med inbäddade bilder kan konverteras till alla stödda utdataformat. Konverteringspipeline bevarar bildinnehållet genom exportprocessen.
API‑sammanfattning
| Klass / Metod | Roll |
|---|---|
Document | Ladda dokument, konvertera format, extrahera text |
SaveFormat | Konstanter för utdataformat (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | PDF‑exportkonfiguration |
MarkdownSaveOptions | Markdown‑exportkonfiguration |