Ominaisuudet
Ominaisuudet
Aspose.Words FOSS for Python on asiakirjojen muuntamiseen ja tekstin poimintaan tarkoitettu kirjasto Word-asiakirjoille. Koko julkinen API on rakennettu Document-luokan ympärille.
Tuetut syötteiden formaatit
Document-luokka lataa tiedostoja näistä formaateista automaattisesti tiedostopäätteen perusteella:
| Muoto | Laajennukset |
|---|---|
| Word-asiakirja | .docx, .doc |
| Rich Text | .rtf |
| Pelkkä teksti | .txt |
| Markdown | .md |
Tulostusmuodot ja tallennusasetukset
Kutsu Document.save() SaveFormat-vakiolla nopeaa muunnosta varten, tai anna tallennusasetusten objekti tarkempaa hallintaa varten.
| Tuloste | SaveFormat-vakio | Tallennusasetusten luokka |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — määritä yhteensopivuustaso, JPEG-laatu | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — hallinnoi alleviivauksen muotoilun vientiä |
| Pelkkä teksti | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Koodiesimerkeistä ja tallennusasetusten määrityksistä katso Core Management.
Tekstin poiminta
Document.get_text() palauttaa minkä tahansa ladatun asiakirjan täyden pelkkätekstisisällön kirjoittamatta levylle.
Kuvan tuki
Upotettuja kuvia sisältävät asiakirjat voidaan muuntaa kaikkiin tuettuihin tulostomuotoihin. Muunnosputki säilyttää kuvasisällön vientiprosessin aikana.
API Yhteenveto
| Luokka / Metodi | Rooli |
|---|---|
Document | Lataa asiakirjoja, muunna formaatteja, poimi teksti |
SaveFormat | Tulostusmuodon vakioita (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | PDF-vientiasetukset |
MarkdownSaveOptions | Markdown-vientiasetukset |