Funkcie
Funkcie
Aspose.Words FOSS for Python je knižnica na konverziu dokumentov a extrakciu textu pre dokumenty Word. Celé verejné API je postavené okolo triedy Document.
Podporované vstupné formáty
Trieda Document načítava súbory z týchto formátov automaticky na základe prípony súboru:
| Formát | Rozšírenia |
|---|---|
| Word dokument | .docx, .doc |
| Rich Text | .rtf |
| Plain Text | .txt |
| Markdown | .md |
Formáty výstupu a možnosti ukladania
Volajte Document.save() s konštantou SaveFormat pre rýchlu konverziu, alebo odovzdajte objekt save-options pre detailnú kontrolu.
| Výstup | Konštanta SaveFormat | Trieda Save Options |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — nastaviť úroveň súladu, kvalitu JPEG | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — ovládať export formátovania podčiarknutia |
| Čistý text | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Pre príklady kódu a podrobnosti o konfigurácii možností ukladania, pozrite si Core Management.
Extrahovanie textu
Document.get_text() vráti úplný plain-text obsah akéhokoľvek načítaného dokumentu bez zápisu na disk.
Podpora obrázkov
Dokumenty s vloženými obrázkami je možné konvertovať do všetkých podporovaných výstupných formátov. Konverzný pipeline zachováva obsah obrázkov počas exportného procesu.
Zhrnutie API
| Trieda / Metóda | Úloha |
|---|---|
Document | Načítať dokumenty, konvertovať formáty, extrahovať text |
SaveFormat | Konštanty výstupných formátov (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | Konfigurácia exportu PDF |
MarkdownSaveOptions | Konfigurácia exportu Markdown |