Funkce
Funkce
Aspose.Words FOSS for Python je knihovna pro konverzi dokumentů a extrakci textu pro dokumenty Word. Celé veřejné API je postaveno kolem třídy Document.
Podporované vstupní formáty
Třída Document načítá soubory z těchto formátů automaticky na základě přípony souboru:
| Formát | Rozšíření |
|---|---|
| Word dokument | .docx, .doc |
| Rich Text | .rtf |
| Prostý text | .txt |
| Markdown | .md |
Formáty výstupu a možnosti uložení
Zavolejte Document.save() s konstantou SaveFormat pro rychlou konverzi, nebo předávejte objekt save-options pro jemnou kontrolu.
| Výstup | SaveFormat konstanta | Třída Save Options |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — konfigurovat úroveň souladu, kvalitu JPEG | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — ovládat export formátování podtržení |
| Plain Text | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Pro příklady kódu a podrobnosti o konfiguraci možností uložení viz Core Management.
Extrahování textu
Document.get_text() vrací celý prostý textový obsah libovolného načteného dokumentu, aniž by jej zapisoval na disk.
Podpora obrázků
Dokumenty s vloženými obrázky lze převést do všech podporovaných výstupních formátů. Převodní pipeline zachovává obsah obrázků během exportního procesu.
Přehled API
| Třída / Metoda | Úloha |
|---|---|
Document | Načítání dokumentů, konverze formátů, extrakce textu |
SaveFormat | Konstanty výstupních formátů (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | Konfigurace exportu PDF |
MarkdownSaveOptions | Konfigurace exportu Markdown |