Funkce

Funkce

Aspose.Words FOSS for Python je knihovna pro konverzi dokumentů a extrakci textu pro dokumenty Word. Celé veřejné API je postaveno kolem třídy Document.


Podporované vstupní formáty

Třída Document načítá soubory z těchto formátů automaticky na základě přípony souboru:

FormátRozšíření
Word dokument.docx, .doc
Rich Text.rtf
Prostý text.txt
Markdown.md

Formáty výstupu a možnosti uložení

Zavolejte Document.save() s konstantou SaveFormat pro rychlou konverzi, nebo předávejte objekt save-options pro jemnou kontrolu.

VýstupSaveFormat konstantaTřída Save Options
PDFSaveFormat.PDFPdfSaveOptions — konfigurovat úroveň souladu, kvalitu JPEG
MarkdownSaveFormat.MARKDOWNMarkdownSaveOptions — ovládat export formátování podtržení
Plain TextSaveFormat.TEXT
Word (DOCX)SaveFormat.DOCX
Word (DOC)SaveFormat.DOC

Pro příklady kódu a podrobnosti o konfiguraci možností uložení viz Core Management.


Extrahování textu

Document.get_text() vrací celý prostý textový obsah libovolného načteného dokumentu, aniž by jej zapisoval na disk.


Podpora obrázků

Dokumenty s vloženými obrázky lze převést do všech podporovaných výstupních formátů. Převodní pipeline zachovává obsah obrázků během exportního procesu.


Přehled API

Třída / MetodaÚloha
DocumentNačítání dokumentů, konverze formátů, extrakce textu
SaveFormatKonstanty výstupních formátů (PDF, MARKDOWN, TEXT, DOC, DOCX)
PdfSaveOptionsKonfigurace exportu PDF
MarkdownSaveOptionsKonfigurace exportu Markdown
 Čeština