Funkcie

Funkcie

Aspose.Words FOSS for Python je knižnica na konverziu dokumentov a extrakciu textu pre dokumenty Word. Celé verejné API je postavené okolo triedy Document.


Podporované vstupné formáty

Trieda Document načítava súbory z týchto formátov automaticky na základe prípony súboru:

FormátRozšírenia
Word dokument.docx, .doc
Rich Text.rtf
Plain Text.txt
Markdown.md

Formáty výstupu a možnosti ukladania

Volajte Document.save() s konštantou SaveFormat pre rýchlu konverziu, alebo odovzdajte objekt save-options pre detailnú kontrolu.

VýstupKonštanta SaveFormatTrieda Save Options
PDFSaveFormat.PDFPdfSaveOptions — nastaviť úroveň súladu, kvalitu JPEG
MarkdownSaveFormat.MARKDOWNMarkdownSaveOptions — ovládať export formátovania podčiarknutia
Čistý textSaveFormat.TEXT
Word (DOCX)SaveFormat.DOCX
Word (DOC)SaveFormat.DOC

Pre príklady kódu a podrobnosti o konfigurácii možností ukladania, pozrite si Core Management.


Extrahovanie textu

Document.get_text() vráti úplný plain-text obsah akéhokoľvek načítaného dokumentu bez zápisu na disk.


Podpora obrázkov

Dokumenty s vloženými obrázkami je možné konvertovať do všetkých podporovaných výstupných formátov. Konverzný pipeline zachováva obsah obrázkov počas exportného procesu.


Zhrnutie API

Trieda / MetódaÚloha
DocumentNačítať dokumenty, konvertovať formáty, extrahovať text
SaveFormatKonštanty výstupných formátov (PDF, MARKDOWN, TEXT, DOC, DOCX)
PdfSaveOptionsKonfigurácia exportu PDF
MarkdownSaveOptionsKonfigurácia exportu Markdown
 Slovenčina