Funkcje

Funkcje

Aspose.Words FOSS for Python jest biblioteką do konwersji dokumentów i wyodrębniania tekstu dla dokumentów Word. Całe publiczne API jest zbudowane wokół klasy Document.


Obsługiwane formaty wejściowe

Klasa Document ładuje pliki z tych formatów automatycznie na podstawie rozszerzenia pliku:

FormatRozszerzenia
Dokument Word.docx, .doc
Rich Text.rtf
Zwykły tekst.txt
Markdown.md

Formaty wyjściowe i opcje zapisu

Wywołaj Document.save() z stałą SaveFormat dla szybkiej konwersji lub przekaż obiekt opcji zapisu dla precyzyjnej kontroli.

WyjścieStała SaveFormatKlasa opcji zapisu
PDFSaveFormat.PDFPdfSaveOptions — konfiguruj poziom zgodności, jakość JPEG
MarkdownSaveFormat.MARKDOWNMarkdownSaveOptions — kontroluj eksport formatowania podkreślenia
Zwykły tekstSaveFormat.TEXT
Word (DOCX)SaveFormat.DOCX
Word (DOC)SaveFormat.DOC

Aby zobaczyć przykłady kodu i szczegóły konfiguracji opcji zapisu, zobacz Core Management.


Ekstrakcja tekstu

Document.get_text() zwraca pełną zawartość tekstową dowolnego załadowanego dokumentu bez zapisywania na dysku.


Obsługa obrazów

Dokumenty z osadzonymi obrazami mogą być konwertowane do wszystkich obsługiwanych formatów wyjściowych. Potok konwersji zachowuje zawartość obrazów podczas procesu eksportu.


Podsumowanie API

Klasa / MetodaRola
DocumentŁadowanie dokumentów, konwertowanie formatów, wyodrębnianie tekstu
SaveFormatStałe formatów wyjściowych (PDF, MARKDOWN, TEXT, DOC, DOCX)
PdfSaveOptionsKonfiguracja eksportu PDF
MarkdownSaveOptionsKonfiguracja eksportu Markdown
 Polski