Funkcje
Funkcje
Aspose.Words FOSS for Python jest biblioteką do konwersji dokumentów i wyodrębniania tekstu dla dokumentów Word. Całe publiczne API jest zbudowane wokół klasy Document.
Obsługiwane formaty wejściowe
Klasa Document ładuje pliki z tych formatów automatycznie na podstawie rozszerzenia pliku:
| Format | Rozszerzenia |
|---|---|
| Dokument Word | .docx, .doc |
| Rich Text | .rtf |
| Zwykły tekst | .txt |
| Markdown | .md |
Formaty wyjściowe i opcje zapisu
Wywołaj Document.save() z stałą SaveFormat dla szybkiej konwersji lub przekaż obiekt opcji zapisu dla precyzyjnej kontroli.
| Wyjście | Stała SaveFormat | Klasa opcji zapisu |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — konfiguruj poziom zgodności, jakość JPEG | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — kontroluj eksport formatowania podkreślenia |
| Zwykły tekst | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Aby zobaczyć przykłady kodu i szczegóły konfiguracji opcji zapisu, zobacz Core Management.
Ekstrakcja tekstu
Document.get_text() zwraca pełną zawartość tekstową dowolnego załadowanego dokumentu bez zapisywania na dysku.
Obsługa obrazów
Dokumenty z osadzonymi obrazami mogą być konwertowane do wszystkich obsługiwanych formatów wyjściowych. Potok konwersji zachowuje zawartość obrazów podczas procesu eksportu.
Podsumowanie API
| Klasa / Metoda | Rola |
|---|---|
Document | Ładowanie dokumentów, konwertowanie formatów, wyodrębnianie tekstu |
SaveFormat | Stałe formatów wyjściowych (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | Konfiguracja eksportu PDF |
MarkdownSaveOptions | Konfiguracja eksportu Markdown |