Функції
Функції
Aspose.Words FOSS for Python — це бібліотека для конвертації документів та вилучення тексту з документів Word. Увесь публічний API побудований навколо класу Document.
Підтримувані формати вводу
Клас Document завантажує файли з цих форматів автоматично на основі розширення файлу:
| Формат | Розширення |
|---|---|
| Документ Word | .docx, .doc |
| Rich Text | .rtf |
| Звичайний текст | .txt |
| Markdown | .md |
Формати виводу та параметри збереження
Викличте Document.save() з константою SaveFormat для швидкого перетворення, або передайте об’єкт параметрів збереження для детального керування.
| Вихід | Константа SaveFormat | Клас параметрів збереження |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — налаштувати рівень сумісності, якість JPEG | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — керувати експортом форматування підкреслення |
| Plain Text | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Для прикладів коду та деталей налаштування параметрів збереження дивіться Core Management.
Видобуток тексту
Document.get_text() повертає повний plain‑text вміст будь‑якого завантаженого документа без запису на диск.
Підтримка зображень
Документи з вбудованими зображеннями можна конвертувати у всі підтримувані формати виводу. Конвеєр конвертації зберігає вміст зображень під час процесу експорту.
Огляд API
| Клас / Метод | Роль |
|---|---|
Document | Завантаження документів, конвертація форматів, витяг тексту |
SaveFormat | Константи форматів виводу (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | Налаштування експорту PDF |
MarkdownSaveOptions | Налаштування експорту Markdown |