Функции
Функции
Aspose.Words FOSS for Python е библиотека за конвертиране на документи и извличане на текст за Word документи. Целият публичен API е построен около класа Document.
Поддържани входни формати
Класът Document зарежда файлове от тези формати автоматично въз основа на разширението на файла:
| Формат | Разширения |
|---|---|
| Word Document | .docx, .doc |
| Rich Text | .rtf |
| Plain Text | .txt |
| Markdown | .md |
Изходни формати и опции за запазване
Извикайте Document.save() с константа SaveFormat за бързо конвертиране, или предайте обект save-options за фино управление.
| Изход | Константа SaveFormat | Клас за опции за запазване |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — конфигуриране на ниво на съответствие, качество на JPEG | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — контролиране на експорта на форматиране на подчертаване |
| Plain Text | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
За примери с код и подробности за конфигурацията на опциите за запазване, вижте Core Management.
Извличане на текст
Document.get_text() връща пълното чисто‑текстово съдържание на всеки зареден документ без записване на диск.
Поддръжка на изображения
Документите с вградени изображения могат да бъдат конвертирани във всички поддържани изходни формати. Конверсионната верига запазва съдържанието на изображенията по време на процеса на експортиране.
Обобщение на API
| Клас / Метод | Роля |
|---|---|
Document | Зареждане на документи, конвертиране на формати, извличане на текст |
SaveFormat | Константи за изходен формат (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | Конфигурация за експортиране в PDF |
MarkdownSaveOptions | Конфигурация за експортиране в Markdown |