Керування ядром
Керування ядром
Клас Document є центральним API для завантаження документів Word та їх конвертації в інші формати. На цій сторінці розглядаються робочі процеси конвертації форматів, налаштування параметрів збереження та витяг тексту.
Завантаження та збереження
Завантажте документ за допомогою Document() і викличте save() з константою SaveFormat для конвертації між форматами. Підтримувані вхідні формати: DOCX, DOC, RTF, TXT, Markdown. Підтримувані вихідні формати: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Викличте save() кілька разів на тому ж Document, щоб створити кілька форматів виводу без перезавантаження.
Експорт PDF за допомогою PdfSaveOptions
Для виведення PDF за замовчуванням передайте SaveFormat.PDF. Для тонкого керування використовуйте об’єкт PdfSaveOptions:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export
pdf_opts = PdfSaveOptions()
pdf_opts.jpeg_quality = 90
pdf_opts.compliance = "PDF17"
doc.save("custom.pdf", pdf_opts)Встановіть jpeg_quality (0–100, за замовчуванням 100) та compliance (за замовчуванням "PDF17") у об’єкті options, щоб керувати виводом PDF.
Експорт у Markdown за допомогою MarkdownSaveOptions
Для виведення за замовчуванням у форматі Markdown передайте SaveFormat.MARKDOWN. Використовуйте MarkdownSaveOptions, коли потрібно керувати поведінкою форматування:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Preserve underline formatting in Markdown output
md_opts = MarkdownSaveOptions()
md_opts.export_underline_formatting = True
doc.save("with_underlines.md", md_opts)MarkdownSaveOptions властивості:
| Властивість | Тип | За замовчуванням | Опис |
|---|---|---|---|
export_underline_formatting | bool | False | Зберігати підкреслення у виводі Markdown |
Видобування тексту
Витягнути простий текст з будь‑якого завантаженого документа за допомогою get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Для виведення текстового файлу використовуйте SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Поширені проблеми
| Проблема | Причина | Виправлення |
|---|---|---|
ModuleNotFoundError | Пакет не встановлено | Запустіть pip install aspose-words-foss>=26.4.0 |
Порожній текст від get_text() | Вхідний файл порожній або пошкоджений | Перевірте, чи відкривається вхідний файл правильно у текстовому процесорі |
| У PDF‑виводі відсутні зображення | Формат зображення не підтримується конвертером | Використайте DOCX‑вхід з стандартними вбудованими зображеннями |
Огляд довідника API
| Клас / Метод | Опис |
|---|---|
Document | Завантажити Word‑документи з DOCX, DOC, RTF, TXT або Markdown |
Document.save() | Зберегти у PDF, Markdown, DOCX, DOC або простий текст |
Document.get_text() | Витягнути простий текстовий вміст |
SaveFormat | Константи: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Налаштувати відповідність PDF та якість JPEG |
MarkdownSaveOptions | Налаштувати експорт форматування підкреслення |