Керування ядром

Керування ядром

Керування ядром

Клас Document є центральним API для завантаження документів Word та їх конвертації в інші формати. На цій сторінці розглядаються робочі процеси конвертації форматів, налаштування параметрів збереження та витяг тексту.


Завантаження та збереження

Завантажте документ за допомогою Document() і викличте save() з константою SaveFormat для конвертації між форматами. Підтримувані вхідні формати: DOCX, DOC, RTF, TXT, Markdown. Підтримувані вихідні формати: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Викличте save() кілька разів на тому ж Document, щоб створити кілька форматів виводу без перезавантаження.


Експорт PDF за допомогою PdfSaveOptions

Для виведення PDF за замовчуванням передайте SaveFormat.PDF. Для тонкого керування використовуйте об’єкт PdfSaveOptions:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export
pdf_opts = PdfSaveOptions()
pdf_opts.jpeg_quality = 90
pdf_opts.compliance = "PDF17"
doc.save("custom.pdf", pdf_opts)

Встановіть jpeg_quality (0–100, за замовчуванням 100) та compliance (за замовчуванням "PDF17") у об’єкті options, щоб керувати виводом PDF.


Експорт у Markdown за допомогою MarkdownSaveOptions

Для виведення за замовчуванням у форматі Markdown передайте SaveFormat.MARKDOWN. Використовуйте MarkdownSaveOptions, коли потрібно керувати поведінкою форматування:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Preserve underline formatting in Markdown output
md_opts = MarkdownSaveOptions()
md_opts.export_underline_formatting = True
doc.save("with_underlines.md", md_opts)

MarkdownSaveOptions властивості:

ВластивістьТипЗа замовчуваннямОпис
export_underline_formattingboolFalseЗберігати підкреслення у виводі Markdown

Видобування тексту

Витягнути простий текст з будь‑якого завантаженого документа за допомогою get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Для виведення текстового файлу використовуйте SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Поширені проблеми

ПроблемаПричинаВиправлення
ModuleNotFoundErrorПакет не встановленоЗапустіть pip install aspose-words-foss>=26.4.0
Порожній текст від get_text()Вхідний файл порожній або пошкодженийПеревірте, чи відкривається вхідний файл правильно у текстовому процесорі
У PDF‑виводі відсутні зображенняФормат зображення не підтримується конвертеромВикористайте DOCX‑вхід з стандартними вбудованими зображеннями

Огляд довідника API

Клас / МетодОпис
DocumentЗавантажити Word‑документи з DOCX, DOC, RTF, TXT або Markdown
Document.save()Зберегти у PDF, Markdown, DOCX, DOC або простий текст
Document.get_text()Витягнути простий текстовий вміст
SaveFormatКонстанти: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsНалаштувати відповідність PDF та якість JPEG
MarkdownSaveOptionsНалаштувати експорт форматування підкреслення
 Українська