Основно управление

Основно управление

Основно управление

Класът Document е централният API за зареждане на Word документи и конвертиране им в други формати. Тази страница обхваща работните процеси за конвертиране на формати, конфигурацията на опциите за запазване и извличането на текст.


Зареждане и запазване

Заредете документ с Document() и извикайте save() с константа SaveFormat, за да конвертирате между формати. Поддържани входове: DOCX, DOC, RTF, TXT, Markdown. Поддържани изходи: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Извикайте save() многократно върху същия Document, за да произведете множество изходни формати без презареждане.


PDF експортиране с PdfSaveOptions

За подразбиращ се PDF изход, предайте SaveFormat.PDF. За детайлно управление, използвайте обект PdfSaveOptions:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions приема настройки за качество на JPEG изображението (0–100, по подразбиране 100) и ниво на съответствие със стандартите на PDF (по подразбиране PDF/1.7).


Експорт в Markdown с MarkdownSaveOptions

За подразбиращ се Markdown изход, предайте SaveFormat.MARKDOWN. Използвайте MarkdownSaveOptions, когато трябва да контролирате поведението на форматирането:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions поддържа контролиране на запазването на форматирането на подчертаване в изхода.


Извличане на текст

Извлечете чист текст от всеки зареден документ с get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

За изход на текстов файл използвайте SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Чести проблеми

ПроблемПричинаРешение
ModuleNotFoundErrorПакетът не е инсталиранИзпълнете pip install aspose-words-foss>=26.4.0
Празен текст от get_text()Входният файл е празен или повреденПроверете дали входният файл се отваря правилно в текстов процесор
PDF изходът липсва изображенияФорматът на изображението не се поддържа от конвертораИзползвайте DOCX вход с обичайни вградени изображения

Обобщение на API справката

Клас / МетодОписание
DocumentЗареждане на Word документи от DOCX, DOC, RTF, TXT или Markdown
Document.save()Записване в PDF, Markdown, DOCX, DOC или обикновен текст
Document.get_text()Извличане на съдържание като обикновен текст
SaveFormatКонстанти: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsКонфигуриране на съответствието на PDF и качеството на JPEG
MarkdownSaveOptionsКонфигуриране на експорта на форматиране на подчертаване
 Български