Основно управление
Основно управление
Класът Document е централният API за зареждане на Word документи и конвертиране им в други формати. Тази страница обхваща работните процеси за конвертиране на формати, конфигурацията на опциите за запазване и извличането на текст.
Зареждане и запазване
Заредете документ с Document() и извикайте save() с константа SaveFormat, за да конвертирате между формати. Поддържани входове: DOCX, DOC, RTF, TXT, Markdown. Поддържани изходи: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Извикайте save() многократно върху същия Document, за да произведете множество изходни формати без презареждане.
PDF експортиране с PdfSaveOptions
За подразбиращ се PDF изход, предайте SaveFormat.PDF. За детайлно управление, използвайте обект PdfSaveOptions:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions приема настройки за качество на JPEG изображението (0–100, по подразбиране 100) и ниво на съответствие със стандартите на PDF (по подразбиране PDF/1.7).
Експорт в Markdown с MarkdownSaveOptions
За подразбиращ се Markdown изход, предайте SaveFormat.MARKDOWN. Използвайте MarkdownSaveOptions, когато трябва да контролирате поведението на форматирането:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions поддържа контролиране на запазването на форматирането на подчертаване в изхода.
Извличане на текст
Извлечете чист текст от всеки зареден документ с get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()За изход на текстов файл използвайте SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Чести проблеми
| Проблем | Причина | Решение |
|---|---|---|
ModuleNotFoundError | Пакетът не е инсталиран | Изпълнете pip install aspose-words-foss>=26.4.0 |
Празен текст от get_text() | Входният файл е празен или повреден | Проверете дали входният файл се отваря правилно в текстов процесор |
| PDF изходът липсва изображения | Форматът на изображението не се поддържа от конвертора | Използвайте DOCX вход с обичайни вградени изображения |
Обобщение на API справката
| Клас / Метод | Описание |
|---|---|
Document | Зареждане на Word документи от DOCX, DOC, RTF, TXT или Markdown |
Document.save() | Записване в PDF, Markdown, DOCX, DOC или обикновен текст |
Document.get_text() | Извличане на съдържание като обикновен текст |
SaveFormat | Константи: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Конфигуриране на съответствието на PDF и качеството на JPEG |
MarkdownSaveOptions | Конфигуриране на експорта на форматиране на подчертаване |