Zarządzanie rdzeniem

Zarządzanie rdzeniem

Zarządzanie rdzeniem

Klasa Document jest centralnym API do ładowania dokumentów Word i konwertowania ich na inne formaty. Ta strona opisuje przepływy konwersji formatów, konfigurację opcji zapisu oraz ekstrakcję tekstu.


Ładowanie i zapisywanie

Załaduj dokument przy użyciu Document() i wywołaj save() z stałą SaveFormat, aby konwertować między formatami. Obsługiwane wejścia: DOCX, DOC, RTF, TXT, Markdown. Obsługiwane wyjścia: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Wywołaj save() wielokrotnie na tym samym Document, aby uzyskać wiele formatów wyjściowych bez ponownego ładowania.


Eksport PDF z PdfSaveOptions

Aby uzyskać domyślne wyjście PDF, przekaż SaveFormat.PDF. Aby uzyskać precyzyjną kontrolę, użyj obiektu PdfSaveOptions:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions akceptuje ustawienia jakości obrazu JPEG (0–100, domyślnie 100) oraz poziomu zgodności ze standardami PDF (domyślnie PDF/1.7).


Eksport Markdown z użyciem MarkdownSaveOptions

Aby uzyskać domyślny wynik Markdown, przekaż SaveFormat.MARKDOWN. Użyj MarkdownSaveOptions, gdy potrzebujesz kontrolować zachowanie formatowania:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions obsługuje kontrolowanie zachowania formatowania podkreślenia w wyjściu.


Ekstrakcja tekstu

Wyodrębnij zwykły tekst z dowolnego załadowanego dokumentu przy użyciu get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Aby uzyskać wyjście w pliku tekstowym, użyj SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Typowe problemy

IssueCauseFix
ModuleNotFoundErrorPakiet nie jest zainstalowanyUruchom pip install aspose-words-foss>=26.4.0
Pusty tekst z get_text()Plik wejściowy jest pusty lub uszkodzonySprawdź, czy plik wejściowy otwiera się poprawnie w edytorze tekstu
Brak obrazów w wyjściowym PDFFormat obrazu nie jest obsługiwany przez konwerterUżyj pliku DOCX z standardowo osadzonymi obrazami

Podsumowanie odniesienia API

Klasa / MetodaOpis
DocumentWczytaj dokumenty Word z formatów DOCX, DOC, RTF, TXT lub Markdown
Document.save()Zapisz jako PDF, Markdown, DOCX, DOC lub zwykły tekst
Document.get_text()Wyodrębnij zawartość jako zwykły tekst
SaveFormatStałe: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsSkonfiguruj zgodność PDF i jakość JPEG
MarkdownSaveOptionsSkonfiguruj eksport formatowania podkreślenia
 Polski