Zarządzanie rdzeniem
Zarządzanie rdzeniem
Klasa Document jest centralnym API do ładowania dokumentów Word i konwertowania ich na inne formaty. Ta strona opisuje przepływy konwersji formatów, konfigurację opcji zapisu oraz ekstrakcję tekstu.
Ładowanie i zapisywanie
Załaduj dokument przy użyciu Document() i wywołaj save() z stałą SaveFormat, aby konwertować między formatami. Obsługiwane wejścia: DOCX, DOC, RTF, TXT, Markdown. Obsługiwane wyjścia: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Wywołaj save() wielokrotnie na tym samym Document, aby uzyskać wiele formatów wyjściowych bez ponownego ładowania.
Eksport PDF z PdfSaveOptions
Aby uzyskać domyślne wyjście PDF, przekaż SaveFormat.PDF. Aby uzyskać precyzyjną kontrolę, użyj obiektu PdfSaveOptions:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions akceptuje ustawienia jakości obrazu JPEG (0–100, domyślnie 100) oraz poziomu zgodności ze standardami PDF (domyślnie PDF/1.7).
Eksport Markdown z użyciem MarkdownSaveOptions
Aby uzyskać domyślny wynik Markdown, przekaż SaveFormat.MARKDOWN. Użyj MarkdownSaveOptions, gdy potrzebujesz kontrolować zachowanie formatowania:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions obsługuje kontrolowanie zachowania formatowania podkreślenia w wyjściu.
Ekstrakcja tekstu
Wyodrębnij zwykły tekst z dowolnego załadowanego dokumentu przy użyciu get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Aby uzyskać wyjście w pliku tekstowym, użyj SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Typowe problemy
| Issue | Cause | Fix |
|---|---|---|
ModuleNotFoundError | Pakiet nie jest zainstalowany | Uruchom pip install aspose-words-foss>=26.4.0 |
Pusty tekst z get_text() | Plik wejściowy jest pusty lub uszkodzony | Sprawdź, czy plik wejściowy otwiera się poprawnie w edytorze tekstu |
| Brak obrazów w wyjściowym PDF | Format obrazu nie jest obsługiwany przez konwerter | Użyj pliku DOCX z standardowo osadzonymi obrazami |
Podsumowanie odniesienia API
| Klasa / Metoda | Opis |
|---|---|
Document | Wczytaj dokumenty Word z formatów DOCX, DOC, RTF, TXT lub Markdown |
Document.save() | Zapisz jako PDF, Markdown, DOCX, DOC lub zwykły tekst |
Document.get_text() | Wyodrębnij zawartość jako zwykły tekst |
SaveFormat | Stałe: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Skonfiguruj zgodność PDF i jakość JPEG |
MarkdownSaveOptions | Skonfiguruj eksport formatowania podkreślenia |