Kernverwaltung
Kernverwaltung
Die Document‑Klasse ist die zentrale API zum Laden von Word‑Dokumenten und deren Konvertierung in andere Formate. Diese Seite behandelt Workflows zur Formatkonvertierung, die Konfiguration von Speicheroptionen und die Textextraktion.
Laden und Speichern
Laden Sie ein Dokument mit Document() und rufen Sie save() mit einer SaveFormat‑Konstanten auf, um zwischen Formaten zu konvertieren. Unterstützte Eingaben: DOCX, DOC, RTF, TXT, Markdown. Unterstützte Ausgaben: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Rufen Sie save() mehrfach für dasselbe Document auf, um mehrere Ausgabeformate zu erzeugen, ohne neu zu laden.
PDF-Export mit PdfSaveOptions
Für die standardmäßige PDF‑Ausgabe übergeben Sie SaveFormat.PDF. Für eine feinkörnige Steuerung verwenden Sie ein PdfSaveOptions‑Objekt:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions akzeptiert Einstellungen für die JPEG‑Bildqualität (0–100, Standard 100) und den PDF‑Standardkonformitätsgrad (Standard PDF/1.7).
Markdown-Export mit MarkdownSaveOptions
Für die standardmäßige Markdown‑Ausgabe übergeben Sie SaveFormat.MARKDOWN. Verwenden Sie MarkdownSaveOptions, wenn Sie das Formatierungsverhalten steuern müssen:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions unterstützt die Steuerung der Unterstreichungsformatierungserhaltung in der Ausgabe.
Textextraktion
Extrahieren Sie Klartext aus jedem geladenen Dokument mit get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Für die Textdateiausgabe verwenden Sie SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Häufige Probleme
| Problem | Ursache | Lösung |
|---|---|---|
ModuleNotFoundError | Paket nicht installiert | Führen Sie pip install aspose-words-foss>=26.4.0 aus |
Leerer Text von get_text() | Eingabedatei ist leer oder beschädigt | Überprüfen Sie, ob die Eingabedatei in einem Textverarbeitungsprogramm korrekt geöffnet wird |
| PDF-Ausgabe ohne Bilder | Bildformat wird vom Konverter nicht unterstützt | Verwenden Sie eine DOCX-Eingabe mit standardmäßig eingebetteten Bildern |
API-Referenzübersicht
| Class / Method | Description |
|---|---|
Document | Word‑Dokumente aus DOCX, DOC, RTF, TXT oder Markdown laden |
Document.save() | Als PDF, Markdown, DOCX, DOC oder Nur‑Text speichern |
Document.get_text() | Klartextinhalt extrahieren |
SaveFormat | Konstanten: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | PDF‑Konformität und JPEG‑Qualität konfigurieren |
MarkdownSaveOptions | Export der Unterstreichungsformatierung konfigurieren |