Kernverwaltung

Kernverwaltung

Die Document‑Klasse ist die zentrale API zum Laden von Word‑Dokumenten und deren Konvertierung in andere Formate. Diese Seite behandelt Workflows zur Formatkonvertierung, die Konfiguration von Speicheroptionen und die Textextraktion.


Laden und Speichern

Laden Sie ein Dokument mit Document() und rufen Sie save() mit einer SaveFormat‑Konstanten auf, um zwischen Formaten zu konvertieren. Unterstützte Eingaben: DOCX, DOC, RTF, TXT, Markdown. Unterstützte Ausgaben: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Rufen Sie save() mehrfach für dasselbe Document auf, um mehrere Ausgabeformate zu erzeugen, ohne neu zu laden.


PDF-Export mit PdfSaveOptions

Für die standardmäßige PDF‑Ausgabe übergeben Sie SaveFormat.PDF. Für eine feinkörnige Steuerung verwenden Sie ein PdfSaveOptions‑Objekt:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions akzeptiert Einstellungen für die JPEG‑Bildqualität (0–100, Standard 100) und den PDF‑Standardkonformitätsgrad (Standard PDF/1.7).


Markdown-Export mit MarkdownSaveOptions

Für die standardmäßige Markdown‑Ausgabe übergeben Sie SaveFormat.MARKDOWN. Verwenden Sie MarkdownSaveOptions, wenn Sie das Formatierungsverhalten steuern müssen:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions unterstützt die Steuerung der Unterstreichungsformatierungserhaltung in der Ausgabe.


Textextraktion

Extrahieren Sie Klartext aus jedem geladenen Dokument mit get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Für die Textdateiausgabe verwenden Sie SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Häufige Probleme

ProblemUrsacheLösung
ModuleNotFoundErrorPaket nicht installiertFühren Sie pip install aspose-words-foss>=26.4.0 aus
Leerer Text von get_text()Eingabedatei ist leer oder beschädigtÜberprüfen Sie, ob die Eingabedatei in einem Textverarbeitungsprogramm korrekt geöffnet wird
PDF-Ausgabe ohne BilderBildformat wird vom Konverter nicht unterstütztVerwenden Sie eine DOCX-Eingabe mit standardmäßig eingebetteten Bildern

API-Referenzübersicht

Class / MethodDescription
DocumentWord‑Dokumente aus DOCX, DOC, RTF, TXT oder Markdown laden
Document.save()Als PDF, Markdown, DOCX, DOC oder Nur‑Text speichern
Document.get_text()Klartextinhalt extrahieren
SaveFormatKonstanten: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsPDF‑Konformität und JPEG‑Qualität konfigurieren
MarkdownSaveOptionsExport der Unterstreichungsformatierung konfigurieren
 Deutsch