Funktionen
Funktionen
Aspose.Words FOSS for Python ist eine Bibliothek für Dokumentkonvertierung und Textextraktion für Word‑Dokumente. Die gesamte öffentliche API ist um die Document‑Klasse herum aufgebaut.
Unterstützte Eingabeformate
Die Document‑Klasse lädt Dateien aus diesen Formaten automatisch basierend auf der Dateierweiterung:
| Format | Erweiterungen |
|---|---|
| Word-Dokument | .docx, .doc |
| Rich-Text | .rtf |
| Klartext | .txt |
| Markdown | .md |
Ausgabeformate und Speicheroptionen
Rufen Sie Document.save() mit einer SaveFormat‑Konstanten für eine schnelle Konvertierung auf oder übergeben Sie ein save-options‑Objekt für eine feinkörnige Steuerung.
| Ausgabe | SaveFormat-Konstante | Save-Options-Klasse |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — Konformitätsstufe und JPEG-Qualität konfigurieren | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — Export der Unterstreichungsformatierung steuern |
| Klartext | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Für Codebeispiele und Details zur Konfiguration von Speicheroptionen siehe Core Management.
Textextraktion
Document.get_text() gibt den vollständigen Plain-Text-Inhalt jedes geladenen Dokuments zurück, ohne auf die Festplatte zu schreiben.
Bildunterstützung
Dokumente mit eingebetteten Bildern können in alle unterstützten Ausgabeformate konvertiert werden. Die Konvertierungspipeline bewahrt den Bildinhalt während des Exportvorgangs.
API Zusammenfassung
| Klasse / Methode | Rolle |
|---|---|
Document | Dokumente laden, Formate konvertieren, Text extrahieren |
SaveFormat | Ausgabeformat‑Konstanten (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | PDF‑Exportkonfiguration |
MarkdownSaveOptions | Markdown‑Exportkonfiguration |