Kernbeheer
Kernbeheer
De Document-klasse is de centrale API voor het laden van Word‑documenten en het converteren ervan naar andere formaten. Deze pagina behandelt workflows voor formaatconversie, configuratie van save‑opties en tekstextractie.
Laden en opslaan
Laad een document met Document() en roep save() aan met een SaveFormat-constante om tussen formaten te converteren. Ondersteunde invoerformaten: DOCX, DOC, RTF, TXT, Markdown. Ondersteunde uitvoerformaten: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Roep save() meerdere keren aan op dezelfde Document om meerdere uitvoerformaten te produceren zonder opnieuw te laden.
PDF-export met PdfSaveOptions
Voor standaard PDF‑output, geef SaveFormat.PDF door. Voor fijnmazige controle, gebruik een PdfSaveOptions‑object:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions accepteert instellingen voor JPEG‑beeldkwaliteit (0–100, standaard 100) en PDF‑standaarden‑nalevingsniveau (standaard PDF/1.7).
Markdown-export met MarkdownSaveOptions
Voor standaard Markdown‑output, geef SaveFormat.MARKDOWN door. Gebruik MarkdownSaveOptions wanneer je het opmaakgedrag moet regelen:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions ondersteunt het regelen van het behoud van onderstrepingsopmaak in de uitvoer.
Tekstextractie
Extraheer platte tekst uit elk geladen document met get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Voor tekstbestanduitvoer, gebruik SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Veelvoorkomende problemen
| Probleem | Oorzaak | Oplossing |
|---|---|---|
ModuleNotFoundError | Pakket niet geïnstalleerd | Voer pip install aspose-words-foss>=26.4.0 uit |
Lege tekst van get_text() | Invoerbestand is leeg of beschadigd | Controleer of het invoerbestand correct opent in een tekstverwerker |
| PDF‑uitvoer mist afbeeldingen | Afbeeldingsformaat wordt niet ondersteund door de converter | Gebruik een DOCX‑invoer met standaard ingesloten afbeeldingen |
API-referentie Samenvatting
| Class / Method | Description |
|---|---|
Document | Laad Word‑documenten van DOCX, DOC, RTF, TXT of Markdown |
Document.save() | Opslaan naar PDF, Markdown, DOCX, DOC of platte tekst |
Document.get_text() | Extraheer platte tekstinhoud |
SaveFormat | Constanten: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Configureer PDF‑conformiteit en JPEG‑kwaliteit |
MarkdownSaveOptions | Configureer export van onderstrepingsopmaak |