Kernbeheer

Kernbeheer

De Document-klasse is de centrale API voor het laden van Word‑documenten en het converteren ervan naar andere formaten. Deze pagina behandelt workflows voor formaatconversie, configuratie van save‑opties en tekstextractie.


Laden en opslaan

Laad een document met Document() en roep save() aan met een SaveFormat-constante om tussen formaten te converteren. Ondersteunde invoerformaten: DOCX, DOC, RTF, TXT, Markdown. Ondersteunde uitvoerformaten: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Roep save() meerdere keren aan op dezelfde Document om meerdere uitvoerformaten te produceren zonder opnieuw te laden.


PDF-export met PdfSaveOptions

Voor standaard PDF‑output, geef SaveFormat.PDF door. Voor fijnmazige controle, gebruik een PdfSaveOptions‑object:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions accepteert instellingen voor JPEG‑beeldkwaliteit (0–100, standaard 100) en PDF‑standaarden‑nalevingsniveau (standaard PDF/1.7).


Markdown-export met MarkdownSaveOptions

Voor standaard Markdown‑output, geef SaveFormat.MARKDOWN door. Gebruik MarkdownSaveOptions wanneer je het opmaakgedrag moet regelen:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions ondersteunt het regelen van het behoud van onderstrepingsopmaak in de uitvoer.


Tekstextractie

Extraheer platte tekst uit elk geladen document met get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Voor tekstbestanduitvoer, gebruik SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Veelvoorkomende problemen

ProbleemOorzaakOplossing
ModuleNotFoundErrorPakket niet geïnstalleerdVoer pip install aspose-words-foss>=26.4.0 uit
Lege tekst van get_text()Invoerbestand is leeg of beschadigdControleer of het invoerbestand correct opent in een tekstverwerker
PDF‑uitvoer mist afbeeldingenAfbeeldingsformaat wordt niet ondersteund door de converterGebruik een DOCX‑invoer met standaard ingesloten afbeeldingen

API-referentie Samenvatting

Class / MethodDescription
DocumentLaad Word‑documenten van DOCX, DOC, RTF, TXT of Markdown
Document.save()Opslaan naar PDF, Markdown, DOCX, DOC of platte tekst
Document.get_text()Extraheer platte tekstinhoud
SaveFormatConstanten: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsConfigureer PDF‑conformiteit en JPEG‑kwaliteit
MarkdownSaveOptionsConfigureer export van onderstrepingsopmaak
 Nederlands