Kjerneadministrasjon

Kjerneadministrasjon

Kjerneadministrasjon

Document-klassen er det sentrale API-et for å laste inn Word-dokumenter og konvertere dem til andre formater. Denne siden dekker arbeidsflyter for formatkonvertering, konfigurasjon av lagringsalternativer og tekstuttrekk.


Laste inn og lagre

Last inn et dokument med Document() og kall save() med en SaveFormat konstant for å konvertere mellom formater. Støttede innganger: DOCX, DOC, RTF, TXT, Markdown. Støttede utganger: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Kall save() flere ganger på samme Document for å produsere flere utdataformater uten å laste på nytt.


PDF-eksport med PdfSaveOptions

For standard PDF‑utdata, send inn SaveFormat.PDF. For finjustert kontroll, bruk et PdfSaveOptions‑objekt:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions aksepterer innstillinger for JPEG-bildekvalitet (0–100, standard 100) og PDF-standardens samsvarsnivå (standard PDF/1.7).


Markdown-eksport med MarkdownSaveOptions

For standard Markdown‑utdata, send SaveFormat.MARKDOWN. Bruk MarkdownSaveOptions når du trenger å kontrollere formateringsadferd:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions støtter kontroll av bevaring av understrekingsformatering i utdata.


Tekstuttrekk

Uttrekk ren tekst fra ethvert lastet dokument med get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

For tekstfilutdata, bruk SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Vanlige problemer

IssueCauseFix
ModuleNotFoundErrorPakke ikke installertKjør pip install aspose-words-foss>=26.4.0
Tom tekst fra get_text()Inndatafilen er tom eller korruptBekreft at inndatafilen åpnes korrekt i en tekstbehandler
PDF-utdata mangler bilderBildeformatet støttes ikke av konverterenBruk en DOCX-inndata med standard innebygde bilder

API-referansesammendrag

Klasse / MetodeBeskrivelse
DocumentLast inn Word-dokumenter fra DOCX, DOC, RTF, TXT eller Markdown
Document.save()Lagre til PDF, Markdown, DOCX, DOC eller ren tekst
Document.get_text()Utdra ren tekstinnhold
SaveFormatKonstanter: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsKonfigurer PDF-kompatibilitet og JPEG-kvalitet
MarkdownSaveOptionsKonfigurer eksport av understrekingsformatering
 Norsk