Kerneadministration

Kerneadministration

Kerneadministration

Klassen Document er det centrale API til indlæsning af Word-dokumenter og konvertering til andre formater. Denne side dækker arbejdsprocesser for formatkonvertering, konfiguration af gemmeindstillinger og tekstudtræk.


Indlæsning og gemning

Indlæs et dokument med Document() og kald save() med en SaveFormat konstant for at konvertere mellem formater. Understøttede input: DOCX, DOC, RTF, TXT, Markdown. Understøttede output: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Kald save() flere gange på den samme Document for at producere flere outputformater uden at genindlæse.


PDF-eksport med PdfSaveOptions

For standard PDF-output skal du videregive SaveFormat.PDF. For finjusteret kontrol skal du bruge et PdfSaveOptions‑objekt:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions accepterer indstillinger for JPEG-billedkvalitet (0–100, standard 100) og PDF-standardens overholdelsesniveau (standard PDF/1.7).


Markdown-eksport med MarkdownSaveOptions

For standard Markdown-output, send SaveFormat.MARKDOWN. Brug MarkdownSaveOptions, når du har brug for at styre formateringsadfærden:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions understøtter kontrol af bevarelse af understregningsformatering i outputtet.


Tekstudtrækning

Udtræk ren tekst fra ethvert indlæst dokument med get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Til tekstfiloutput skal du bruge SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Almindelige problemer

ProblemÅrsagLøsning
ModuleNotFoundErrorPakke er ikke installeretKør pip install aspose-words-foss>=26.4.0
Tom tekst fra get_text()Inputfilen er tom eller beskadigetBekræft at inputfilen åbnes korrekt i en tekstbehandler
PDF-output mangler billederBilledformat understøttes ikke af konverterenBrug en DOCX-inddata med standard indlejrede billeder

API-referencens oversigt

Klasse / MetodeBeskrivelse
DocumentIndlæs Word-dokumenter fra DOCX, DOC, RTF, TXT eller Markdown
Document.save()Gem som PDF, Markdown, DOCX, DOC eller almindelig tekst
Document.get_text()Udtræk almindeligt tekstindhold
SaveFormatKonstanter: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsKonfigurer PDF-overensstemmelse og JPEG-kvalitet
MarkdownSaveOptionsKonfigurer eksport af understregningsformatering
 Dansk