Kerneadministration
Kerneadministration
Klassen Document er det centrale API til indlæsning af Word-dokumenter og konvertering til andre formater. Denne side dækker arbejdsprocesser for formatkonvertering, konfiguration af gemmeindstillinger og tekstudtræk.
Indlæsning og gemning
Indlæs et dokument med Document() og kald save() med en SaveFormat konstant for at konvertere mellem formater. Understøttede input: DOCX, DOC, RTF, TXT, Markdown. Understøttede output: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Kald save() flere gange på den samme Document for at producere flere outputformater uden at genindlæse.
PDF-eksport med PdfSaveOptions
For standard PDF-output skal du videregive SaveFormat.PDF. For finjusteret kontrol skal du bruge et PdfSaveOptions‑objekt:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions accepterer indstillinger for JPEG-billedkvalitet (0–100, standard 100) og PDF-standardens overholdelsesniveau (standard PDF/1.7).
Markdown-eksport med MarkdownSaveOptions
For standard Markdown-output, send SaveFormat.MARKDOWN. Brug MarkdownSaveOptions, når du har brug for at styre formateringsadfærden:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions understøtter kontrol af bevarelse af understregningsformatering i outputtet.
Tekstudtrækning
Udtræk ren tekst fra ethvert indlæst dokument med get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Til tekstfiloutput skal du bruge SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Almindelige problemer
| Problem | Årsag | Løsning |
|---|---|---|
ModuleNotFoundError | Pakke er ikke installeret | Kør pip install aspose-words-foss>=26.4.0 |
Tom tekst fra get_text() | Inputfilen er tom eller beskadiget | Bekræft at inputfilen åbnes korrekt i en tekstbehandler |
| PDF-output mangler billeder | Billedformat understøttes ikke af konverteren | Brug en DOCX-inddata med standard indlejrede billeder |
API-referencens oversigt
| Klasse / Metode | Beskrivelse |
|---|---|
Document | Indlæs Word-dokumenter fra DOCX, DOC, RTF, TXT eller Markdown |
Document.save() | Gem som PDF, Markdown, DOCX, DOC eller almindelig tekst |
Document.get_text() | Udtræk almindeligt tekstindhold |
SaveFormat | Konstanter: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Konfigurer PDF-overensstemmelse og JPEG-kvalitet |
MarkdownSaveOptions | Konfigurer eksport af understregningsformatering |