Kjerneadministrasjon
Kjerneadministrasjon
Document-klassen er det sentrale API-et for å laste inn Word-dokumenter og konvertere dem til andre formater. Denne siden dekker arbeidsflyter for formatkonvertering, konfigurasjon av lagringsalternativer og tekstuttrekk.
Laste inn og lagre
Last inn et dokument med Document() og kall save() med en SaveFormat konstant for å konvertere mellom formater. Støttede innganger: DOCX, DOC, RTF, TXT, Markdown. Støttede utganger: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Kall save() flere ganger på samme Document for å produsere flere utdataformater uten å laste på nytt.
PDF-eksport med PdfSaveOptions
For standard PDF‑utdata, send inn SaveFormat.PDF. For finjustert kontroll, bruk et PdfSaveOptions‑objekt:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions aksepterer innstillinger for JPEG-bildekvalitet (0–100, standard 100) og PDF-standardens samsvarsnivå (standard PDF/1.7).
Markdown-eksport med MarkdownSaveOptions
For standard Markdown‑utdata, send SaveFormat.MARKDOWN. Bruk MarkdownSaveOptions når du trenger å kontrollere formateringsadferd:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions støtter kontroll av bevaring av understrekingsformatering i utdata.
Tekstuttrekk
Uttrekk ren tekst fra ethvert lastet dokument med get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()For tekstfilutdata, bruk SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Vanlige problemer
| Issue | Cause | Fix |
|---|---|---|
ModuleNotFoundError | Pakke ikke installert | Kjør pip install aspose-words-foss>=26.4.0 |
Tom tekst fra get_text() | Inndatafilen er tom eller korrupt | Bekreft at inndatafilen åpnes korrekt i en tekstbehandler |
| PDF-utdata mangler bilder | Bildeformatet støttes ikke av konverteren | Bruk en DOCX-inndata med standard innebygde bilder |
API-referansesammendrag
| Klasse / Metode | Beskrivelse |
|---|---|
Document | Last inn Word-dokumenter fra DOCX, DOC, RTF, TXT eller Markdown |
Document.save() | Lagre til PDF, Markdown, DOCX, DOC eller ren tekst |
Document.get_text() | Utdra ren tekstinnhold |
SaveFormat | Konstanter: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Konfigurer PDF-kompatibilitet og JPEG-kvalitet |
MarkdownSaveOptions | Konfigurer eksport av understrekingsformatering |