Alapkezelés
Alapkezelés
A Document osztály a központi API a Word dokumentumok betöltéséhez és más formátumokra való konvertálásához. Ez az oldal a formátumkonverziós munkafolyamatokat, a mentési beállítások konfigurációját és a szövegkinyerést tárgyalja.
Betöltés és mentés
Töltsön be egy dokumentumot Document() segítségével, és hívja meg a save()-t egy SaveFormat állandóval a formátumok közötti konvertáláshoz. Támogatott bemenetek: DOCX, DOC, RTF, TXT, Markdown. Támogatott kimenetek: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Hívja meg save() többször ugyanazon Document-on, hogy több kimeneti formátumot állítson elő újratöltés nélkül.
PDF exportálás PdfSaveOptions használatával
Az alapértelmezett PDF kimenethez adja át a SaveFormat.PDF-t. Finomhangolt vezérléshez használjon egy PdfSaveOptions objektumot:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions elfogadja a JPEG képek minőségének beállításait (0–100, alapértelmezett 100) és a PDF szabványoknak való megfelelés szintjét (alapértelmezett PDF/1.7).
Markdown exportálás a MarkdownSaveOptions használatával
Az alapértelmezett Markdown kimenethez adja át SaveFormat.MARKDOWN. Használja a MarkdownSaveOptions‑t, ha a formázási viselkedést szeretné szabályozni:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions támogatja az aláhúzás formázásának megőrzésének vezérlését a kimenetben.
Szövegkinyerés
Egyszerű szöveg kinyerése bármely betöltött dokumentumból a get_text() segítségével:
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Szövegfájl kimenethez használja a SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Gyakori problémák
| Probléma | Ok | Javítás |
|---|---|---|
ModuleNotFoundError | A csomag nincs telepítve | Futtassa pip install aspose-words-foss>=26.4.0 |
Üres szöveg a get_text()-tól | A bemeneti fájl üres vagy sérült | Ellenőrizze, hogy a bemeneti fájl helyesen megnyílik-e egy szövegszerkesztőben |
| A PDF kimenetben hiányoznak a képek | A konverter nem támogatja a képek formátumát | Használjon DOCX bemenetet szabványos beágyazott képekkel |
API referencia összefoglaló
| Osztály / Metódus | Leírás |
|---|---|
Document | Word dokumentumok betöltése DOCX, DOC, RTF, TXT vagy Markdown formátumból |
Document.save() | Mentés PDF, Markdown, DOCX, DOC vagy egyszerű szöveg formátumba |
Document.get_text() | Egyszerű szövegtartalom kinyerése |
SaveFormat | Állandók: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | PDF megfelelőség és JPEG minőség beállítása |
MarkdownSaveOptions | Aláhúzott formázás exportjának beállítása |