Kärnhantering
Kärnhantering
Den centrala dokumenthanterings‑API:n är byggd kring Document‑klassen, som laddar Word‑dokument och tillhandahåller save() för formatkonvertering och get_text() för textutdragning. Använd SaveFormat‑konstanter eller spara‑alternativ‑objekt (PdfSaveOptions, MarkdownSaveOptions) för att styra utdata.
Enkel dokumentkonvertering
Läs in ett dokument med Document-klassen och anropa save() med ett målformat. Skicka antingen en SaveFormat-konstant eller ett save‑options‑objekt för utdataformatet.
import aspose.words_foss as aw
doc = aw.Document("input.docx") # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)Batchkonvertering till alla format
Konvertera en enda inmatningsfil till flera utdataformat genom att anropa save() flera gånger med olika SaveFormat-konstanter (SaveFormat.MARKDOWN, SaveFormat.PDF, SaveFormat.TEXT).
PDF-export med sparaalternativ
Använd PdfSaveOptions för finjusterad kontroll över PDF-utdata, eller SaveFormat.PDF för standardinställningar.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)Markdown-export
Exportera dokument till Markdown med SaveFormat.MARKDOWN eller MarkdownSaveOptions för ytterligare kontroll av utdata.
import aspose.words_foss as aw
doc = aw.Document("input.docx") # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)Textutvinning
Extrahera ren textinnehåll via Document.get_text() eller exportera som ren text via SaveFormat.TEXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Dokument med bilder
Dokument med inbäddade bilder kan konverteras till alla stödda utdataformat. Konverteringspipeline bevarar bildinnehållet genom exportprocessen.
Tips och bästa praxis
- Använd
SaveFormat-konstanter för snabba konverteringar; använd save-options-objekt när du behöver formateringskontroll MarkdownSaveOptions.export_underline_formatting = Truebevarar understrykningens stil i Markdown-utdata- Läs in dokument en gång och spara till flera format för att undvika onödiga filinläsningar
Vanliga problem
| Problem | Orsak | Lösning |
|---|---|---|
ModuleNotFoundError | Paketet är inte installerat | Kör pip install aspose-words-foss>=26.4.0 |
Tom text från get_text() | Inmatningsfilen är tom eller skadad | Verifiera att inmatningsfilen öppnas korrekt i en ordbehandlare |
| PDF-utdata saknar bilder | Bildformat stöds inte av konverteraren | Använd en DOCX‑inmatning med standardinbäddade bilder |
FAQ
Hur konverterar jag DOCX till PDF?
Läs in dokumentet med aw.Document("input.docx") och anropa doc.save("output.pdf", aw.SaveFormat.PDF).
Kan jag konvertera flera format i ett anrop?
Ja. Anropa doc.save() flera gånger med olika SaveFormat-konstanter för att producera Markdown, PDF och vanlig text från ett enda inläst dokument.
Hur bevarar jag understrykningens formatering i Markdown?
Skapa ett MarkdownSaveOptions-objekt, sätt export_underline_formatting = True och skicka det till doc.save().
Vilka inmatningsformat stöds?
Biblioteket laddar DOCX-, DOC-, RTF-, TXT- och Markdown-filer.
API-referenssammanfattning
| Klass / Metod | Beskrivning |
|---|---|
Document | Läs in Word-dokument från DOCX, DOC, RTF, TXT eller Markdown |
Document.save() | Spara dokumentet som PDF, Markdown eller vanlig text |
Document.get_text() | Extrahera vanlig textinnehåll från det inlästa dokumentet |
SaveFormat | Konstanter för val av utdataformat (PDF, MARKDOWN, TEXT) |
PdfSaveOptions | Finjusterad kontroll över PDF-export |
MarkdownSaveOptions | Finjusterad kontroll över Markdown-export |