Kärnhantering

Kärnhantering

Den centrala dokumenthanterings‑API:n är byggd kring Document‑klassen, som laddar Word‑dokument och tillhandahåller save() för formatkonvertering och get_text() för textutdragning. Använd SaveFormat‑konstanter eller spara‑alternativ‑objekt (PdfSaveOptions, MarkdownSaveOptions) för att styra utdata.


Enkel dokumentkonvertering

Läs in ett dokument med Document-klassen och anropa save() med ett målformat. Skicka antingen en SaveFormat-konstant eller ett save‑options‑objekt för utdataformatet.

import aspose.words_foss as aw

doc = aw.Document("input.docx")  # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)

Batchkonvertering till alla format

Konvertera en enda inmatningsfil till flera utdataformat genom att anropa save() flera gånger med olika SaveFormat-konstanter (SaveFormat.MARKDOWN, SaveFormat.PDF, SaveFormat.TEXT).


PDF-export med sparaalternativ

Använd PdfSaveOptions för finjusterad kontroll över PDF-utdata, eller SaveFormat.PDF för standardinställningar.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Markdown-export

Exportera dokument till Markdown med SaveFormat.MARKDOWN eller MarkdownSaveOptions för ytterligare kontroll av utdata.

import aspose.words_foss as aw

doc = aw.Document("input.docx")  # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)

Textutvinning

Extrahera ren textinnehåll via Document.get_text() eller exportera som ren text via SaveFormat.TEXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Dokument med bilder

Dokument med inbäddade bilder kan konverteras till alla stödda utdataformat. Konverteringspipeline bevarar bildinnehållet genom exportprocessen.


Tips och bästa praxis

  • Använd SaveFormat-konstanter för snabba konverteringar; använd save-options-objekt när du behöver formateringskontroll
  • MarkdownSaveOptions.export_underline_formatting = True bevarar understrykningens stil i Markdown-utdata
  • Läs in dokument en gång och spara till flera format för att undvika onödiga filinläsningar

Vanliga problem

ProblemOrsakLösning
ModuleNotFoundErrorPaketet är inte installeratKör pip install aspose-words-foss>=26.4.0
Tom text från get_text()Inmatningsfilen är tom eller skadadVerifiera att inmatningsfilen öppnas korrekt i en ordbehandlare
PDF-utdata saknar bilderBildformat stöds inte av konverterarenAnvänd en DOCX‑inmatning med standardinbäddade bilder

FAQ

Hur konverterar jag DOCX till PDF?

Läs in dokumentet med aw.Document("input.docx") och anropa doc.save("output.pdf", aw.SaveFormat.PDF).

Kan jag konvertera flera format i ett anrop?

Ja. Anropa doc.save() flera gånger med olika SaveFormat-konstanter för att producera Markdown, PDF och vanlig text från ett enda inläst dokument.

Hur bevarar jag understrykningens formatering i Markdown?

Skapa ett MarkdownSaveOptions-objekt, sätt export_underline_formatting = True och skicka det till doc.save().

Vilka inmatningsformat stöds?

Biblioteket laddar DOCX-, DOC-, RTF-, TXT- och Markdown-filer.


API-referenssammanfattning

Klass / MetodBeskrivning
DocumentLäs in Word-dokument från DOCX, DOC, RTF, TXT eller Markdown
Document.save()Spara dokumentet som PDF, Markdown eller vanlig text
Document.get_text()Extrahera vanlig textinnehåll från det inlästa dokumentet
SaveFormatKonstanter för val av utdataformat (PDF, MARKDOWN, TEXT)
PdfSaveOptionsFinjusterad kontroll över PDF-export
MarkdownSaveOptionsFinjusterad kontroll över Markdown-export
 Svenska