Správa jádra
Správa jádra
Třída Document je centrální API pro načítání dokumentů Word a jejich převod do jiných formátů. Tato stránka pokrývá pracovní postupy převodu formátů, konfiguraci možností uložení a extrakci textu.
Načítání a ukládání
Načtěte dokument s Document() a zavolejte save() s konstantou SaveFormat pro převod mezi formáty. Podporované vstupy: DOCX, DOC, RTF, TXT, Markdown. Podporované výstupy: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Zavolejte save() vícekrát na stejném Document, abyste vytvořili více výstupních formátů bez opětovného načtení.
Export PDF s PdfSaveOptions
Pro výchozí výstup PDF předávejte SaveFormat.PDF. Pro podrobnou kontrolu použijte objekt PdfSaveOptions:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions přijímá nastavení kvality JPEG obrázku (0–100, výchozí 100) a úrovně souladu s normami PDF (výchozí PDF/1.7).
Export Markdownu s MarkdownSaveOptions
Pro výchozí výstup Markdown předejte SaveFormat.MARKDOWN. Použijte MarkdownSaveOptions, když potřebujete řídit chování formátování:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions podporuje řízení zachování podtržení formátování ve výstupu.
Extrahování textu
Extrahujte prostý text z libovolného načteného dokumentu pomocí get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Pro výstup textového souboru použijte SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Běžné problémy
| Problém | Příčina | Oprava |
|---|---|---|
ModuleNotFoundError | Balíček není nainstalován | Spusťte pip install aspose-words-foss>=26.4.0 |
Prázdný text z get_text() | Vstupní soubor je prázdný nebo poškozený | Ověřte, že se vstupní soubor správně otevře ve word procesoru |
| Výstup PDF postrádá obrázky | Formát obrázku není podporován konvertorem | Použijte vstup DOCX se standardními vloženými obrázky |
Souhrn referenčního API
| Třída / Metoda | Popis |
|---|---|
Document | Načíst Word dokumenty z formátů DOCX, DOC, RTF, TXT nebo Markdown |
Document.save() | Uložit do PDF, Markdown, DOCX, DOC nebo prostého textu |
Document.get_text() | Extrahovat obsah prostého textu |
SaveFormat | Konstanty: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Nastavit shodu PDF a kvalitu JPEG |
MarkdownSaveOptions | Nastavit export formátování podtržení |