Správa jádra

Správa jádra

Třída Document je centrální API pro načítání dokumentů Word a jejich převod do jiných formátů. Tato stránka pokrývá pracovní postupy převodu formátů, konfiguraci možností uložení a extrakci textu.


Načítání a ukládání

Načtěte dokument s Document() a zavolejte save() s konstantou SaveFormat pro převod mezi formáty. Podporované vstupy: DOCX, DOC, RTF, TXT, Markdown. Podporované výstupy: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Zavolejte save() vícekrát na stejném Document, abyste vytvořili více výstupních formátů bez opětovného načtení.


Export PDF s PdfSaveOptions

Pro výchozí výstup PDF předávejte SaveFormat.PDF. Pro podrobnou kontrolu použijte objekt PdfSaveOptions:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions přijímá nastavení kvality JPEG obrázku (0–100, výchozí 100) a úrovně souladu s normami PDF (výchozí PDF/1.7).


Export Markdownu s MarkdownSaveOptions

Pro výchozí výstup Markdown předejte SaveFormat.MARKDOWN. Použijte MarkdownSaveOptions, když potřebujete řídit chování formátování:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions podporuje řízení zachování podtržení formátování ve výstupu.


Extrahování textu

Extrahujte prostý text z libovolného načteného dokumentu pomocí get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Pro výstup textového souboru použijte SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Běžné problémy

ProblémPříčinaOprava
ModuleNotFoundErrorBalíček není nainstalovánSpusťte pip install aspose-words-foss>=26.4.0
Prázdný text z get_text()Vstupní soubor je prázdný nebo poškozenýOvěřte, že se vstupní soubor správně otevře ve word procesoru
Výstup PDF postrádá obrázkyFormát obrázku není podporován konvertoremPoužijte vstup DOCX se standardními vloženými obrázky

Souhrn referenčního API

Třída / MetodaPopis
DocumentNačíst Word dokumenty z formátů DOCX, DOC, RTF, TXT nebo Markdown
Document.save()Uložit do PDF, Markdown, DOCX, DOC nebo prostého textu
Document.get_text()Extrahovat obsah prostého textu
SaveFormatKonstanty: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsNastavit shodu PDF a kvalitu JPEG
MarkdownSaveOptionsNastavit export formátování podtržení
 Čeština