Základná správa

Základná správa

Základná správa

Jadro API pre správu dokumentov je postavené okolo triedy Document, ktorá načítava dokumenty Word a poskytuje save() pre konverziu formátu a get_text() pre extrakciu textu. Použite konštanty SaveFormat alebo objekty možností ukladania (PdfSaveOptions, MarkdownSaveOptions) na kontrolu výstupu.


Konverzia jedného dokumentu

Načítajte dokument s triedou Document a zavolajte save() s cieľovým formátom. Odovzdajte buď konštantu SaveFormat, alebo objekt možností ukladania pre výstupný formát.

import aspose.words_foss as aw

doc = aw.Document("input.docx")  # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)

Dávková konverzia do všetkých formátov

Previesť jeden vstupný súbor do viacerých výstupných formátov volaním save() viackrát s rôznymi SaveFormat konštantami (SaveFormat.MARKDOWN, SaveFormat.PDF, SaveFormat.TEXT).


PDF Export s možnosťami uloženia

Použite PdfSaveOptions pre detailnú kontrolu výstupu PDF, alebo SaveFormat.PDF pre predvolené nastavenia.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Export Markdownu

Exportujte dokumenty do Markdown pomocou SaveFormat.MARKDOWN alebo MarkdownSaveOptions pre ďalšiu kontrolu výstupu.

import aspose.words_foss as aw

doc = aw.Document("input.docx")  # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)

Extrahovanie textu

Extrahujte obsah obyčajného textu pomocou Document.get_text() alebo exportujte ako obyčajný text pomocou SaveFormat.TEXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Dokumenty obsahujúce obrázky

Dokumenty s vloženými obrázkami je možné konvertovať do všetkých podporovaných výstupných formátov. Konverzný pipeline zachováva obsah obrázkov počas exportného procesu.


Tipy a najlepšie postupy

  • Použite konštanty SaveFormat pre rýchle konverzie; použite objekty save-options, keď potrebujete kontrolu formátovania
  • MarkdownSaveOptions.export_underline_formatting = True zachováva podčiarknutý štýl v Markdown výstupe
  • Načítajte dokumenty raz a uložte ich do viacerých formátov, aby ste predišli nadbytočnému čítaniu súborov

Bežné problémy

IssueCauseFix
ModuleNotFoundErrorBalík nie je nainštalovanýSpustite pip install aspose-words-foss>=26.4.0
Prázdny text z get_text()Vstupný súbor je prázdny alebo poškodenýOverte, že vstupný súbor sa otvára správne v textovom procesore
PDF výstup chýba obrázkyFormát obrázka nie je podporovaný konvertoromPoužite vstup DOCX so štandardnými vloženými obrázkami

Často kladené otázky

Ako konvertovať DOCX na PDF?

Načítajte dokument pomocou aw.Document("input.docx") a zavolajte doc.save("output.pdf", aw.SaveFormat.PDF).

Môžem konvertovať viacero formátov v jednom volaní?

Áno. Zavolajte doc.save() viackrát s rôznymi konštantami SaveFormat, aby ste z jedného načítaného dokumentu vytvorili Markdown, PDF a obyčajný text.

Ako zachovať podčiarknuté formátovanie v Markdown?

Vytvorte objekt MarkdownSaveOptions, nastavte export_underline_formatting = True a odovzdajte ho do doc.save().

Aké vstupné formáty sú podporované?

Knižnica načítava súbory DOCX, DOC, RTF, TXT a Markdown.


Zhrnutie referencie API

Trieda / MetódaPopis
DocumentNačítajte dokumenty Word z formátov DOCX, DOC, RTF, TXT alebo Markdown
Document.save()Uložte dokument do PDF, Markdown alebo obyčajného textu
Document.get_text()Extrahujte obsah obyčajného textu z načítaného dokumentu
SaveFormatKonštanty pre výber výstupného formátu (PDF, MARKDOWN, TEXT)
PdfSaveOptionsDetailná kontrola exportu do PDF
MarkdownSaveOptionsDetailná kontrola exportu do Markdown
 Slovenčina