Základná správa
Základná správa
Jadro API pre správu dokumentov je postavené okolo triedy Document, ktorá načítava dokumenty Word a poskytuje save() pre konverziu formátu a get_text() pre extrakciu textu. Použite konštanty SaveFormat alebo objekty možností ukladania (PdfSaveOptions, MarkdownSaveOptions) na kontrolu výstupu.
Konverzia jedného dokumentu
Načítajte dokument s triedou Document a zavolajte save() s cieľovým formátom. Odovzdajte buď konštantu SaveFormat, alebo objekt možností ukladania pre výstupný formát.
import aspose.words_foss as aw
doc = aw.Document("input.docx") # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)Dávková konverzia do všetkých formátov
Previesť jeden vstupný súbor do viacerých výstupných formátov volaním save() viackrát s rôznymi SaveFormat konštantami (SaveFormat.MARKDOWN, SaveFormat.PDF, SaveFormat.TEXT).
PDF Export s možnosťami uloženia
Použite PdfSaveOptions pre detailnú kontrolu výstupu PDF, alebo SaveFormat.PDF pre predvolené nastavenia.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)Export Markdownu
Exportujte dokumenty do Markdown pomocou SaveFormat.MARKDOWN alebo MarkdownSaveOptions pre ďalšiu kontrolu výstupu.
import aspose.words_foss as aw
doc = aw.Document("input.docx") # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)Extrahovanie textu
Extrahujte obsah obyčajného textu pomocou Document.get_text() alebo exportujte ako obyčajný text pomocou SaveFormat.TEXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Dokumenty obsahujúce obrázky
Dokumenty s vloženými obrázkami je možné konvertovať do všetkých podporovaných výstupných formátov. Konverzný pipeline zachováva obsah obrázkov počas exportného procesu.
Tipy a najlepšie postupy
- Použite konštanty
SaveFormatpre rýchle konverzie; použite objekty save-options, keď potrebujete kontrolu formátovania MarkdownSaveOptions.export_underline_formatting = Truezachováva podčiarknutý štýl v Markdown výstupe- Načítajte dokumenty raz a uložte ich do viacerých formátov, aby ste predišli nadbytočnému čítaniu súborov
Bežné problémy
| Issue | Cause | Fix |
|---|---|---|
ModuleNotFoundError | Balík nie je nainštalovaný | Spustite pip install aspose-words-foss>=26.4.0 |
Prázdny text z get_text() | Vstupný súbor je prázdny alebo poškodený | Overte, že vstupný súbor sa otvára správne v textovom procesore |
| PDF výstup chýba obrázky | Formát obrázka nie je podporovaný konvertorom | Použite vstup DOCX so štandardnými vloženými obrázkami |
Často kladené otázky
Ako konvertovať DOCX na PDF?
Načítajte dokument pomocou aw.Document("input.docx") a zavolajte doc.save("output.pdf", aw.SaveFormat.PDF).
Môžem konvertovať viacero formátov v jednom volaní?
Áno. Zavolajte doc.save() viackrát s rôznymi konštantami SaveFormat, aby ste z jedného načítaného dokumentu vytvorili Markdown, PDF a obyčajný text.
Ako zachovať podčiarknuté formátovanie v Markdown?
Vytvorte objekt MarkdownSaveOptions, nastavte export_underline_formatting = True a odovzdajte ho do doc.save().
Aké vstupné formáty sú podporované?
Knižnica načítava súbory DOCX, DOC, RTF, TXT a Markdown.
Zhrnutie referencie API
| Trieda / Metóda | Popis |
|---|---|
Document | Načítajte dokumenty Word z formátov DOCX, DOC, RTF, TXT alebo Markdown |
Document.save() | Uložte dokument do PDF, Markdown alebo obyčajného textu |
Document.get_text() | Extrahujte obsah obyčajného textu z načítaného dokumentu |
SaveFormat | Konštanty pre výber výstupného formátu (PDF, MARKDOWN, TEXT) |
PdfSaveOptions | Detailná kontrola exportu do PDF |
MarkdownSaveOptions | Detailná kontrola exportu do Markdown |