Savybės
Savybės
Aspose.Words FOSS for Python yra dokumentų konvertavimo ir teksto išskyrimo biblioteka Word dokumentams. Visa vieša API sukurta aplink Document klasę.
Palaikomi įvesties formatai
Document klasė automatiškai įkelia failus iš šių formatų, remdamasi failo plėtiniu:
| Formatas | Plėtiniai |
|---|---|
| Word dokumentas | .docx, .doc |
| Raiškusis tekstas | .rtf |
| Paprastas tekstas | .txt |
| Markdown | .md |
Išvesties formatai ir išsaugojimo parinktys
Iškvieskite Document.save() su SaveFormat konstanta greitam konvertavimui arba perduokite išsaugojimo parinkčių objektą, kad galėtumėte tiksliai valdyti.
| Išvestis | SaveFormat konstantas | Išsaugojimo parinkčių klasė |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — konfigūruoti atitikties lygį, JPEG kokybę | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — valdyti pabraukimo formatavimo eksportą |
| Paprastas tekstas | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Dėl kodo pavyzdžių ir išsaugojimo parinkčių konfigūracijos detalių žiūrėkite Core Management.
Teksto išgavimas
Document.get_text() grąžina visą bet kurio įkelto dokumento grynojo teksto turinį be įrašymo į diską.
Vaizdo palaikymas
Dokumentai su įterptais vaizdais gali būti konvertuojami į visus palaikomus išvesties formatus. Konvertavimo konvejeris išsaugo vaizdo turinį per eksporto procesą.
API santrauka
| Klasė / Metodas | Vaidmuo |
|---|---|
Document | Įkelti dokumentus, konvertuoti formatus, išgauti tekstą |
SaveFormat | Išvesties formato konstantos (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | PDF eksporto konfigūracija |
MarkdownSaveOptions | Markdown eksporto konfigūracija |