Funcționalități
Funcționalități
Aspose.Words FOSS for Python este o bibliotecă de conversie a documentelor și extragere de text pentru documente Word. Întregul API public este construit în jurul clasei Document.
Formate de intrare acceptate
Clasa Document încarcă fișiere din aceste formate automat, în funcție de extensia fișierului:
| Format | Extensii |
|---|---|
| Document Word | .docx, .doc |
| Text Îmbogățit | .rtf |
| Text simplu | .txt |
| Markdown | .md |
Formate de ieșire și opțiuni de salvare
Apelă Document.save() cu o constantă SaveFormat pentru conversie rapidă, sau transmite un obiect de opțiuni de salvare pentru control detaliat.
| Ieșire | Constantă SaveFormat | Clasa Opțiuni de Salvare |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — configurează nivelul de conformitate, calitatea JPEG | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — controlează exportul formatării subliniate |
| Text simplu | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Pentru exemple de cod și detalii privind configurarea opțiunilor de salvare, vedeți Core Management.
Extracție de text
Document.get_text() returnează conținutul complet în text simplu al oricărui document încărcat fără a scrie pe disc.
Suport pentru imagini
Documentele cu imagini încorporate pot fi convertite în toate formatele de ieșire acceptate. Pipeline‑ul de conversie păstrează conținutul imaginii pe parcursul procesului de export.
Sumar API
| Clasă / Metodă | Rol |
|---|---|
Document | Încarcă documente, convertește formate, extrage text |
SaveFormat | Constante de format de ieșire (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | Configurare export PDF |
MarkdownSaveOptions | Configurare export Markdown |