Funcionalitats
Funcionalitats
Aspose.Words FOSS for Python és una biblioteca de conversió de documents i extracció de text per a documents Word. L’API pública completa està construïda al voltant de la classe Document.
Formats d’entrada compatibles
La classe Document carrega fitxers d’aquests formats automàticament segons l’extensió del fitxer:
| Format | Extensions |
|---|---|
| Document Word | .docx, .doc |
| Text enriquit | .rtf |
| Text pla | .txt |
| Markdown | .md |
Formats de sortida i opcions de desament
Crida Document.save() amb una constant SaveFormat per a una conversió ràpida, o passa un objecte save-options per a un control detallat.
| Sortida | SaveFormat Constant | Save Options Class |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — configura el nivell de compliment, qualitat JPEG | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — controla l’exportació del format subratllat |
| Text pla | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Per a exemples de codi i detalls de configuració de les opcions de desament, vegeu Core Management.
Extracció de text
Document.get_text() retorna el contingut complet en text pla de qualsevol document carregat sense escriure al disc.
Suport d’imatge
Els documents amb imatges incrustades es poden convertir a tots els formats de sortida compatibles. El flux de conversió conserva el contingut de les imatges durant el procés d’exportació.
Resum de l’API
| Classe / Mètode | Rol |
|---|---|
Document | Carrega documents, converteix formats, extreu text |
SaveFormat | Constants de format de sortida (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | Configuració d’exportació PDF |
MarkdownSaveOptions | Configuració d’exportació Markdown |