Funcionalitats

Funcionalitats

Aspose.Words FOSS for Python és una biblioteca de conversió de documents i extracció de text per a documents Word. L’API pública completa està construïda al voltant de la classe Document.


Formats d’entrada compatibles

La classe Document carrega fitxers d’aquests formats automàticament segons l’extensió del fitxer:

FormatExtensions
Document Word.docx, .doc
Text enriquit.rtf
Text pla.txt
Markdown.md

Formats de sortida i opcions de desament

Crida Document.save() amb una constant SaveFormat per a una conversió ràpida, o passa un objecte save-options per a un control detallat.

SortidaSaveFormat ConstantSave Options Class
PDFSaveFormat.PDFPdfSaveOptions — configura el nivell de compliment, qualitat JPEG
MarkdownSaveFormat.MARKDOWNMarkdownSaveOptions — controla l’exportació del format subratllat
Text plaSaveFormat.TEXT
Word (DOCX)SaveFormat.DOCX
Word (DOC)SaveFormat.DOC

Per a exemples de codi i detalls de configuració de les opcions de desament, vegeu Core Management.


Extracció de text

Document.get_text() retorna el contingut complet en text pla de qualsevol document carregat sense escriure al disc.


Suport d’imatge

Els documents amb imatges incrustades es poden convertir a tots els formats de sortida compatibles. El flux de conversió conserva el contingut de les imatges durant el procés d’exportació.


Resum de l’API

Classe / MètodeRol
DocumentCarrega documents, converteix formats, extreu text
SaveFormatConstants de format de sortida (PDF, MARKDOWN, TEXT, DOC, DOCX)
PdfSaveOptionsConfiguració d’exportació PDF
MarkdownSaveOptionsConfiguració d’exportació Markdown
 Català