Características

Características

Aspose.Words FOSS for Python es una biblioteca de conversión de documentos y extracción de texto para documentos Word. Toda la API pública está construida alrededor de la clase Document.


Formatos de Entrada Admitidos

La clase Document carga archivos de estos formatos automáticamente según la extensión del archivo:

FormatoExtensiones
Documento Word.docx, .doc
Texto enriquecido.rtf
Texto plano.txt
Markdown.md

Formatos de salida y opciones de guardado

Llame a Document.save() con una constante SaveFormat para una conversión rápida, o pase un objeto de opciones de guardado para un control granular.

SalidaConstante SaveFormatClase de Opciones de Guardado
PDFSaveFormat.PDFPdfSaveOptions — configurar nivel de cumplimiento, calidad JPEG
MarkdownSaveFormat.MARKDOWNMarkdownSaveOptions — controlar la exportación del formato de subrayado
Texto sin formatoSaveFormat.TEXT
Word (DOCX)SaveFormat.DOCX
Word (DOC)SaveFormat.DOC

Para ejemplos de código y detalles de configuración de opciones de guardado, consulte Core Management.


Extracción de texto

Document.get_text() devuelve el contenido completo en texto plano de cualquier documento cargado sin escribir en disco.


Soporte de imágenes

Los documentos con imágenes incrustadas pueden convertirse a todos los formatos de salida compatibles. La canalización de conversión preserva el contenido de la imagen durante el proceso de exportación.


Resumen de API

Clase / MétodoRol
DocumentCargar documentos, convertir formatos, extraer texto
SaveFormatConstantes de formatos de salida (PDF, MARKDOWN, TEXT, DOC, DOCX)
PdfSaveOptionsConfiguración de exportación PDF
MarkdownSaveOptionsConfiguración de exportación Markdown
 Español