Características
Características
Aspose.Words FOSS for Python es una biblioteca de conversión de documentos y extracción de texto para documentos Word. Toda la API pública está construida alrededor de la clase Document.
Formatos de Entrada Admitidos
La clase Document carga archivos de estos formatos automáticamente según la extensión del archivo:
| Formato | Extensiones |
|---|---|
| Documento Word | .docx, .doc |
| Texto enriquecido | .rtf |
| Texto plano | .txt |
| Markdown | .md |
Formatos de salida y opciones de guardado
Llame a Document.save() con una constante SaveFormat para una conversión rápida, o pase un objeto de opciones de guardado para un control granular.
| Salida | Constante SaveFormat | Clase de Opciones de Guardado |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — configurar nivel de cumplimiento, calidad JPEG | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — controlar la exportación del formato de subrayado |
| Texto sin formato | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Para ejemplos de código y detalles de configuración de opciones de guardado, consulte Core Management.
Extracción de texto
Document.get_text() devuelve el contenido completo en texto plano de cualquier documento cargado sin escribir en disco.
Soporte de imágenes
Los documentos con imágenes incrustadas pueden convertirse a todos los formatos de salida compatibles. La canalización de conversión preserva el contenido de la imagen durante el proceso de exportación.
Resumen de API
| Clase / Método | Rol |
|---|---|
Document | Cargar documentos, convertir formatos, extraer texto |
SaveFormat | Constantes de formatos de salida (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | Configuración de exportación PDF |
MarkdownSaveOptions | Configuración de exportación Markdown |