Gestión Central

Gestión del Núcleo

La clase Document es la API central para cargar documentos Word y convertirlos a otros formatos. Esta página cubre los flujos de trabajo de conversión de formatos, la configuración de opciones de guardado y la extracción de texto.


Cargando y Guardando

Cargue un documento con Document() y llame a save() con una constante SaveFormat para convertir entre formatos. Entradas compatibles: DOCX, DOC, RTF, TXT, Markdown. Salidas compatibles: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Llame save() varias veces en el mismo Document para producir varios formatos de salida sin recargar.


Exportación de PDF con PdfSaveOptions

Para la salida PDF predeterminada, pase SaveFormat.PDF. Para un control detallado, use un objeto PdfSaveOptions:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions acepta configuraciones para la calidad de imagen JPEG (0–100, predeterminado 100) y el nivel de cumplimiento de normas PDF (predeterminado PDF/1.7).


Exportación de Markdown con MarkdownSaveOptions

Para la salida Markdown predeterminada, pase SaveFormat.MARKDOWN. Use MarkdownSaveOptions cuando necesite controlar el comportamiento de formato:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions admite el control de la preservación del formato de subrayado en la salida.


Extracción de texto

Extrae texto sin formato de cualquier documento cargado con get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Para la salida de archivos de texto, use SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Problemas comunes

ProblemaCausaSolución
ModuleNotFoundErrorPaquete no instaladoEjecute pip install aspose-words-foss>=26.4.0
Texto vacío de get_text()El archivo de entrada está vacío o dañadoVerifique que el archivo de entrada se abra correctamente en un procesador de textos
Salida PDF sin imágenesFormato de imagen no compatible con el convertidorUtilice una entrada DOCX con imágenes incrustadas estándar

Resumen de la referencia de API

Clase / MétodoDescripción
DocumentCargar documentos Word desde DOCX, DOC, RTF, TXT o Markdown
Document.save()Guardar como PDF, Markdown, DOCX, DOC o texto sin formato
Document.get_text()Extraer contenido de texto sin formato
SaveFormatConstantes: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsConfigurar cumplimiento PDF y calidad JPEG
MarkdownSaveOptionsConfigurar la exportación del formato de subrayado
 Español