Gestión Central
Gestión del Núcleo
La clase Document es la API central para cargar documentos Word y convertirlos a otros formatos. Esta página cubre los flujos de trabajo de conversión de formatos, la configuración de opciones de guardado y la extracción de texto.
Cargando y Guardando
Cargue un documento con Document() y llame a save() con una constante SaveFormat para convertir entre formatos. Entradas compatibles: DOCX, DOC, RTF, TXT, Markdown. Salidas compatibles: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Llame save() varias veces en el mismo Document para producir varios formatos de salida sin recargar.
Exportación de PDF con PdfSaveOptions
Para la salida PDF predeterminada, pase SaveFormat.PDF. Para un control detallado, use un objeto PdfSaveOptions:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions acepta configuraciones para la calidad de imagen JPEG (0–100, predeterminado 100) y el nivel de cumplimiento de normas PDF (predeterminado PDF/1.7).
Exportación de Markdown con MarkdownSaveOptions
Para la salida Markdown predeterminada, pase SaveFormat.MARKDOWN. Use MarkdownSaveOptions cuando necesite controlar el comportamiento de formato:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions admite el control de la preservación del formato de subrayado en la salida.
Extracción de texto
Extrae texto sin formato de cualquier documento cargado con get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Para la salida de archivos de texto, use SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Problemas comunes
| Problema | Causa | Solución |
|---|---|---|
ModuleNotFoundError | Paquete no instalado | Ejecute pip install aspose-words-foss>=26.4.0 |
Texto vacío de get_text() | El archivo de entrada está vacío o dañado | Verifique que el archivo de entrada se abra correctamente en un procesador de textos |
| Salida PDF sin imágenes | Formato de imagen no compatible con el convertidor | Utilice una entrada DOCX con imágenes incrustadas estándar |
Resumen de la referencia de API
| Clase / Método | Descripción |
|---|---|
Document | Cargar documentos Word desde DOCX, DOC, RTF, TXT o Markdown |
Document.save() | Guardar como PDF, Markdown, DOCX, DOC o texto sin formato |
Document.get_text() | Extraer contenido de texto sin formato |
SaveFormat | Constantes: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Configurar cumplimiento PDF y calidad JPEG |
MarkdownSaveOptions | Configurar la exportación del formato de subrayado |