Recursos
Recursos
Aspose.Words FOSS for Python é uma biblioteca de conversão de documentos e extração de texto para documentos Word. Toda a API pública é construída em torno da classe Document.
Formatos de Entrada Compatíveis
A classe Document carrega arquivos desses formatos automaticamente com base na extensão do arquivo:
| Formato | Extensões |
|---|---|
| Documento Word | .docx, .doc |
| Texto Rico | .rtf |
| Texto Simples | .txt |
| Markdown | .md |
Formatos de Saída e Opções de Salvamento
Chame Document.save() com uma constante SaveFormat para conversão rápida, ou passe um objeto de opções de salvamento para controle refinado.
| Saída | Constante SaveFormat | Classe de Opções de Salvamento |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — configurar nível de conformidade, qualidade JPEG | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — controlar exportação de formatação de sublinhado |
| Texto simples | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Para exemplos de código e detalhes de configuração de opções de salvamento, veja Core Management.
Extração de Texto
Document.get_text() retorna o conteúdo completo em texto simples de qualquer documento carregado sem gravar em disco.
Suporte a Imagens
Documentos com imagens incorporadas podem ser convertidos para todos os formatos de saída suportados. O pipeline de conversão preserva o conteúdo da imagem durante o processo de exportação.
Resumo da API
| Classe / Método | Função |
|---|---|
Document | Carregar documentos, converter formatos, extrair texto |
SaveFormat | Constantes de formatos de saída (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | Configuração de exportação PDF |
MarkdownSaveOptions | Configuração de exportação Markdown |