Gestione Core
Gestione Core
La classe Document è l’API centrale per caricare documenti Word e convertirli in altri formati. Questa pagina copre i flussi di lavoro di conversione dei formati, la configurazione delle opzioni di salvataggio e l’estrazione del testo.
Caricamento e salvataggio
Carica un documento con Document() e chiama save() con una costante SaveFormat per convertire tra i formati. Input supportati: DOCX, DOC, RTF, TXT, Markdown. Output supportati: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Chiama save() più volte sullo stesso Document per produrre più formati di output senza ricaricare.
Esportazione PDF con PdfSaveOptions
Per l’output PDF predefinito, passa SaveFormat.PDF. Per un controllo granulare, usa un oggetto PdfSaveOptions:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions accetta impostazioni per la qualità dell’immagine JPEG (0–100, valore predefinito 100) e il livello di conformità agli standard PDF (PDF/1.7 predefinito).
Esportazione Markdown con MarkdownSaveOptions
Per l’output Markdown predefinito, passa SaveFormat.MARKDOWN. Usa MarkdownSaveOptions quando hai bisogno di controllare il comportamento della formattazione:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions supporta il controllo della conservazione della formattazione sottolineata nell’output.
Estrazione del testo
Estrai il testo semplice da qualsiasi documento caricato con get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Per l’output di file di testo, usa SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Problemi comuni
| Problema | Causa | Correzione |
|---|---|---|
ModuleNotFoundError | Pacchetto non installato | Esegui pip install aspose-words-foss>=26.4.0 |
Testo vuoto da get_text() | Il file di input è vuoto o corrotto | Verifica che il file di input si apra correttamente in un elaboratore di testi |
| Output PDF senza immagini | Formato immagine non supportato dal convertitore | Usa un input DOCX con immagini incorporate standard |
Riepilogo del Riferimento API
| Classe / Metodo | Descrizione |
|---|---|
Document | Carica documenti Word da DOCX, DOC, RTF, TXT o Markdown |
Document.save() | Salva in PDF, Markdown, DOCX, DOC o testo semplice |
Document.get_text() | Estrai contenuto di testo semplice |
SaveFormat | Costanti: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Configura la conformità PDF e la qualità JPEG |
MarkdownSaveOptions | Configura l’esportazione della formattazione sottolineata |