Caratteristiche
Caratteristiche
Aspose.Words FOSS for Python è una libreria di conversione di documenti e estrazione di testo per documenti Word. L’intera API pubblica è costruita attorno alla classe Document.
Formati di input supportati
La classe Document carica i file da questi formati automaticamente in base all’estensione del file:
| Formato | Estensioni |
|---|---|
| Documento Word | .docx, .doc |
| Rich Text | .rtf |
| Testo semplice | .txt |
| Markdown | .md |
Formati di output e opzioni di salvataggio
Chiama Document.save() con una costante SaveFormat per una conversione rapida, oppure passa un oggetto save-options per un controllo più granulare.
| Output | Costante SaveFormat | Classe Opzioni Salvataggio |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — configura il livello di conformità, qualità JPEG | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — controlla l’esportazione della formattazione sottolineata |
| Plain Text | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Per esempi di codice e dettagli di configurazione delle opzioni di salvataggio, vedere Core Management.
Estrazione del testo
Document.get_text() restituisce il contenuto completo in plain‑text di qualsiasi documento caricato senza scriverlo su disco.
Supporto immagine
I documenti con immagini incorporate possono essere convertiti in tutti i formati di output supportati. Il flusso di conversione preserva il contenuto delle immagini durante il processo di esportazione.
Riepilogo API
| Classe / Metodo | Ruolo |
|---|---|
Document | Carica documenti, converte formati, estrae testo |
SaveFormat | Costanti di formato di output (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | Configurazione esportazione PDF |
MarkdownSaveOptions | Configurazione esportazione Markdown |