Gestione Core

Gestione Core

La classe Document è l’API centrale per caricare documenti Word e convertirli in altri formati. Questa pagina copre i flussi di lavoro di conversione dei formati, la configurazione delle opzioni di salvataggio e l’estrazione del testo.


Caricamento e salvataggio

Carica un documento con Document() e chiama save() con una costante SaveFormat per convertire tra i formati. Input supportati: DOCX, DOC, RTF, TXT, Markdown. Output supportati: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Chiama save() più volte sullo stesso Document per produrre più formati di output senza ricaricare.


Esportazione PDF con PdfSaveOptions

Per l’output PDF predefinito, passa SaveFormat.PDF. Per un controllo granulare, usa un oggetto PdfSaveOptions:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions accetta impostazioni per la qualità dell’immagine JPEG (0–100, valore predefinito 100) e il livello di conformità agli standard PDF (PDF/1.7 predefinito).


Esportazione Markdown con MarkdownSaveOptions

Per l’output Markdown predefinito, passa SaveFormat.MARKDOWN. Usa MarkdownSaveOptions quando hai bisogno di controllare il comportamento della formattazione:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions supporta il controllo della conservazione della formattazione sottolineata nell’output.


Estrazione del testo

Estrai il testo semplice da qualsiasi documento caricato con get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Per l’output di file di testo, usa SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Problemi comuni

ProblemaCausaCorrezione
ModuleNotFoundErrorPacchetto non installatoEsegui pip install aspose-words-foss>=26.4.0
Testo vuoto da get_text()Il file di input è vuoto o corrottoVerifica che il file di input si apra correttamente in un elaboratore di testi
Output PDF senza immaginiFormato immagine non supportato dal convertitoreUsa un input DOCX con immagini incorporate standard

Riepilogo del Riferimento API

Classe / MetodoDescrizione
DocumentCarica documenti Word da DOCX, DOC, RTF, TXT o Markdown
Document.save()Salva in PDF, Markdown, DOCX, DOC o testo semplice
Document.get_text()Estrai contenuto di testo semplice
SaveFormatCostanti: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsConfigura la conformità PDF e la qualità JPEG
MarkdownSaveOptionsConfigura l’esportazione della formattazione sottolineata
 Italiano