Pagrindinis valdymas
Pagrindinis valdymas
Document klasė yra pagrindinis API, skirtas įkelti Word dokumentus ir konvertuoti juos į kitus formatus. Šiame puslapyje aptariami formatų konvertavimo darbo srautai, išsaugojimo parinkčių konfigūracija ir teksto išgavimas.
Įkėlimas ir išsaugojimas
Įkelkite dokumentą su Document() ir iškvieskite save() su SaveFormat konstanta, kad konvertuotumėte tarp formatų. Palaikomi įvesties formatai: DOCX, DOC, RTF, TXT, Markdown. Palaikomi išvesties formatai: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Iškvieskite save() kelis kartus tame pačiame Document, kad sukurtumėte kelis išvesties formatus be perkrovimo.
PDF eksportavimas su PdfSaveOptions
Numatytajam PDF išvedimui perduokite SaveFormat.PDF. Norėdami gauti smulkią kontrolę, naudokite PdfSaveOptions objektą:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions priima nustatymus JPEG vaizdo kokybei (0–100, numatyta 100) ir PDF standartų atitikties lygiui (numatyta PDF/1.7).
Markdown eksportas su MarkdownSaveOptions
Numatytajam Markdown išvedimui perduokite SaveFormat.MARKDOWN. Naudokite MarkdownSaveOptions, kai reikia valdyti formatavimo elgseną:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions palaiko pabraukimo formatavimo išsaugojimo valdymą išvestyje.
Teksto išgavimas
Išgaukite paprastą tekstą iš bet kurio įkelto dokumento su get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Tekstinių failų išvedimui naudokite SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Bendros problemos
| Problema | Priežastis | Sprendimas |
|---|---|---|
ModuleNotFoundError | Paketas neįdiegtas | Paleiskite pip install aspose-words-foss>=26.4.0 |
Tuščias tekstas iš get_text() | Įvesties failas yra tuščias arba sugadintas | Patikrinkite, ar įvesties failas teisingai atsidaro teksto redaktoriuje |
| PDF išvestyje trūksta vaizdų | Vaizdo formatas nepalaikomas konverterio | Naudokite DOCX įvestį su standartiniais įterptais vaizdais |
API nuorodų santrauka
| Klasė / Metodas | Aprašymas |
|---|---|
Document | Įkelti Word dokumentus iš DOCX, DOC, RTF, TXT arba Markdown |
Document.save() | Išsaugoti į PDF, Markdown, DOCX, DOC arba paprastą tekstą |
Document.get_text() | Išgauti paprasto teksto turinį |
SaveFormat | Konstantos: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Konfigūruoti PDF atitiktį ir JPEG kokybę |
MarkdownSaveOptions | Konfigūruoti pabraukimo formatavimo eksportą |