Pagrindinis valdymas

Pagrindinis valdymas

Pagrindinis valdymas

Document klasė yra pagrindinis API, skirtas įkelti Word dokumentus ir konvertuoti juos į kitus formatus. Šiame puslapyje aptariami formatų konvertavimo darbo srautai, išsaugojimo parinkčių konfigūracija ir teksto išgavimas.


Įkėlimas ir išsaugojimas

Įkelkite dokumentą su Document() ir iškvieskite save() su SaveFormat konstanta, kad konvertuotumėte tarp formatų. Palaikomi įvesties formatai: DOCX, DOC, RTF, TXT, Markdown. Palaikomi išvesties formatai: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Iškvieskite save() kelis kartus tame pačiame Document, kad sukurtumėte kelis išvesties formatus be perkrovimo.


PDF eksportavimas su PdfSaveOptions

Numatytajam PDF išvedimui perduokite SaveFormat.PDF. Norėdami gauti smulkią kontrolę, naudokite PdfSaveOptions objektą:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions priima nustatymus JPEG vaizdo kokybei (0–100, numatyta 100) ir PDF standartų atitikties lygiui (numatyta PDF/1.7).


Markdown eksportas su MarkdownSaveOptions

Numatytajam Markdown išvedimui perduokite SaveFormat.MARKDOWN. Naudokite MarkdownSaveOptions, kai reikia valdyti formatavimo elgseną:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions palaiko pabraukimo formatavimo išsaugojimo valdymą išvestyje.


Teksto išgavimas

Išgaukite paprastą tekstą iš bet kurio įkelto dokumento su get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Tekstinių failų išvedimui naudokite SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Bendros problemos

ProblemaPriežastisSprendimas
ModuleNotFoundErrorPaketas neįdiegtasPaleiskite pip install aspose-words-foss>=26.4.0
Tuščias tekstas iš get_text()Įvesties failas yra tuščias arba sugadintasPatikrinkite, ar įvesties failas teisingai atsidaro teksto redaktoriuje
PDF išvestyje trūksta vaizdųVaizdo formatas nepalaikomas konverterioNaudokite DOCX įvestį su standartiniais įterptais vaizdais

API nuorodų santrauka

Klasė / MetodasAprašymas
DocumentĮkelti Word dokumentus iš DOCX, DOC, RTF, TXT arba Markdown
Document.save()Išsaugoti į PDF, Markdown, DOCX, DOC arba paprastą tekstą
Document.get_text()Išgauti paprasto teksto turinį
SaveFormatKonstantos: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsKonfigūruoti PDF atitiktį ir JPEG kokybę
MarkdownSaveOptionsKonfigūruoti pabraukimo formatavimo eksportą
 Lietuvių