Upravljanje jezgrom

Upravljanje jezgrom

Upravljanje jezgrom

Klasa Document je središnji API za učitavanje Word dokumenata i njihovo pretvaranje u druge formate. Ova stranica pokriva radne tokove konverzije formata, konfiguraciju opcija spremanja i izdvajanje teksta.


Učitavanje i spremanje

Učitajte dokument s Document() i pozovite save() s SaveFormat konstantom za konverziju između formata. Podržani ulazi: DOCX, DOC, RTF, TXT, Markdown. Podržani izlazi: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Pozovite save() više puta na istom Document kako biste proizveli više izlaznih formata bez ponovnog učitavanja.


PDF izvoz s PdfSaveOptions

Za zadani PDF izlaz, proslijedite SaveFormat.PDF. Za finu kontrolu, koristite objekt PdfSaveOptions:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions prihvaća postavke za kvalitetu JPEG slike (0–100, zadano 100) i razinu usklađenosti s PDF standardima (zadano PDF/1.7).


Izvoz u Markdown s MarkdownSaveOptions

Za zadani Markdown izlaz, proslijedite SaveFormat.MARKDOWN. Koristite MarkdownSaveOptions kada trebate kontrolirati ponašanje formatiranja:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions podržava kontrolu očuvanja formatiranja podcrtanog teksta u izlazu.


Ekstrakcija teksta

Izvucite običan tekst iz bilo kojeg učitanog dokumenta pomoću get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Za izlaz tekstualne datoteke, upotrijebite SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Uobičajeni problemi

ProblemUzrokRješenje
ModuleNotFoundErrorPaket nije instaliranPokrenite pip install aspose-words-foss>=26.4.0
Prazan tekst iz get_text()Ulazna datoteka je prazna ili oštećenaProvjerite da se ulazna datoteka ispravno otvara u programu za obradu teksta
PDF izlaz bez slikaFormat slike nije podržan od strane pretvaračaKoristite DOCX ulaz s uobičajenim ugrađenim slikama

Sažetak API reference

Klasa / MetodaOpis
DocumentUčitaj Word dokumente iz DOCX, DOC, RTF, TXT ili Markdowna
Document.save()Spremi u PDF, Markdown, DOCX, DOC ili običan tekst
Document.get_text()Izvuci sadržaj običnog teksta
SaveFormatKonstante: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsKonfiguriraj usklađenost PDF-a i kvalitetu JPEG-a
MarkdownSaveOptionsKonfiguriraj izvoz formatiranja podcrtavanja
 Hrvatski