Upravljanje jezgrom
Upravljanje jezgrom
Klasa Document je središnji API za učitavanje Word dokumenata i njihovo pretvaranje u druge formate. Ova stranica pokriva radne tokove konverzije formata, konfiguraciju opcija spremanja i izdvajanje teksta.
Učitavanje i spremanje
Učitajte dokument s Document() i pozovite save() s SaveFormat konstantom za konverziju između formata. Podržani ulazi: DOCX, DOC, RTF, TXT, Markdown. Podržani izlazi: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Pozovite save() više puta na istom Document kako biste proizveli više izlaznih formata bez ponovnog učitavanja.
PDF izvoz s PdfSaveOptions
Za zadani PDF izlaz, proslijedite SaveFormat.PDF. Za finu kontrolu, koristite objekt PdfSaveOptions:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions prihvaća postavke za kvalitetu JPEG slike (0–100, zadano 100) i razinu usklađenosti s PDF standardima (zadano PDF/1.7).
Izvoz u Markdown s MarkdownSaveOptions
Za zadani Markdown izlaz, proslijedite SaveFormat.MARKDOWN. Koristite MarkdownSaveOptions kada trebate kontrolirati ponašanje formatiranja:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions podržava kontrolu očuvanja formatiranja podcrtanog teksta u izlazu.
Ekstrakcija teksta
Izvucite običan tekst iz bilo kojeg učitanog dokumenta pomoću get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Za izlaz tekstualne datoteke, upotrijebite SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Uobičajeni problemi
| Problem | Uzrok | Rješenje |
|---|---|---|
ModuleNotFoundError | Paket nije instaliran | Pokrenite pip install aspose-words-foss>=26.4.0 |
Prazan tekst iz get_text() | Ulazna datoteka je prazna ili oštećena | Provjerite da se ulazna datoteka ispravno otvara u programu za obradu teksta |
| PDF izlaz bez slika | Format slike nije podržan od strane pretvarača | Koristite DOCX ulaz s uobičajenim ugrađenim slikama |
Sažetak API reference
| Klasa / Metoda | Opis |
|---|---|
Document | Učitaj Word dokumente iz DOCX, DOC, RTF, TXT ili Markdowna |
Document.save() | Spremi u PDF, Markdown, DOCX, DOC ili običan tekst |
Document.get_text() | Izvuci sadržaj običnog teksta |
SaveFormat | Konstante: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Konfiguriraj usklađenost PDF-a i kvalitetu JPEG-a |
MarkdownSaveOptions | Konfiguriraj izvoz formatiranja podcrtavanja |