Upravljanje jezgrom
Upravljanje jezgrom
Osnovni API za upravljanje dokumentima izgrađen je oko klase Document, koja učitava Word dokumente i pruža save() za konverziju formata i get_text() za izdvajanje teksta. Koristite konstante SaveFormat ili objekte opcija čuvanja (PdfSaveOptions, MarkdownSaveOptions) za kontrolu izlaza.
Konverzija pojedinačnog dokumenta
Učitajte dokument pomoću klase Document i pozovite save() sa ciljnim formatom. Prosledite ili konstantu SaveFormat ili objekat opcija za čuvanje za izlazni format.
import aspose.words_foss as aw
doc = aw.Document("input.docx") # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)Grupna konverzija u sve formate
Pretvorite jedan ulazni fajl u više izlaznih formata pozivanjem save() više puta sa različitim SaveFormat konstantama (SaveFormat.MARKDOWN, SaveFormat.PDF, SaveFormat.TEXT).
PDF izvoz sa opcijama čuvanja
Koristite PdfSaveOptions za finu kontrolu PDF izlaza, ili SaveFormat.PDF za podrazumevana podešavanja.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)Markdown izvoz
Izvezite dokumente u Markdown koristeći SaveFormat.MARKDOWN ili MarkdownSaveOptions za dodatnu kontrolu izlaza.
import aspose.words_foss as aw
doc = aw.Document("input.docx") # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)Извлачење текста
Izvucite sadržaj običnog teksta putem Document.get_text() ili izvezite kao običan tekst putem SaveFormat.TEXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Документи који садрже слике
Dokumenti sa ugrađenim slikama mogu se konvertovati u sve podržane izlazne formate. Pipeline za konverziju čuva sadržaj slika tokom procesa izvoza.
Saveti i najbolje prakse
- Koristite
SaveFormatkonstante za brze konverzije; koristite objekte save-options kada vam je potrebna kontrola formatiranja MarkdownSaveOptions.export_underline_formatting = Truečuva stil podvlačenja u Markdown izlazu- Učitajte dokumente jednom i sačuvajte ih u više formata kako biste izbegli redundantna čitanja fajlova
Česti problemi
| Problem | Uzrok | Rešenje |
|---|---|---|
ModuleNotFoundError | Paket nije instaliran | Pokrenite pip install aspose-words-foss>=26.4.0 |
Prazan tekst iz get_text() | Ulazni fajl je prazan ili oštećen | Proverite da li se ulazni fajl ispravno otvara u programu za obradu teksta |
| PDF izlaz bez slika | Format slike nije podržan od strane konvertera | Koristite DOCX ulaz sa standardno ugrađenim slikama |
FAQ
Kako da konvertujem DOCX u PDF?
Učitajte dokument pomoću aw.Document("input.docx") i pozovite doc.save("output.pdf", aw.SaveFormat.PDF).
Могу ли да конвертујем више формата у једном позиву?
Da. Pozovite doc.save() više puta sa različitim SaveFormat konstantama da biste proizveli Markdown, PDF i običan tekst iz jednog učitanog dokumenta.
Kako da sačuvam podvučeno formatiranje u Markdown-u?
Kreirajte MarkdownSaveOptions objekat, postavite export_underline_formatting = True i prosledite ga doc.save().
Koji ulazni formati su podržani?
Biblioteka učitava DOCX, DOC, RTF, TXT i Markdown fajlove.
Резиме API референце
| Klasa / Metod | Opis |
|---|---|
Document | Učitaj Word dokumente iz DOCX, DOC, RTF, TXT ili Markdown |
Document.save() | Sačuvaj dokument u PDF, Markdown ili običan tekst |
Document.get_text() | Izvuci sadržaj običnog teksta iz učitanog dokumenta |
SaveFormat | Konstante za izbor izlaznog formata (PDF, MARKDOWN, TEXT) |
PdfSaveOptions | Detaljna kontrola izvoza u PDF |
MarkdownSaveOptions | Detaljna kontrola izvoza u Markdown |