Upravljanje jezgrom

Upravljanje jezgrom

Upravljanje jezgrom

Osnovni API za upravljanje dokumentima izgrađen je oko klase Document, koja učitava Word dokumente i pruža save() za konverziju formata i get_text() za izdvajanje teksta. Koristite konstante SaveFormat ili objekte opcija čuvanja (PdfSaveOptions, MarkdownSaveOptions) za kontrolu izlaza.


Konverzija pojedinačnog dokumenta

Učitajte dokument pomoću klase Document i pozovite save() sa ciljnim formatom. Prosledite ili konstantu SaveFormat ili objekat opcija za čuvanje za izlazni format.

import aspose.words_foss as aw

doc = aw.Document("input.docx")  # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)

Grupna konverzija u sve formate

Pretvorite jedan ulazni fajl u više izlaznih formata pozivanjem save() više puta sa različitim SaveFormat konstantama (SaveFormat.MARKDOWN, SaveFormat.PDF, SaveFormat.TEXT).


PDF izvoz sa opcijama čuvanja

Koristite PdfSaveOptions za finu kontrolu PDF izlaza, ili SaveFormat.PDF za podrazumevana podešavanja.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Markdown izvoz

Izvezite dokumente u Markdown koristeći SaveFormat.MARKDOWN ili MarkdownSaveOptions za dodatnu kontrolu izlaza.

import aspose.words_foss as aw

doc = aw.Document("input.docx")  # or .doc, .rtf, .txt, .md
doc.save("output.md", aw.SaveFormat.MARKDOWN)

Извлачење текста

Izvucite sadržaj običnog teksta putem Document.get_text() ili izvezite kao običan tekst putem SaveFormat.TEXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Документи који садрже слике

Dokumenti sa ugrađenim slikama mogu se konvertovati u sve podržane izlazne formate. Pipeline za konverziju čuva sadržaj slika tokom procesa izvoza.


Saveti i najbolje prakse

  • Koristite SaveFormat konstante za brze konverzije; koristite objekte save-options kada vam je potrebna kontrola formatiranja
  • MarkdownSaveOptions.export_underline_formatting = True čuva stil podvlačenja u Markdown izlazu
  • Učitajte dokumente jednom i sačuvajte ih u više formata kako biste izbegli redundantna čitanja fajlova

Česti problemi

ProblemUzrokRešenje
ModuleNotFoundErrorPaket nije instaliranPokrenite pip install aspose-words-foss>=26.4.0
Prazan tekst iz get_text()Ulazni fajl je prazan ili oštećenProverite da li se ulazni fajl ispravno otvara u programu za obradu teksta
PDF izlaz bez slikaFormat slike nije podržan od strane konverteraKoristite DOCX ulaz sa standardno ugrađenim slikama

FAQ

Kako da konvertujem DOCX u PDF?

Učitajte dokument pomoću aw.Document("input.docx") i pozovite doc.save("output.pdf", aw.SaveFormat.PDF).

Могу ли да конвертујем више формата у једном позиву?

Da. Pozovite doc.save() više puta sa različitim SaveFormat konstantama da biste proizveli Markdown, PDF i običan tekst iz jednog učitanog dokumenta.

Kako da sačuvam podvučeno formatiranje u Markdown-u?

Kreirajte MarkdownSaveOptions objekat, postavite export_underline_formatting = True i prosledite ga doc.save().

Koji ulazni formati su podržani?

Biblioteka učitava DOCX, DOC, RTF, TXT i Markdown fajlove.


Резиме API референце

Klasa / MetodOpis
DocumentUčitaj Word dokumente iz DOCX, DOC, RTF, TXT ili Markdown
Document.save()Sačuvaj dokument u PDF, Markdown ili običan tekst
Document.get_text()Izvuci sadržaj običnog teksta iz učitanog dokumenta
SaveFormatKonstante za izbor izlaznog formata (PDF, MARKDOWN, TEXT)
PdfSaveOptionsDetaljna kontrola izvoza u PDF
MarkdownSaveOptionsDetaljna kontrola izvoza u Markdown
 Српски