Značajke

Značajke

Aspose.Words FOSS for Python je biblioteka za pretvaranje dokumenata i izdvajanje teksta za Word dokumente. Cijeli javni API izgrađen je oko klase Document.


Podržani ulazni formati

Klasa Document učitava datoteke iz ovih formata automatski na temelju ekstenzije datoteke:

FormatEkstenzije
Word dokument.docx, .doc
Rich Text.rtf
Obični tekst.txt
Markdown.md

Izlazni formati i opcije spremanja

Pozovite Document.save() s SaveFormat konstantom za brzu konverziju, ili proslijedite objekt opcija spremanja za detaljnu kontrolu.

IzlazSaveFormat konstantaKlasa opcija spremanja
PDFSaveFormat.PDFPdfSaveOptions — konfigurirajte razinu usklađenosti, JPEG kvalitetu
MarkdownSaveFormat.MARKDOWNMarkdownSaveOptions — kontrolirajte izvoz formatiranja podcrtavanja
Obični tekstSaveFormat.TEXT
Word (DOCX)SaveFormat.DOCX
Word (DOC)SaveFormat.DOC

Za primjere koda i detalje konfiguracije opcija spremanja, pogledajte Core Management.


Ekstrakcija teksta

Document.get_text() vraća cijeli sadržaj običnog teksta bilo kojeg učitanog dokumenta bez zapisivanja na disk.


Podrška za slike

Dokumenti s ugrađenim slikama mogu se pretvoriti u sve podržane izlazne formate. Cjevovod za konverziju očuva sadržaj slika tijekom procesa izvoza.


Sažetak API-ja

Klasa / MetodaUloga
DocumentUčitaj dokumente, pretvori formate, izdvoji tekst
SaveFormatKonstante izlaznih formata (PDF, MARKDOWN, TEXT, DOC, DOCX)
PdfSaveOptionsKonfiguracija PDF izvoza
MarkdownSaveOptionsKonfiguracija Markdown izvoza
 Hrvatski