Značajke
Značajke
Aspose.Words FOSS for Python je biblioteka za pretvaranje dokumenata i izdvajanje teksta za Word dokumente. Cijeli javni API izgrađen je oko klase Document.
Podržani ulazni formati
Klasa Document učitava datoteke iz ovih formata automatski na temelju ekstenzije datoteke:
| Format | Ekstenzije |
|---|---|
| Word dokument | .docx, .doc |
| Rich Text | .rtf |
| Obični tekst | .txt |
| Markdown | .md |
Izlazni formati i opcije spremanja
Pozovite Document.save() s SaveFormat konstantom za brzu konverziju, ili proslijedite objekt opcija spremanja za detaljnu kontrolu.
| Izlaz | SaveFormat konstanta | Klasa opcija spremanja |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — konfigurirajte razinu usklađenosti, JPEG kvalitetu | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — kontrolirajte izvoz formatiranja podcrtavanja |
| Obični tekst | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Za primjere koda i detalje konfiguracije opcija spremanja, pogledajte Core Management.
Ekstrakcija teksta
Document.get_text() vraća cijeli sadržaj običnog teksta bilo kojeg učitanog dokumenta bez zapisivanja na disk.
Podrška za slike
Dokumenti s ugrađenim slikama mogu se pretvoriti u sve podržane izlazne formate. Cjevovod za konverziju očuva sadržaj slika tijekom procesa izvoza.
Sažetak API-ja
| Klasa / Metoda | Uloga |
|---|---|
Document | Učitaj dokumente, pretvori formate, izdvoji tekst |
SaveFormat | Konstante izlaznih formata (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | Konfiguracija PDF izvoza |
MarkdownSaveOptions | Konfiguracija Markdown izvoza |