Funkcije
Функције
Aspose.Words FOSS for Python je biblioteka za konverziju dokumenata i izdvajanje teksta za Word dokumente. Ceo javni API je izgrađen oko klase Document.
Podržani ulazni formati
Klasa Document učitava fajlove iz ovih formata automatski na osnovu ekstenzije fajla:
| Format | Ekstenzije |
|---|---|
| Word dokument | .docx, .doc |
| Rich Text | .rtf |
| Običan tekst | .txt |
| Markdown | .md |
Izlazni formati i opcije čuvanja
Pozovite Document.save() sa SaveFormat konstantom za brzu konverziju, ili prosledite objekat opcija za čuvanje za detaljnu kontrolu.
| Izlaz | SaveFormat konstanta | Klasa opcija za čuvanje |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — konfigurišite nivo usklađenosti, JPEG kvalitet | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — kontrolišite izvoz formatiranja podvlačenja |
| Plain Text | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Za primere koda i detalje konfiguracije opcija čuvanja, pogledajte Core Management.
Извлачење текста
Document.get_text() vraća kompletan plain‑text sadržaj bilo kog učitanog dokumenta bez upisivanja na disk.
Подршка за слике
Dokumenti sa ugrađenim slikama mogu se konvertovati u sve podržane izlazne formate. Pipeline za konverziju čuva sadržaj slika tokom procesa izvoza.
Pregled API-ja
| Class / Method | Role |
|---|---|
Document | Učitaj dokumente, konvertuj formate, izvuci tekst |
SaveFormat | Konstante izlaznih formata (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | Konfiguracija PDF izvoza |
MarkdownSaveOptions | Konfiguracija Markdown izvoza |