Χαρακτηριστικά
Χαρακτηριστικά
Το Aspose.Words FOSS for Python είναι μια βιβλιοθήκη μετατροπής εγγράφων και εξαγωγής κειμένου για έγγραφα Word. Ολόκληρο το δημόσιο API είναι χτισμένο γύρω από την κλάση Document.
Υποστηριζόμενες μορφές εισόδου
Η κλάση Document φορτώνει αρχεία από αυτές τις μορφές αυτόματα με βάση την επέκταση του αρχείου:
| Μορφή | Επεκτάσεις |
|---|---|
| Έγγραφο Word | .docx, .doc |
| Εμπλουτισμένο κείμενο | .rtf |
| Απλό κείμενο | .txt |
| Markdown | .md |
Μορφές Εξόδου και Επιλογές Αποθήκευσης
Καλέστε Document.save() με μια σταθερά SaveFormat για γρήγορη μετατροπή, ή περάστε ένα αντικείμενο επιλογών αποθήκευσης για λεπτομερή έλεγχο.
| Έξοδος | Σταθερά SaveFormat | Κλάση Επιλογών Αποθήκευσης |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — ρυθμίστε το επίπεδο συμμόρφωσης, την ποιότητα JPEG | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — ελέγξτε την εξαγωγή μορφοποίησης υπογράμμισης |
| Απλό κείμενο | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
Για παραδείγματα κώδικα και λεπτομέρειες διαμόρφωσης επιλογών αποθήκευσης, δείτε Core Management.
Ανάκτηση κειμένου
Document.get_text() επιστρέφει το πλήρες περιεχόμενο απλού κειμένου οποιουδήποτε φορτωμένου εγγράφου χωρίς να γράφει στο δίσκο.
Υποστήριξη εικόνας
Τα έγγραφα με ενσωματωμένες εικόνες μπορούν να μετατραπούν σε όλες τις υποστηριζόμενες μορφές εξόδου. Η διαδικασία μετατροπής διατηρεί το περιεχόμενο των εικόνων κατά τη διαδικασία εξαγωγής.
API Περίληψη
| Κλάση / Μέθοδος | Ρόλος |
|---|---|
Document | Φόρτωση εγγράφων, μετατροπή μορφών, εξαγωγή κειμένου |
SaveFormat | Σταθερές μορφής εξόδου (PDF, MARKDOWN, TEXT, DOC, DOCX) |
PdfSaveOptions | Διαμόρφωση εξαγωγής PDF |
MarkdownSaveOptions | Διαμόρφωση εξαγωγής Markdown |