Χαρακτηριστικά

Χαρακτηριστικά

Χαρακτηριστικά

Το Aspose.Words FOSS for Python είναι μια βιβλιοθήκη μετατροπής εγγράφων και εξαγωγής κειμένου για έγγραφα Word. Ολόκληρο το δημόσιο API είναι χτισμένο γύρω από την κλάση Document.


Υποστηριζόμενες μορφές εισόδου

Η κλάση Document φορτώνει αρχεία από αυτές τις μορφές αυτόματα με βάση την επέκταση του αρχείου:

ΜορφήΕπεκτάσεις
Έγγραφο Word.docx, .doc
Εμπλουτισμένο κείμενο.rtf
Απλό κείμενο.txt
Markdown.md

Μορφές Εξόδου και Επιλογές Αποθήκευσης

Καλέστε Document.save() με μια σταθερά SaveFormat για γρήγορη μετατροπή, ή περάστε ένα αντικείμενο επιλογών αποθήκευσης για λεπτομερή έλεγχο.

ΈξοδοςΣταθερά SaveFormatΚλάση Επιλογών Αποθήκευσης
PDFSaveFormat.PDFPdfSaveOptions — ρυθμίστε το επίπεδο συμμόρφωσης, την ποιότητα JPEG
MarkdownSaveFormat.MARKDOWNMarkdownSaveOptions — ελέγξτε την εξαγωγή μορφοποίησης υπογράμμισης
Απλό κείμενοSaveFormat.TEXT
Word (DOCX)SaveFormat.DOCX
Word (DOC)SaveFormat.DOC

Για παραδείγματα κώδικα και λεπτομέρειες διαμόρφωσης επιλογών αποθήκευσης, δείτε Core Management.


Ανάκτηση κειμένου

Document.get_text() επιστρέφει το πλήρες περιεχόμενο απλού κειμένου οποιουδήποτε φορτωμένου εγγράφου χωρίς να γράφει στο δίσκο.


Υποστήριξη εικόνας

Τα έγγραφα με ενσωματωμένες εικόνες μπορούν να μετατραπούν σε όλες τις υποστηριζόμενες μορφές εξόδου. Η διαδικασία μετατροπής διατηρεί το περιεχόμενο των εικόνων κατά τη διαδικασία εξαγωγής.


API Περίληψη

Κλάση / ΜέθοδοςΡόλος
DocumentΦόρτωση εγγράφων, μετατροπή μορφών, εξαγωγή κειμένου
SaveFormatΣταθερές μορφής εξόδου (PDF, MARKDOWN, TEXT, DOC, DOCX)
PdfSaveOptionsΔιαμόρφωση εξαγωγής PDF
MarkdownSaveOptionsΔιαμόρφωση εξαγωγής Markdown
 Ελληνικά