Διαχείριση Πυρήνα
Διαχείριση Πυρήνα
Η κλάση Document είναι το κεντρικό API για τη φόρτωση εγγράφων Word και τη μετατροπή τους σε άλλες μορφές. Αυτή η σελίδα καλύπτει τις ροές εργασίας μετατροπής μορφών, τη διαμόρφωση επιλογών αποθήκευσης και την εξαγωγή κειμένου.
Φόρτωση και αποθήκευση
Φορτώστε ένα έγγραφο με Document() και καλέστε save() με μια SaveFormat σταθερά για να μετατρέψετε μεταξύ μορφών. Υποστηριζόμενες εισόδους: DOCX, DOC, RTF, TXT, Markdown. Υποστηριζόμενες εξόδους: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)Καλέστε save() πολλές φορές στο ίδιο Document για να δημιουργήσετε πολλαπλές μορφές εξόδου χωρίς επαναφόρτωση.
Εξαγωγή PDF με PdfSaveOptions
Για προεπιλεγμένη έξοδο PDF, περάστε SaveFormat.PDF. Για λεπτομερή έλεγχο, χρησιμοποιήστε ένα αντικείμενο PdfSaveOptions:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions δέχεται ρυθμίσεις για την ποιότητα εικόνας JPEG (0–100, προεπιλογή 100) και το επίπεδο συμμόρφωσης με τα πρότυπα PDF (προεπιλογή PDF/1.7).
Εξαγωγή Markdown με MarkdownSaveOptions
Για προεπιλεγμένη έξοδο Markdown, περάστε SaveFormat.MARKDOWN. Χρησιμοποιήστε MarkdownSaveOptions όταν χρειάζεται να ελέγξετε τη συμπεριφορά μορφοποίησης:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())Το MarkdownSaveOptions υποστηρίζει τον έλεγχο της διατήρησης της μορφοποίησης υπογράμμισης στην έξοδο.
Εξαγωγή κειμένου
Εξάγετε απλό κείμενο από οποιοδήποτε φορτωμένο έγγραφο με get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()Για έξοδο αρχείου κειμένου, χρησιμοποιήστε SaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)Κοινά προβλήματα
| Πρόβλημα | Αιτία | Διόρθωση |
|---|---|---|
ModuleNotFoundError | Το πακέτο δεν είναι εγκατεστημένο | Εκτελέστε pip install aspose-words-foss>=26.4.0 |
Κενό κείμενο από get_text() | Το αρχείο εισόδου είναι κενό ή κατεστραμμένο | Επαληθεύστε ότι το αρχείο εισόδου ανοίγει σωστά σε επεξεργαστή κειμένου |
| Η έξοδος PDF δεν περιέχει εικόνες | Η μορφή εικόνας δεν υποστηρίζεται από τον μετατροπέα | Χρησιμοποιήστε είσοδο DOCX με τυπικές ενσωματωμένες εικόνες |
Σύνοψη Αναφοράς API
| Κλάση / Μέθοδος | Περιγραφή |
|---|---|
Document | Φόρτωση εγγράφων Word από DOCX, DOC, RTF, TXT ή Markdown |
Document.save() | Αποθήκευση σε PDF, Markdown, DOCX, DOC ή απλό κείμενο |
Document.get_text() | Εξαγωγή περιεχομένου απλού κειμένου |
SaveFormat | Σταθερές: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | Διαμόρφωση συμμόρφωσης PDF και ποιότητας JPEG |
MarkdownSaveOptions | Διαμόρφωση εξαγωγής μορφοποίησης υπογράμμισης |