Διαχείριση Πυρήνα

Διαχείριση Πυρήνα

Διαχείριση Πυρήνα

Η κλάση Document είναι το κεντρικό API για τη φόρτωση εγγράφων Word και τη μετατροπή τους σε άλλες μορφές. Αυτή η σελίδα καλύπτει τις ροές εργασίας μετατροπής μορφών, τη διαμόρφωση επιλογών αποθήκευσης και την εξαγωγή κειμένου.


Φόρτωση και αποθήκευση

Φορτώστε ένα έγγραφο με Document() και καλέστε save() με μια SaveFormat σταθερά για να μετατρέψετε μεταξύ μορφών. Υποστηριζόμενες εισόδους: DOCX, DOC, RTF, TXT, Markdown. Υποστηριζόμενες εξόδους: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

Καλέστε save() πολλές φορές στο ίδιο Document για να δημιουργήσετε πολλαπλές μορφές εξόδου χωρίς επαναφόρτωση.


Εξαγωγή PDF με PdfSaveOptions

Για προεπιλεγμένη έξοδο PDF, περάστε SaveFormat.PDF. Για λεπτομερή έλεγχο, χρησιμοποιήστε ένα αντικείμενο PdfSaveOptions:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions δέχεται ρυθμίσεις για την ποιότητα εικόνας JPEG (0–100, προεπιλογή 100) και το επίπεδο συμμόρφωσης με τα πρότυπα PDF (προεπιλογή PDF/1.7).


Εξαγωγή Markdown με MarkdownSaveOptions

Για προεπιλεγμένη έξοδο Markdown, περάστε SaveFormat.MARKDOWN. Χρησιμοποιήστε MarkdownSaveOptions όταν χρειάζεται να ελέγξετε τη συμπεριφορά μορφοποίησης:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

Το MarkdownSaveOptions υποστηρίζει τον έλεγχο της διατήρησης της μορφοποίησης υπογράμμισης στην έξοδο.


Εξαγωγή κειμένου

Εξάγετε απλό κείμενο από οποιοδήποτε φορτωμένο έγγραφο με get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

Για έξοδο αρχείου κειμένου, χρησιμοποιήστε SaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

Κοινά προβλήματα

ΠρόβλημαΑιτίαΔιόρθωση
ModuleNotFoundErrorΤο πακέτο δεν είναι εγκατεστημένοΕκτελέστε pip install aspose-words-foss>=26.4.0
Κενό κείμενο από get_text()Το αρχείο εισόδου είναι κενό ή κατεστραμμένοΕπαληθεύστε ότι το αρχείο εισόδου ανοίγει σωστά σε επεξεργαστή κειμένου
Η έξοδος PDF δεν περιέχει εικόνεςΗ μορφή εικόνας δεν υποστηρίζεται από τον μετατροπέαΧρησιμοποιήστε είσοδο DOCX με τυπικές ενσωματωμένες εικόνες

Σύνοψη Αναφοράς API

Κλάση / ΜέθοδοςΠεριγραφή
DocumentΦόρτωση εγγράφων Word από DOCX, DOC, RTF, TXT ή Markdown
Document.save()Αποθήκευση σε PDF, Markdown, DOCX, DOC ή απλό κείμενο
Document.get_text()Εξαγωγή περιεχομένου απλού κειμένου
SaveFormatΣταθερές: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsΔιαμόρφωση συμμόρφωσης PDF και ποιότητας JPEG
MarkdownSaveOptionsΔιαμόρφωση εξαγωγής μορφοποίησης υπογράμμισης
 Ελληνικά