कोर प्रबंधन
कोर प्रबंधन
Document क्लास Word दस्तावेज़ लोड करने और उन्हें अन्य फ़ॉर्मैट में परिवर्तित करने के लिए केंद्रीय API है। यह पृष्ठ फ़ॉर्मैट रूपांतरण कार्यप्रवाह, सहेजने‑विकल्प कॉन्फ़िगरेशन, और टेक्स्ट निष्कर्षण को कवर करता है।
लोडिंग और सहेजना
Document() के साथ एक दस्तावेज़ लोड करें और save() को SaveFormat स्थिरांक के साथ कॉल करें ताकि फ़ॉर्मैट्स के बीच रूपांतरण किया जा सके। समर्थित इनपुट: DOCX, DOC, RTF, TXT, Markdown। समर्थित आउटपुट: PDF, DOCX, DOC, Markdown, TXT।
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)save() को एक ही Document पर कई बार कॉल करें ताकि पुनः लोड किए बिना कई आउटपुट फ़ॉर्मेट उत्पन्न हो सकें।
PDF निर्यात with PdfSaveOptions
डिफ़ॉल्ट PDF आउटपुट के लिए, SaveFormat.PDF पास करें। सूक्ष्म नियंत्रण के लिए, एक PdfSaveOptions ऑब्जेक्ट का उपयोग करें:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions JPEG इमेज क्वालिटी (0–100, डिफ़ॉल्ट 100) और PDF मानकों के अनुपालन स्तर (डिफ़ॉल्ट PDF/1.7) के लिए सेटिंग्स स्वीकार करता है।
Markdown निर्यात MarkdownSaveOptions के साथ
डिफ़ॉल्ट मार्कडाउन आउटपुट के लिए, SaveFormat.MARKDOWN पास करें। जब आपको फ़ॉर्मेटिंग व्यवहार को नियंत्रित करने की आवश्यकता हो, तब MarkdownSaveOptions का उपयोग करें:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions आउटपुट में अंडरलाइन फ़ॉर्मेटिंग को संरक्षित करने के नियंत्रण का समर्थन करता है।
पाठ निष्कर्षण
get_text() के साथ लोड किए गए किसी भी दस्तावेज़ से सादा पाठ निकालें:
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()टेक्स्ट फ़ाइल आउटपुट के लिए, SaveFormat.TEXT का उपयोग करें:
doc.save("output.txt", aw.SaveFormat.TEXT)सामान्य समस्याएँ
| समस्या | कारण | समाधान |
|---|---|---|
ModuleNotFoundError | पैकेज स्थापित नहीं है | pip install aspose-words-foss>=26.4.0 चलाएँ |
get_text() से खाली पाठ | इनपुट फ़ाइल खाली या भ्रष्ट है | जाँचें कि इनपुट फ़ाइल शब्द प्रोसेसर में सही ढंग से खुलती है |
| PDF आउटपुट में छवियाँ गायब हैं | छवि प्रारूप कनवर्टर द्वारा समर्थित नहीं है | मानक एम्बेडेड छवियों के साथ DOCX इनपुट का उपयोग करें |
API रेफ़रेंस सारांश
| क्लास / मेथड | विवरण |
|---|---|
Document | DOCX, DOC, RTF, TXT, या मार्कडाउन से Word दस्तावेज़ लोड करें |
Document.save() | PDF, मार्कडाउन, DOCX, DOC, या साधारण टेक्स्ट में सहेजें |
Document.get_text() | साधारण टेक्स्ट सामग्री निकालें |
SaveFormat | स्थिरांक: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | PDF अनुपालन और JPEG गुणवत्ता कॉन्फ़िगर करें |
MarkdownSaveOptions | अंडरलाइन फ़ॉर्मेटिंग निर्यात को कॉन्फ़िगर करें |