مدیریت هسته
مدیریت هسته
کلاس Document API مرکزی برای بارگذاری اسناد Word و تبدیل آنها به فرمتهای دیگر است. این صفحه شامل جریانهای کاری تبدیل فرمت، پیکربندی گزینههای ذخیرهسازی و استخراج متن میباشد.
بارگذاری و ذخیرهسازی
یک سند را با Document() بارگذاری کنید و save() را با یک ثابت SaveFormat فراخوانی کنید تا بین فرمتها تبدیل شود. ورودیهای پشتیبانیشده: DOCX، DOC، RTF، TXT، Markdown. خروجیهای پشتیبانیشده: PDF، DOCX، DOC، Markdown، TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)دستور save() را چندین بار بر روی همان Document فراخوانی کنید تا بدون بارگذاری مجدد، چندین فرمت خروجی تولید شود.
صادرات PDF با PdfSaveOptions
برای خروجی پیشفرض PDF، SaveFormat.PDF را پاس دهید. برای کنترل دقیق، از شی PdfSaveOptions استفاده کنید:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions تنظیمات کیفیت تصویر JPEG (0–100، پیشفرض 100) و سطح انطباق با استانداردهای PDF (پیشفرض PDF/1.7) را میپذیرد.
صادرات Markdown با MarkdownSaveOptions
برای خروجی پیشفرض Markdown، SaveFormat.MARKDOWN را پاس دهید. وقتی نیاز به کنترل رفتار قالببندی دارید، از MarkdownSaveOptions استفاده کنید:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions از کنترل حفظ قالببندی زیرخط در خروجی پشتیبانی میکند.
استخراج متن
متن ساده را از هر سند بارگذاریشده با get_text() استخراج کنید:
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()برای خروجی فایل متنی، از SaveFormat.TEXT استفاده کنید:
doc.save("output.txt", aw.SaveFormat.TEXT)مشکلات رایج
| Issue | Cause | Fix |
|---|---|---|
ModuleNotFoundError | بسته نصب نشده است | اجرای pip install aspose-words-foss>=26.4.0 |
متن خالی از get_text() | فایل ورودی خالی یا خراب است | بررسی کنید که فایل ورودی بهدرستی در یک واژهپرداز باز میشود |
| خروجی PDF فاقد تصاویر است | قالب تصویر توسط مبدل پشتیبانی نمیشود | از ورودی DOCX با تصاویر استاندارد جاسازیشده استفاده کنید |
خلاصه مرجع API
| Class / Method | Description |
|---|---|
Document | بارگذاری اسناد Word از فرمتهای DOCX، DOC، RTF، TXT یا Markdown |
Document.save() | ذخیره به PDF، Markdown، DOCX، DOC یا متن ساده |
Document.get_text() | استخراج محتوای متن ساده |
SaveFormat | ثابتها: PDF، MARKDOWN، TEXT، DOC، DOCX |
PdfSaveOptions | پیکربندی سازگاری PDF و کیفیت JPEG |
MarkdownSaveOptions | پیکربندی خروجی قالببندی زیرخط |