ניהול ליבה

ניהול ליבה

ניהול ליבה

המחלקה Document היא ה‑API המרכזי לטעינת מסמכי Word והמרתם לפורמטים אחרים. דף זה מכסה זרימות עבודה של המרת פורמטים, תצורת אפשרויות שמירה והוצאת טקסט.


טעינה ושמירה

טען מסמך עם Document() וקרא ל-save() עם קבוע SaveFormat כדי להמיר בין פורמטים. קלטים נתמכים: DOCX, DOC, RTF, TXT, Markdown. פלטים נתמכים: PDF, DOCX, DOC, Markdown, TXT.

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)

הפעל save() מספר פעמים על אותו Document כדי לייצר פורמטים מרובים של פלט ללא טעינה מחדש.


ייצוא PDF עם PdfSaveOptions

ליצוא PDF ברירת מחדל, העבר SaveFormat.PDF. לשליטה מדויקת, השתמש באובייקט PdfSaveOptions:

import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions

doc = aw.Document("input.docx")

# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)

# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())

PdfSaveOptions מקבל הגדרות לאיכות תמונת JPEG (0–100, ברירת מחדל 100) ולרמת התאימות לתקני PDF (ברירת מחדל PDF/1.7).


ייצוא Markdown עם MarkdownSaveOptions

ליצוא ברירת מחדל של Markdown, העבר SaveFormat.MARKDOWN. השתמש בMarkdownSaveOptions כאשר אתה צריך לשלוט בהתנהגות העיצוב:

import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions

doc = aw.Document("input.docx")

# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)

# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())

MarkdownSaveOptions תומך בשליטה על שמירת עיצוב הקו התחתון בפלט.


חילוץ טקסט

חלץ טקסט פשוט מכל מסמך טעון עם get_text():

import aspose.words_foss as aw

doc = aw.Document("input.docx")
text = doc.get_text()

ליצוא קובץ טקסט, השתמש בSaveFormat.TEXT:

doc.save("output.txt", aw.SaveFormat.TEXT)

בעיות נפוצות

בעיהסיבהתיקון
ModuleNotFoundErrorהחבילה לא מותקנתהפעל pip install aspose-words-foss>=26.4.0
טקסט ריק מget_text()קובץ הקלט ריק או פגוםודא שקובץ הקלט נפתח כראוי בתוכנת עיבוד תמלילים
פלט PDF חסר תמונותפורמט התמונה אינו נתמך על ידי הממירהשתמש בקלט DOCX עם תמונות משובצות סטנדרטיות

סיכום תיעוד API

Class / MethodDescription
Documentטען מסמכי Word מ‑DOCX, DOC, RTF, TXT או Markdown
Document.save()שמור ל‑PDF, Markdown, DOCX, DOC או טקסט פשוט
Document.get_text()חלץ תוכן טקסט פשוט
SaveFormatקבועים: PDF, MARKDOWN, TEXT, DOC, DOCX
PdfSaveOptionsהגדר תאימות PDF ואיכות JPEG
MarkdownSaveOptionsהגדר ייצוא עיצוב קו תחתי
 עברית