ניהול ליבה
ניהול ליבה
המחלקה Document היא ה‑API המרכזי לטעינת מסמכי Word והמרתם לפורמטים אחרים. דף זה מכסה זרימות עבודה של המרת פורמטים, תצורת אפשרויות שמירה והוצאת טקסט.
טעינה ושמירה
טען מסמך עם Document() וקרא ל-save() עם קבוע SaveFormat כדי להמיר בין פורמטים. קלטים נתמכים: DOCX, DOC, RTF, TXT, Markdown. פלטים נתמכים: PDF, DOCX, DOC, Markdown, TXT.
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.md", aw.SaveFormat.MARKDOWN)
doc.save("output.pdf", aw.SaveFormat.PDF)
doc.save("output.txt", aw.SaveFormat.TEXT)הפעל save() מספר פעמים על אותו Document כדי לייצר פורמטים מרובים של פלט ללא טעינה מחדש.
ייצוא PDF עם PdfSaveOptions
ליצוא PDF ברירת מחדל, העבר SaveFormat.PDF. לשליטה מדויקת, השתמש באובייקט PdfSaveOptions:
import aspose.words_foss as aw
from aspose.words_foss.saving import PdfSaveOptions
doc = aw.Document("input.docx")
# Default PDF export
doc.save("default.pdf", aw.SaveFormat.PDF)
# Customized PDF export with save options
doc.save("custom.pdf", PdfSaveOptions())PdfSaveOptions מקבל הגדרות לאיכות תמונת JPEG (0–100, ברירת מחדל 100) ולרמת התאימות לתקני PDF (ברירת מחדל PDF/1.7).
ייצוא Markdown עם MarkdownSaveOptions
ליצוא ברירת מחדל של Markdown, העבר SaveFormat.MARKDOWN. השתמש בMarkdownSaveOptions כאשר אתה צריך לשלוט בהתנהגות העיצוב:
import aspose.words_foss as aw
from aspose.words_foss.saving import MarkdownSaveOptions
doc = aw.Document("input.docx")
# Default Markdown export
doc.save("default.md", aw.SaveFormat.MARKDOWN)
# Customized Markdown export with save options
doc.save("with_options.md", MarkdownSaveOptions())MarkdownSaveOptions תומך בשליטה על שמירת עיצוב הקו התחתון בפלט.
חילוץ טקסט
חלץ טקסט פשוט מכל מסמך טעון עם get_text():
import aspose.words_foss as aw
doc = aw.Document("input.docx")
text = doc.get_text()ליצוא קובץ טקסט, השתמש בSaveFormat.TEXT:
doc.save("output.txt", aw.SaveFormat.TEXT)בעיות נפוצות
| בעיה | סיבה | תיקון |
|---|---|---|
ModuleNotFoundError | החבילה לא מותקנת | הפעל pip install aspose-words-foss>=26.4.0 |
טקסט ריק מget_text() | קובץ הקלט ריק או פגום | ודא שקובץ הקלט נפתח כראוי בתוכנת עיבוד תמלילים |
| פלט PDF חסר תמונות | פורמט התמונה אינו נתמך על ידי הממיר | השתמש בקלט DOCX עם תמונות משובצות סטנדרטיות |
סיכום תיעוד API
| Class / Method | Description |
|---|---|
Document | טען מסמכי Word מ‑DOCX, DOC, RTF, TXT או Markdown |
Document.save() | שמור ל‑PDF, Markdown, DOCX, DOC או טקסט פשוט |
Document.get_text() | חלץ תוכן טקסט פשוט |
SaveFormat | קבועים: PDF, MARKDOWN, TEXT, DOC, DOCX |
PdfSaveOptions | הגדר תאימות PDF ואיכות JPEG |
MarkdownSaveOptions | הגדר ייצוא עיצוב קו תחתי |