機能

機能

Aspose.Words FOSS for Python は、Word 文書用のドキュメント変換およびテキスト抽出ライブラリです。パブリック API 全体は Document クラスを中心に構築されています。


サポートされている入力形式

Document クラスは、ファイル拡張子に基づいてこれらの形式からファイルを自動的にロードします。

フォーマット拡張子
Word Document.docx, .doc
Rich Text.rtf
Plain Text.txt
Markdown.md

出力フォーマットと保存オプション

迅速な変換のために Document.save()SaveFormat 定数で呼び出すか、細かい制御のために save-options オブジェクトを渡してください。

出力SaveFormat 定数保存オプション クラス
PDFSaveFormat.PDFPdfSaveOptions — コンプライアンスレベルと JPEG 品質を設定
MarkdownSaveFormat.MARKDOWNMarkdownSaveOptions — 下線書式のエクスポートを制御
プレーンテキストSaveFormat.TEXT
Word (DOCX)SaveFormat.DOCX
Word (DOC)SaveFormat.DOC

コード例と保存オプションの構成詳細については、Core Managementをご覧ください。


テキスト抽出

Document.get_text() は、ディスクに書き込むことなく、ロードされた任意のドキュメントの完全なプレーンテキストコンテンツを返します。


画像サポート

埋め込み画像を含むドキュメントは、サポートされているすべての出力形式に変換できます。変換パイプラインは、エクスポートプロセスを通じて画像コンテンツを保持します。


API の概要

Class / MethodRole
Documentドキュメントの読み込み、形式変換、テキスト抽出
SaveFormat出力形式定数(PDFMARKDOWNTEXTDOCDOCX
PdfSaveOptionsPDF エクスポート設定
MarkdownSaveOptionsMarkdown エクスポート設定
 日本語