機能
機能
Aspose.Words FOSS for Python は、Word 文書用のドキュメント変換およびテキスト抽出ライブラリです。パブリック API 全体は Document クラスを中心に構築されています。
サポートされている入力形式
Document クラスは、ファイル拡張子に基づいてこれらの形式からファイルを自動的にロードします。
| フォーマット | 拡張子 |
|---|---|
| Word Document | .docx, .doc |
| Rich Text | .rtf |
| Plain Text | .txt |
| Markdown | .md |
出力フォーマットと保存オプション
迅速な変換のために Document.save() を SaveFormat 定数で呼び出すか、細かい制御のために save-options オブジェクトを渡してください。
| 出力 | SaveFormat 定数 | 保存オプション クラス |
|---|---|---|
SaveFormat.PDF | PdfSaveOptions — コンプライアンスレベルと JPEG 品質を設定 | |
| Markdown | SaveFormat.MARKDOWN | MarkdownSaveOptions — 下線書式のエクスポートを制御 |
| プレーンテキスト | SaveFormat.TEXT | — |
| Word (DOCX) | SaveFormat.DOCX | — |
| Word (DOC) | SaveFormat.DOC | — |
コード例と保存オプションの構成詳細については、Core Managementをご覧ください。
テキスト抽出
Document.get_text() は、ディスクに書き込むことなく、ロードされた任意のドキュメントの完全なプレーンテキストコンテンツを返します。
画像サポート
埋め込み画像を含むドキュメントは、サポートされているすべての出力形式に変換できます。変換パイプラインは、エクスポートプロセスを通じて画像コンテンツを保持します。
API の概要
| Class / Method | Role |
|---|---|
Document | ドキュメントの読み込み、形式変換、テキスト抽出 |
SaveFormat | 出力形式定数(PDF、MARKDOWN、TEXT、DOC、DOCX) |
PdfSaveOptions | PDF エクスポート設定 |
MarkdownSaveOptions | Markdown エクスポート設定 |