はじめに
Aspose.Note FOSS for Python is a free, open-source library for reading Microsoft OneNote .one セクション ファイルです。Aspose.Note をモデルにした .NET 用のパブリック API を提供し、pure-Python MS-ONE/OneStore バイナリパーサーをバックエンドにしています。Microsoft Office のインストールは不要です。.
できること
- 読み取り
.oneファイル: 任意の OneNote 2010、OneNote Online、または OneNote 2007 のセクション ファイルを開く - ドキュメント DOM をトラバースする: ページ、アウトライン、アウトライン要素、すべてのコンテンツタイプをナビゲートする
- テキストを抽出する: プレーンテキストを読み取るか、個々の書式ラン(太字、斜体、ハイパーリンク、フォントカラー)を検査する
- 画像を抽出する: 埋め込み画像をファイル名とサイズ情報付きの生バイトとして取得する
- 添付ファイルを抽出する: 埋め込みファイル添付をディスクに保存する
- テーブルを解析する: テーブルの行とセルを走査し、列幅とセル内容を読み取る
- タグとリストを検査する: OneNote のタグ (NoteTag) と番号付きリストのメタデータを読み取る
- PDFへエクスポート: 任意の読み込まれたドキュメントを、オプションのReportLabバックエンドを使用してPDFに保存する
前提条件
| 要件 | 詳細 |
|---|---|
| Python | 3.10 or later |
| オペレーティングシステム | 任意(Windows、Linux、macOS)、OS非依存 |
| Microsoft Office | 不要 |
| PDF エクスポート | 必要 reportlab>=3.6; インストールは [pdf] 追加 |
インストール
PyPI からコアライブラリをインストール:
pip install aspose-notePDF に文書をエクスポートする予定がある場合は、次を使用してインストールしてください [pdf] 追加:
pip install "aspose-note[pdf]"詳細なインストールオプション(編集可能インストール、仮想環境)については、以下をご覧ください インストールガイド.
最初のスクリプト
以下のスクリプトは OneNote セクションファイルを読み込み、セクションの表示名とページ数を出力し、さらにすべてのページタイトルを一覧表示します:
from aspose.note import Document
doc = Document("MyNotes.one")
print(f"Section: {doc.DisplayName}")
print(f"Pages: {len(list(doc))}")
for page in doc:
title = (
page.Title.TitleText.Text
if page.Title and page.Title.TitleText
else "(untitled)"
)
print(f" - {title}")重要: 公開インポートパスは from aspose.note import .... 使用しないでください import aspose_note または from onenote import ..., それらは正しいパッケージ名ではありません。.
すべてのテキストを抽出
from aspose.note import Document, RichText
doc = Document("MyNotes.one")
for rt in doc.GetChildNodes(RichText):
if rt.Text:
print(rt.Text)PDFへエクスポート
from aspose.note import Document, SaveFormat
doc = Document("MyNotes.one")
doc.Save("output.pdf", SaveFormat.Pdf)必要 pip install "aspose-note[pdf]".
次のステップ
- インストール: すべてのインストール方法、仮想環境、PDF 依存関係
- 開発者ガイド: テキスト、画像、テーブル、タグ、PDF の例を含む完全な API リファレンス
- 機能概要: コードサンプル付きの完全な機能リスト
- KB 記事: 実践的なハウツーガイド
- API リファレンス: 完全なクラスとメソッドのリファレンス