快速入门
Aspose.Note FOSS for Python is a free, open-source library for reading Microsoft OneNote .one section files. 它提供了一个基于 Aspose.Note 为 .NET 设计的公共 API,使用纯-Python MS-ONE/OneStore 二进制解析器。无需安装 Microsoft Office。.
您可以做什么
- 读取
.one文件: 打开任何 OneNote 2010、OneNote Online 或 OneNote 2007 section 文件 - 遍历文档 DOM: 导航页面、提纲、提纲元素以及所有内容类型
- 提取文本: 读取纯文本或检查单独的格式运行(粗体、斜体、超链接、字体颜色)
- 提取图像: 检索嵌入的图像原始字节,包含文件名和尺寸
- 提取附件文件: 将嵌入的文件附件保存到磁盘
- 解析表格: 遍历表格行和单元格,读取列宽和单元格内容
- 检查标签和列表: 读取 OneNote 标签(NoteTag)和编号列表元数据
- 导出为 PDF: 保存任何已加载的文档为 PDF,使用可选的 ReportLab 后端
前置条件
| 要求 | 详情 |
|---|---|
| Python | 3.10 or later |
| 操作系统 | 任何 (Windows, Linux, macOS),与操作系统无关 |
| Microsoft Office | 不需要 |
| PDF 导出 | 需要 reportlab>=3.6; 通过以下方式安装 [pdf] 额外 |
安装
从 PyPI 安装核心库::
pip install aspose-note如果您计划将文档导出为 PDF,请使用以下方式安装 [pdf] 额外::
pip install "aspose-note[pdf]"有关详细的安装选项(可编辑安装、虚拟环境),请参阅 安装指南.
您的第一个脚本
以下脚本加载 OneNote 节文件,打印节的显示名称和页面计数,然后列出每个页面的标题::
from aspose.note import Document
doc = Document("MyNotes.one")
print(f"Section: {doc.DisplayName}")
print(f"Pages: {len(list(doc))}")
for page in doc:
title = (
page.Title.TitleText.Text
if page.Title and page.Title.TitleText
else "(untitled)"
)
print(f" - {title}")重要: 公共导入路径是 from aspose.note import .... 请勿使用 import aspose_note 或 from onenote import ..., 因为这些不是正确的包名。.
提取全部文本
from aspose.note import Document, RichText
doc = Document("MyNotes.one")
for rt in doc.GetChildNodes(RichText):
if rt.Text:
print(rt.Text)导出为 PDF
from aspose.note import Document, SaveFormat
doc = Document("MyNotes.one")
doc.Save("output.pdf", SaveFormat.Pdf)要求 pip install "aspose-note[pdf]".