快速入门

Aspose.Note FOSS for Python is a free, open-source library for reading Microsoft OneNote .one section files. 它提供了一个基于 Aspose.Note 为 .NET 设计的公共 API,使用纯-Python MS-ONE/OneStore 二进制解析器。无需安装 Microsoft Office。.

您可以做什么

  • 读取 .one 文件: 打开任何 OneNote 2010、OneNote Online 或 OneNote 2007 section 文件
  • 遍历文档 DOM: 导航页面、提纲、提纲元素以及所有内容类型
  • 提取文本: 读取纯文本或检查单独的格式运行(粗体、斜体、超链接、字体颜色)
  • 提取图像: 检索嵌入的图像原始字节,包含文件名和尺寸
  • 提取附件文件: 将嵌入的文件附件保存到磁盘
  • 解析表格: 遍历表格行和单元格,读取列宽和单元格内容
  • 检查标签和列表: 读取 OneNote 标签(NoteTag)和编号列表元数据
  • 导出为 PDF: 保存任何已加载的文档为 PDF,使用可选的 ReportLab 后端

前置条件

要求详情
Python3.10 or later
操作系统任何 (Windows, Linux, macOS),与操作系统无关
Microsoft Office不需要
PDF 导出需要 reportlab>=3.6; 通过以下方式安装 [pdf] 额外

安装

从 PyPI 安装核心库::

pip install aspose-note

如果您计划将文档导出为 PDF,请使用以下方式安装 [pdf] 额外::

pip install "aspose-note[pdf]"

有关详细的安装选项(可编辑安装、虚拟环境),请参阅 安装指南.

您的第一个脚本

以下脚本加载 OneNote 节文件,打印节的显示名称和页面计数,然后列出每个页面的标题::

from aspose.note import Document

doc = Document("MyNotes.one")
print(f"Section: {doc.DisplayName}")
print(f"Pages:   {len(list(doc))}")

for page in doc:
    title = (
        page.Title.TitleText.Text
        if page.Title and page.Title.TitleText
        else "(untitled)"
    )
    print(f"  - {title}")

重要: 公共导入路径是 from aspose.note import .... 请勿使用 import aspose_notefrom onenote import ..., 因为这些不是正确的包名。.

提取全部文本

from aspose.note import Document, RichText

doc = Document("MyNotes.one")
for rt in doc.GetChildNodes(RichText):
    if rt.Text:
        print(rt.Text)

导出为 PDF

from aspose.note import Document, SaveFormat

doc = Document("MyNotes.one")
doc.Save("output.pdf", SaveFormat.Pdf)

要求 pip install "aspose-note[pdf]".

后续步骤

  • 安装: 所有安装方法、虚拟环境、PDF 依赖
  • 开发者指南: 完整的 API 参考,包括文本、图像、表格、标签和 PDF 示例
  • 功能概览: 完整的功能列表及代码示例
  • KB 文章: 实用操作指南
  • API 参考: 完整的类和方法参考
 中文