Започване
Aspose.Note FOSS for Python is a free, open-source library for reading Microsoft OneNote .one section файлове. Той предоставя публичен API, моделиран след Aspose.Note за .NET, подкрепен от чисто-Python MS-ONE/OneStore бинарен парсер. Не е необходима инсталация на Microsoft Office.
Какво можете да правите
- Прочетете
.oneфайлове: отворете всеки OneNote 2010, OneNote Online или OneNote 2007 section файл - Обходете DOM на документа: навигирайте страници, контури, елементи от контура и всички типове съдържание
- Извлечете текст: прочетете чист текст или инспектирайте отделни форматиращи участъци (удебелен, курсив, хипервръзки, цвят на шрифта)
- Извличане на изображения: извличане на вградени изображения като необработени байтове с име на файл и размери
- Извличане на прикачени файлове: запазване на вградените файлови прикачени елементи на диска
- Разбор на таблици: обхождане на редовете и клетките на таблицата, четене на ширините на колоните и съдържанието на клетките
- Преглед на етикети и списъци: четене на етикетите на OneNote (NoteTag) и метаданните на номерираните списъци
- Експортиране в PDF: запазете всеки зареден документ като PDF, използвайки опционалния бекенд ReportLab
Предварителни изисквания
| Изискване | Подробности |
|---|---|
| Python | 3.10 or later |
| Операционна система | Всяка (Windows, Linux, macOS), независима от ОС |
| Microsoft Office | Не е задължително |
| PDF експортиране | Изисква reportlab>=3.6; инсталирайте чрез [pdf] допълнително |
Инсталация
Инсталирайте основната библиотека от PyPI:
pip install aspose-noteАко планирате да експортирате документи в PDF, инсталирайте с [pdf] допълнително:
pip install "aspose-note[pdf]"За подробни опции за инсталиране (редактируеми инсталации, виртуални среди), вижте Ръководство за инсталиране.
Вашият първи скрипт
Следният скрипт зарежда файл за секция на OneNote, отпечатва името на секцията и броя на страниците, след което изброява заглавието на всяка страница:
from aspose.note import Document
doc = Document("MyNotes.one")
print(f"Section: {doc.DisplayName}")
print(f"Pages: {len(list(doc))}")
for page in doc:
title = (
page.Title.TitleText.Text
if page.Title and page.Title.TitleText
else "(untitled)"
)
print(f" - {title}")Важно: Публичният импорт път е from aspose.note import .... Не използвайте import aspose_note или from onenote import ..., тъй като това не са правилните имена на пакетите.
Извличане на целия текст
from aspose.note import Document, RichText
doc = Document("MyNotes.one")
for rt in doc.GetChildNodes(RichText):
if rt.Text:
print(rt.Text)Експортиране в PDF
from aspose.note import Document, SaveFormat
doc = Document("MyNotes.one")
doc.Save("output.pdf", SaveFormat.Pdf)Изисква pip install "aspose-note[pdf]".
Следващи стъпки
- Инсталация: всички методи за инсталиране, виртуални среди, PDF зависимост
- Ръководство за разработчици: пълен API справочник с примери за текст, изображения, таблици, тагове и PDF
- Преглед на функциите: пълен списък с функции с примерен код
- Статии в Базата Знания: практични ръководства
- API справочник: пълен справочник за класове и методи