Bắt đầu
Aspose.Note FOSS for Python is a free, open-source library for reading Microsoft OneNote .one tệp section. Nó cung cấp một API công cộng được mô hình hoá theo Aspose.Note cho .NET, dựa trên một bộ phân tích nhị phân MS-ONE/OneStore thuần Python. Không cần cài đặt Microsoft Office.
Bạn có thể làm gì
- Đọc
.onetệp: mở bất kỳ tệp section OneNote 2010, OneNote Online, hoặc OneNote 2007 nào - Duyệt DOM tài liệu: điều hướng các trang, dàn ý, các phần tử dàn ý và mọi loại nội dung
- Trích xuất văn bản: đọc văn bản thuần hoặc kiểm tra các đoạn định dạng riêng lẻ (đậm, nghiêng, siêu liên kết, màu phông chữ)
- Trích xuất hình ảnh: lấy các hình ảnh nhúng dưới dạng byte thô kèm tên tệp và kích thước
- Trích xuất tệp đính kèm: lưu các tệp đính kèm nhúng vào đĩa
- Phân tích bảng: duyệt các hàng và ô của bảng, đọc độ rộng cột và nội dung ô
- Kiểm tra thẻ và danh sách: đọc các thẻ OneNote (NoteTag) và siêu dữ liệu danh sách có số
- Xuất ra PDF: lưu bất kỳ tài liệu nào đã tải lên thành PDF bằng backend ReportLab tùy chọn
Các yêu cầu trước
| Yêu cầu | Chi tiết |
|---|---|
| Python | 3.10 or later |
| Hệ điều hành | Bất kỳ (Windows, Linux, macOS), không phụ thuộc vào hệ điều hành |
| Microsoft Office | Không bắt buộc |
| Xuất PDF | Yêu cầu reportlab>=3.6; cài đặt qua [pdf] bổ sung |
Cài đặt
Cài đặt thư viện lõi từ PyPI:
pip install aspose-noteNếu bạn dự định xuất tài liệu sang PDF, cài đặt với [pdf] bổ sung:
pip install "aspose-note[pdf]"Để biết các tùy chọn cài đặt chi tiết (cài đặt có thể chỉnh sửa, môi trường ảo), xem Hướng dẫn cài đặt.
Kịch bản Đầu tiên của Bạn
Kịch bản sau tải một tệp phần OneNote, in ra tên hiển thị của phần và số lượng trang, sau đó liệt kê tiêu đề của mọi trang:
from aspose.note import Document
doc = Document("MyNotes.one")
print(f"Section: {doc.DisplayName}")
print(f"Pages: {len(list(doc))}")
for page in doc:
title = (
page.Title.TitleText.Text
if page.Title and page.Title.TitleText
else "(untitled)"
)
print(f" - {title}")Quan trọng: Đường dẫn nhập công khai là from aspose.note import .... Không sử dụng import aspose_note hoặc from onenote import ..., vì chúng không phải là tên gói đúng.
Trích xuất toàn bộ văn bản
from aspose.note import Document, RichText
doc = Document("MyNotes.one")
for rt in doc.GetChildNodes(RichText):
if rt.Text:
print(rt.Text)Xuất ra PDF
from aspose.note import Document, SaveFormat
doc = Document("MyNotes.one")
doc.Save("output.pdf", SaveFormat.Pdf)Yêu cầu pip install "aspose-note[pdf]".
Các bước tiếp theo
- Cài đặt: tất cả các phương pháp cài đặt, môi trường ảo, phụ thuộc PDF
- Hướng dẫn dành cho nhà phát triển: tài liệu tham khảo API đầy đủ với các ví dụ cho văn bản, hình ảnh, bảng, thẻ và PDF
- Tổng quan tính năng: danh sách tính năng đầy đủ kèm ví dụ mã
- Bài viết KB: các hướng dẫn thực tế
- Tham chiếu API: tham chiếu đầy đủ lớp và phương thức