Ontwikkelaarsgids
Aspose.Note FOSS for Python is a free, open-source library for reading Microsoft OneNote .one sectiebestanden zonder enige afhankelijkheid van Microsoft Office. Het biedt een schone openbare API onder de aspose.note package, gemodelleerd naar de Aspose.Note voor .NET interface. De bibliotheek is geschikt voor documentautomatisering, contentindexering, gegevens‑extractiepijplijnen en archiveringsworkflows.
Deze ontwikkelaarsgids behandelt de volledige publieke API‑structuur die beschikbaar is in versie 26.3.1, met uitvoerbare codevoorbeelden voor elke belangrijke functie.
Document laden
Laad een .one bestand vanaf een bestandspad of een binaire stream. De Document klasse is het toegangspunt voor alle bewerkingen.
Laden vanaf een bestandspad
from aspose.note import Document
doc = Document("MyNotes.one")Laden vanaf een binaire stream
Handig bij het lezen vanuit cloudopslag, HTTP‑responses of in‑memory buffers:
from pathlib import Path
from aspose.note import Document
with Path("MyNotes.one").open("rb") as f:
doc = Document(f)Laadopties
Gebruik LoadOptions om optionele parameters in te stellen tijdens het laden:
from aspose.note import Document, LoadOptions
opts = LoadOptions()
opts.LoadHistory = True # Include page history in the DOM
doc = Document("MyNotes.one", opts)Opmerking: DocumentPassword bestaat op LoadOptions voor API‑compatibiliteit, maar versleutelde documenten worden niet ondersteund. Pogingen om een versleuteld bestand te laden veroorzaken IncorrectPasswordException.
Documentstructuur (DOM)
Het OneNote‑documentmodel is een boom:
Document
└── Page (0..n)
├── Title
│ ├── TitleText (RichText)
│ ├── TitleDate (RichText)
│ └── TitleTime (RichText)
└── Outline (0..n)
└── OutlineElement (0..n)
├── RichText
├── Image
├── Table
│ └── TableRow
│ └── TableCell
│ └── RichText / Image
└── AttachedFileElke knoop exposeert ParentNode en een Document eigenschap die naar de wortel omhoog loopt. Samengestelde knopen ondersteunen iteratie over kinderen, FirstChild, LastChild, AppendChildLast, InsertChild, RemoveChild, en GetChildNodes(Type).
Paginas itereren
Pagina’s zijn de directe kinderen van Document. Iterate ze direct of gebruik GetChildNodes:
from aspose.note import Document, Page
doc = Document("MyNotes.one")
for page in doc:
title = page.Title.TitleText.Text if page.Title and page.Title.TitleText else "(untitled)"
author = page.Author or "(unknown)"
print(f" {title} [by {author}]")Pagina‑metadata:
| Eigenschap | Type | Beschrijving |
|---|---|---|
Title | `Title | None` |
Author | `str | None` |
CreationTime | `datetime | None` |
LastModifiedTime | `datetime | None` |
Level | `int | None` |
Tekstextractie
Extraheer alle platte tekst
from aspose.note import Document, RichText
doc = Document("MyNotes.one")
all_text = [rt.Text for rt in doc.GetChildNodes(RichText) if rt.Text]
print("\n".join(all_text))Inspecteer opmaakreeksen
Elke RichText bevat een lijst van TextRun segmenten. Elke run draagt zijn eigen TextStyle:
from aspose.note import Document, RichText
doc = Document("FormattedNotes.one")
for rt in doc.GetChildNodes(RichText):
for run in rt.TextRuns:
style = run.Style
flags = []
if style.IsBold: flags.append("bold")
if style.IsItalic: flags.append("italic")
if style.IsHyperlink: flags.append(f"link={style.HyperlinkAddress}")
print(f"{run.Text!r:40s} [{', '.join(flags)}]")Extraheer hyperlinks
from aspose.note import Document, RichText
doc = Document("MyNotes.one")
for rt in doc.GetChildNodes(RichText):
for run in rt.TextRuns:
if run.Style.IsHyperlink and run.Style.HyperlinkAddress:
print(run.Text, "->", run.Style.HyperlinkAddress)Afbeeldingsextractie
from aspose.note import Document, Image
doc = Document("MyNotes.one")
for i, img in enumerate(doc.GetChildNodes(Image), start=1):
name = img.FileName or f"image_{i}.bin"
with open(name, "wb") as f:
f.write(img.Bytes)
print(f"Saved {name} ({img.Width}x{img.Height})")Afbeeldingseigenschappen: FileName, Bytes, Width, Height, AlternativeTextTitle, AlternativeTextDescription, HyperlinkUrl, Tags.
Tabelparsing
from aspose.note import Document, Table, TableRow, TableCell, RichText
doc = Document("MyNotes.one")
for table in doc.GetChildNodes(Table):
print("Column widths:", [col.Width for col in table.Columns])
for r, row in enumerate(table.GetChildNodes(TableRow), start=1):
cells = row.GetChildNodes(TableCell)
row_text = [
" ".join(rt.Text for rt in cell.GetChildNodes(RichText)).strip()
for cell in cells
]
print(f"Row {r}:", row_text)Bijgevoegde bestanden
from aspose.note import Document, AttachedFile
doc = Document("NotesWithAttachments.one")
for i, af in enumerate(doc.GetChildNodes(AttachedFile), start=1):
name = af.FileName or f"attachment_{i}.bin"
with open(name, "wb") as f:
f.write(af.Bytes)
print(f"Saved: {name}")Tags en genummerde lijsten
Inspecteer NoteTag-items
from aspose.note import Document, RichText, Image, Table
doc = Document("TaggedNotes.one")
for rt in doc.GetChildNodes(RichText):
for tag in rt.Tags:
print(f"RichText tag: {tag.Label} icon={tag.Icon}")
for img in doc.GetChildNodes(Image):
for tag in img.Tags:
print(f"Image tag: {tag.Label}")Inspecteer genummerde lijsten
from aspose.note import Document, OutlineElement
doc = Document("NumberedNotes.one")
for oe in doc.GetChildNodes(OutlineElement):
nl = oe.NumberList
if nl:
print(f"format={nl.Format!r}")DocumentVisitor-patroon
Gebruik DocumentVisitor om een visitor te implementeren die de volledige documentboom doorloopt:
from aspose.note import Document, DocumentVisitor, Page, RichText, Image
class ContentCounter(DocumentVisitor):
def __init__(self):
self.pages = 0
self.texts = 0
self.images = 0
def VisitPageStart(self, page: Page) -> None:
self.pages += 1
def VisitRichTextStart(self, rt: RichText) -> None:
self.texts += 1
def VisitImageStart(self, img: Image) -> None:
self.images += 1
doc = Document("MyNotes.one")
counter = ContentCounter()
doc.Accept(counter)
print(f"Pages: {counter.pages}, Texts: {counter.texts}, Images: {counter.images}")PDF-export
PDF-export vereist de optionele ReportLab-afhankelijkheid. Installeer deze met:
pip install "aspose-note[pdf]"Basis PDF-export
from aspose.note import Document, SaveFormat
doc = Document("MyNotes.one")
doc.Save("output.pdf", SaveFormat.Pdf)PDF-export met opties
import io
from aspose.note import Document, SaveFormat
from aspose.note.saving import PdfSaveOptions
doc = Document("MyNotes.one")
##With save options
opts = PdfSaveOptions()
doc.Save("output.pdf", opts)
##Save to in-memory stream
buf = io.BytesIO()
doc.Save(buf, PdfSaveOptions())
pdf_bytes = buf.getvalue()Opmerking: PdfSaveOptions.PageIndex en PageCount velden bestaan maar worden niet doorgestuurd naar de PDF-exporteur in v26.3.1. Het volledige document wordt altijd geëxporteerd.
Huidige beperkingen
| Gebied | Status |
|---|---|
Lezen .one bestanden | Volledig ondersteund |
| PDF-export (via ReportLab) | Ondersteund |
Terugschrijven naar .one | Niet geïmplementeerd |
| Versleutelde documenten | Niet ondersteund (werpt IncorrectPasswordException) |
| HTML / afbeelding / ONE-opslagformaten | Gedeclareerd voor API-compatibiliteit; werp UnsupportedSaveFormatException |
Beschikbare handleidingen
- Functiesoverzicht: volledige functielijst met bewijs
- Aan de slag: vereisten, installatie en eerste stappen
- Installatie: pip install en optionele afhankelijkheden