Začínáme

Aspose.Note FOSS for Python is a free, open-source library for reading Microsoft OneNote .one soubor sekcí. Poskytuje veřejné API modelované podle Aspose.Note pro .NET, podpořené čistým Python MS-ONE/OneStore binárním parserem. Není vyžadována instalace Microsoft Office.

Co můžete dělat

  • Číst .one soubory: otevřete libovolný soubor sekce OneNote 2010, OneNote Online nebo OneNote 2007
  • Procházejte DOM dokumentu: procházejte stránky, osnovy, prvky osnov a všechny typy obsahu
  • Extrahujte text: čtěte prostý text nebo prozkoumejte jednotlivé formátovací úseky (tučné, kurzíva, hypertextové odkazy, barva písma)
  • Extrahujte obrázky: načtěte vložené obrázky jako surová data s názvem souboru a rozměry
  • Extrahujte připojené soubory: uložte vložené přílohy souborů na disk
  • Analyzujte tabulky: procházejte řádky a buňky tabulky, čtěte šířky sloupců a obsah buněk
  • Prozkoumejte značky a seznamy: čtěte značky OneNote (NoteTag) a metadata číslovaných seznamů
  • Exportovat do PDF: uložit jakýkoli načtený dokument do PDF pomocí volitelného backendu ReportLab

Předpoklady

PožadavekPodrobnosti
Python3.10 or later
Operační systémJakýkoli (Windows, Linux, macOS), nezávislý na OS
Microsoft OfficeNení vyžadováno
Export do PDFVyžaduje reportlab>=3.6; nainstalujte přes [pdf] extra

Instalace

Nainstalujte základní knihovnu z PyPI:

pip install aspose-note

Pokud plánujete exportovat dokumenty do PDF, nainstalujte pomocí [pdf] extra:

pip install "aspose-note[pdf]"

Pro podrobné možnosti instalace (editovatelné instalace, virtuální prostředí) viz Instalační příručka.

Váš první skript

Následující skript načte soubor sekce OneNote, vypíše zobrazovaný název sekce a počet stránek, a poté vylistuje název každé stránky:

from aspose.note import Document

doc = Document("MyNotes.one")
print(f"Section: {doc.DisplayName}")
print(f"Pages:   {len(list(doc))}")

for page in doc:
    title = (
        page.Title.TitleText.Text
        if page.Title and page.Title.TitleText
        else "(untitled)"
    )
    print(f"  - {title}")

Důležité: Veřejná cesta importu je from aspose.note import .... Nepoužívejte import aspose_note nebo from onenote import ..., protože to nejsou správné názvy balíčků.

Extrahovat veškerý text

from aspose.note import Document, RichText

doc = Document("MyNotes.one")
for rt in doc.GetChildNodes(RichText):
    if rt.Text:
        print(rt.Text)

Exportovat do PDF

from aspose.note import Document, SaveFormat

doc = Document("MyNotes.one")
doc.Save("output.pdf", SaveFormat.Pdf)

Požadavky pip install "aspose-note[pdf]".

Další kroky

 Čeština