Začínáme
Aspose.Note FOSS for Python is a free, open-source library for reading Microsoft OneNote .one soubor sekcí. Poskytuje veřejné API modelované podle Aspose.Note pro .NET, podpořené čistým Python MS-ONE/OneStore binárním parserem. Není vyžadována instalace Microsoft Office.
Co můžete dělat
- Číst
.onesoubory: otevřete libovolný soubor sekce OneNote 2010, OneNote Online nebo OneNote 2007 - Procházejte DOM dokumentu: procházejte stránky, osnovy, prvky osnov a všechny typy obsahu
- Extrahujte text: čtěte prostý text nebo prozkoumejte jednotlivé formátovací úseky (tučné, kurzíva, hypertextové odkazy, barva písma)
- Extrahujte obrázky: načtěte vložené obrázky jako surová data s názvem souboru a rozměry
- Extrahujte připojené soubory: uložte vložené přílohy souborů na disk
- Analyzujte tabulky: procházejte řádky a buňky tabulky, čtěte šířky sloupců a obsah buněk
- Prozkoumejte značky a seznamy: čtěte značky OneNote (NoteTag) a metadata číslovaných seznamů
- Exportovat do PDF: uložit jakýkoli načtený dokument do PDF pomocí volitelného backendu ReportLab
Předpoklady
| Požadavek | Podrobnosti |
|---|---|
| Python | 3.10 or later |
| Operační systém | Jakýkoli (Windows, Linux, macOS), nezávislý na OS |
| Microsoft Office | Není vyžadováno |
| Export do PDF | Vyžaduje reportlab>=3.6; nainstalujte přes [pdf] extra |
Instalace
Nainstalujte základní knihovnu z PyPI:
pip install aspose-notePokud plánujete exportovat dokumenty do PDF, nainstalujte pomocí [pdf] extra:
pip install "aspose-note[pdf]"Pro podrobné možnosti instalace (editovatelné instalace, virtuální prostředí) viz Instalační příručka.
Váš první skript
Následující skript načte soubor sekce OneNote, vypíše zobrazovaný název sekce a počet stránek, a poté vylistuje název každé stránky:
from aspose.note import Document
doc = Document("MyNotes.one")
print(f"Section: {doc.DisplayName}")
print(f"Pages: {len(list(doc))}")
for page in doc:
title = (
page.Title.TitleText.Text
if page.Title and page.Title.TitleText
else "(untitled)"
)
print(f" - {title}")Důležité: Veřejná cesta importu je from aspose.note import .... Nepoužívejte import aspose_note nebo from onenote import ..., protože to nejsou správné názvy balíčků.
Extrahovat veškerý text
from aspose.note import Document, RichText
doc = Document("MyNotes.one")
for rt in doc.GetChildNodes(RichText):
if rt.Text:
print(rt.Text)Exportovat do PDF
from aspose.note import Document, SaveFormat
doc = Document("MyNotes.one")
doc.Save("output.pdf", SaveFormat.Pdf)Požadavky pip install "aspose-note[pdf]".
Další kroky
- Instalace: všechny instalační metody, virtuální prostředí, závislost na PDF
- Příručka pro vývojáře: kompletní referenční dokumentace API s příklady pro text, obrázky, tabulky, značky a PDF
- Přehled funkcí: kompletní seznam funkcí s ukázkami kódu
- Články KB: praktické návody
- Reference API: kompletní reference tříd a metod