Comenzando
Aspose.Note FOSS for Python is a free, open-source library for reading Microsoft OneNote .one archivos de sección. Proporciona una API pública modelada según Aspose.Note para .NET, respaldada por un analizador binario MS-ONE/OneStore puro-Python. No se requiere instalación de Microsoft Office.
Qué puedes hacer
- Leer
.onearchivos: abra cualquier archivo de sección de OneNote 2010, OneNote Online o OneNote 2007 - Recorra el DOM del documento: navegue por páginas, esquemas, elementos de esquema y todos los tipos de contenido
- Extraer texto: lea texto plano o inspeccione ejecuciones de formato individuales (negrita, cursiva, hipervínculos, color de fuente)
- Extraer imágenes: recupere imágenes incrustadas como bytes sin procesar con nombre de archivo y dimensiones
- Extraer archivos adjuntos: guardar archivos adjuntos incrustados en disco
- Analizar tablas: recorrer filas y celdas de la tabla, leer anchos de columna y contenido de la celda
- Inspeccionar etiquetas y listas: leer etiquetas de OneNote (NoteTag) y metadatos de listas numeradas
- Exportar a PDF: guardar cualquier documento cargado en PDF usando el backend opcional de ReportLab
Requisitos previos
| Requisito | Detalles |
|---|---|
| Python | 3.10 or later |
| Sistema operativo | Cualquiera (Windows, Linux, macOS), independiente del SO |
| Microsoft Office | No es necesario |
| Exportación PDF | Requiere reportlab>=3.6; instalar a través del [pdf] extra |
Instalación
Instala la biblioteca principal desde PyPI:
pip install aspose-noteSi planeas exportar documentos a PDF, instala con el [pdf] extra:
pip install "aspose-note[pdf]"Para opciones de instalación detalladas (instalaciones editables, entornos virtuales), consulta el Guía de instalación.
Tu primer script
El siguiente script carga un archivo de sección de OneNote, imprime el nombre visible de la sección y el recuento de páginas, y luego enumera el título de cada página:
from aspose.note import Document
doc = Document("MyNotes.one")
print(f"Section: {doc.DisplayName}")
print(f"Pages: {len(list(doc))}")
for page in doc:
title = (
page.Title.TitleText.Text
if page.Title and page.Title.TitleText
else "(untitled)"
)
print(f" - {title}")Importante: La ruta de importación pública es from aspose.note import .... No use import aspose_note o from onenote import ..., ya que esos no son los nombres de paquete correctos.
Extraer todo el texto
from aspose.note import Document, RichText
doc = Document("MyNotes.one")
for rt in doc.GetChildNodes(RichText):
if rt.Text:
print(rt.Text)Exportar a PDF
from aspose.note import Document, SaveFormat
doc = Document("MyNotes.one")
doc.Save("output.pdf", SaveFormat.Pdf)Requiere pip install "aspose-note[pdf]".
Próximos pasos
- Instalación: todos los métodos de instalación, entornos virtuales, dependencia de PDF
- Guía del desarrollador: referencia completa de la API con ejemplos para texto, imágenes, tablas, etiquetas y PDF
- Resumen de características: lista completa de características con ejemplos de código
- Artículos de la base de conocimientos: guías prácticas paso a paso
- Referencia de API: referencia completa de clases y métodos