Começando
Aspose.Note FOSS for Python is a free, open-source library for reading Microsoft OneNote .one arquivos de seção. Ele fornece uma API pública modelada após Aspose.Note para .NET, suportada por um analisador binário MS-ONE/OneStore puro-Python. Não é necessária a instalação do Microsoft Office.
O que você pode fazer
- Ler
.onearquivos: abra qualquer arquivo de seção do OneNote 2010, OneNote Online ou OneNote 2007 - Percorra o DOM do documento: navegue por páginas, esboços, elementos de esboço e todos os tipos de conteúdo
- Extrair texto: leia texto simples ou inspecione execuções individuais de formatação (negrito, itálico, hyperlinks, cor da fonte)
- Extrair imagens: recupere imagens incorporadas como bytes brutos com nome de arquivo e dimensões
- Extrair arquivos anexados: salvar anexos de arquivos incorporados no disco
- Analisar tabelas: percorrer linhas e células da tabela, ler larguras das colunas e o conteúdo das células
- Inspecionar tags e listas: ler tags do OneNote (NoteTag) e metadados de listas numeradas
- Exportar para PDF: salvar qualquer documento carregado em PDF usando o backend opcional ReportLab
Pré-requisitos
| Requisito | Detalhes |
|---|---|
| Python | 3.10 or later |
| Sistema operacional | Qualquer (Windows, Linux, macOS), independente de SO |
| Microsoft Office | Não é necessário |
| Exportação PDF | Requer reportlab>=3.6; instale via o [pdf] extra |
Instalação
Instale a biblioteca principal a partir do PyPI:
pip install aspose-noteSe você planeja exportar documentos para PDF, instale com o [pdf] extra:
pip install "aspose-note[pdf]"Para opções detalhadas de instalação (instalações editáveis, ambientes virtuais), veja o Guia de instalação.
Seu Primeiro Script
O script a seguir carrega um arquivo de seção do OneNote, imprime o nome de exibição da seção e a contagem de páginas, e então lista o título de cada página:
from aspose.note import Document
doc = Document("MyNotes.one")
print(f"Section: {doc.DisplayName}")
print(f"Pages: {len(list(doc))}")
for page in doc:
title = (
page.Title.TitleText.Text
if page.Title and page.Title.TitleText
else "(untitled)"
)
print(f" - {title}")Importante: O caminho de importação público é from aspose.note import .... Não use import aspose_note ou from onenote import ..., pois esses não são os nomes corretos dos pacotes.
Extrair Todo o Texto
from aspose.note import Document, RichText
doc = Document("MyNotes.one")
for rt in doc.GetChildNodes(RichText):
if rt.Text:
print(rt.Text)Exportar para PDF
from aspose.note import Document, SaveFormat
doc = Document("MyNotes.one")
doc.Save("output.pdf", SaveFormat.Pdf)Requer pip install "aspose-note[pdf]".
Próximos Passos
- Instalação: todos os métodos de instalação, ambientes virtuais, dependência de PDF
- Guia do Desenvolvedor: referência completa da API com exemplos para texto, imagens, tabelas, tags e PDF
- Visão Geral de Recursos: lista completa de recursos com exemplos de código
- Artigos da Base de Conhecimento: guias práticos passo a passo
- Referência da API: referência completa de classes e métodos