Slike i priložene datoteke — Aspose.Note FOSS for Python
Aspose.Note FOSS za Python omogućuje izravan pristup i ugrađenim slikama i priloženim datotekama pohranjenim unutar OneNote .one datoteka odjeljka. Sadržaj je izložen putem Image i AttachedFile vrsta čvorova.
Ekstrakcija slika
Svaka slika u OneNote dokumentu predstavlja se Image čvorom. Koristite GetChildNodes(Image) za rekurzivno dohvaćanje svih slika iz dokumenta:
from aspose.note import Document, Image
doc = Document("MyNotes.one")
for i, img in enumerate(doc.GetChildNodes(Image), start=1):
filename = img.FileName or f"image_{i}.bin"
with open(filename, "wb") as f:
f.write(img.Bytes)
print(f"Saved: {filename} ({img.Width} x {img.Height} pts)")Svojstva slike
| Property | Type | Description |
|---|---|---|
FileName | str | None | Izvorni naziv datoteke pohranjen u OneNote datoteci (može biti None) |
Bytes | bytes | Sirovi podaci slike (format odgovara izvornom, npr. PNG, JPEG) |
Width | float | None | Iscrtana širina u točkama |
Height | float | None | Iscrtana visina u točkama |
AlternativeTextTitle | str | None | Naslov alt teksta za pristupačnost |
AlternativeTextDescription | str | None | Opis alt teksta |
HyperlinkUrl | str | None | URL ako je slika klikabilna hiperveza |
Tags | list[NoteTag] | OneNote oznake pridružene ovoj slici |
Spremi slike s sigurnim nazivima datoteka
Kada je FileName None ili sadrži znakove koji nisu sigurni za datotečni sustav, očistite prije spremanja:
import re
from aspose.note import Document, Image
def safe_name(name: str | None, fallback: str) -> str:
if not name:
return fallback
return re.sub(r'[<>:"/\\|?*]', "_", name)
doc = Document("MyNotes.one")
for i, img in enumerate(doc.GetChildNodes(Image), start=1):
name = safe_name(img.FileName, f"image_{i}.bin")
with open(name, "wb") as f:
f.write(img.Bytes)Izvuci slike po stranici
from aspose.note import Document, Page, Image
doc = Document("MyNotes.one")
for page_num, page in enumerate(doc.GetChildNodes(Page), start=1):
images = page.GetChildNodes(Image)
print(f"Page {page_num}: {len(images)} image(s)")
for i, img in enumerate(images, start=1):
filename = f"page{page_num}_img{i}.bin"
with open(filename, "wb") as f:
f.write(img.Bytes)Pregledajte alternativni tekst slike i hiperveze
from aspose.note import Document, Image
doc = Document("MyNotes.one")
for img in doc.GetChildNodes(Image):
if img.AlternativeTextTitle:
print("Alt title:", img.AlternativeTextTitle)
if img.AlternativeTextDescription:
print("Alt desc:", img.AlternativeTextDescription)
if img.HyperlinkUrl:
print("Linked to:", img.HyperlinkUrl)Otkrivanje formata slikovne datoteke iz bajtova
Pythonov imghdr modul (Python ≤ 3.12) ili struct modul može otkriti format slike iz prvih bajtova:
from aspose.note import Document, Image
doc = Document("MyNotes.one")
for img in doc.GetChildNodes(Image):
b = img.Bytes
if b[:4] == b'\x89PNG':
fmt = "png"
elif b[:2] == b'\xff\xd8':
fmt = "jpeg"
elif b[:4] == b'GIF8':
fmt = "gif"
elif b[:2] in (b'BM',):
fmt = "bmp"
else:
fmt = "bin"
name = (img.FileName or f"image.{fmt}").rsplit(".", 1)[0] + f".{fmt}"
with open(name, "wb") as f:
f.write(b)Izdvajanje priloženih datoteka
Ugrađeni privitci datoteka pohranjuju se kao AttachedFile čvorovi:
from aspose.note import Document, AttachedFile
doc = Document("NotesWithAttachments.one")
for i, af in enumerate(doc.GetChildNodes(AttachedFile), start=1):
filename = af.FileName or f"attachment_{i}.bin"
with open(filename, "wb") as f:
f.write(af.Bytes)
print(f"Saved attachment: {filename} ({len(af.Bytes):,} bytes)")AttachedFile Svojstva
| Svojstvo | Tip | Opis |
|---|---|---|
FileName | str | None | Izvorni naziv datoteke pohranjen u OneNote datoteci |
Bytes | bytes | Sirovi sadržaj datoteke |
Tags | list[NoteTag] | OneNote oznake povezane s ovim čvorom |
Pregledajte oznake na slikama i privitcima
Oba čvora Image i AttachedFile podržavaju OneNote oznake:
from aspose.note import Document, Image, AttachedFile
doc = Document("MyNotes.one")
for img in doc.GetChildNodes(Image):
for tag in img.Tags:
print(f"Image tag: {tag.Label} completedTime={tag.CompletedTime}")
for af in doc.GetChildNodes(AttachedFile):
for tag in af.Tags:
print(f"Attachment tag: {tag.Label} completedTime={tag.CompletedTime}")Sažetak: Image vs AttachedFile
| Feature | Image | AttachedFile |
|---|---|---|
FileName | Da (izvorni naziv slike) | Da (izvorni naziv datoteke) |
Bytes | Sirovi bajtovi slike | Sirovi bajtovi datoteke |
Width / Height | Da (prikazane dimenzije) | Ne |
AlternativeTextTitle/Description | Da | Ne |
HyperlinkUrl | Da | Ne |
Tags | Da | Da |
Replace(node) metoda | Da | Ne |
Savjeti
- Uvijek se zaštitite od naziva datoteka
None.img.FileNamejeNonekada datoteka nije imala naziv u izvornom dokumentu. img.Bytesnikada nijeNonei uvijek je sirovi binarni sadržaj; može biti nula bajtova za rezervirane slike.- Koristite
Page.GetChildNodes(Image)umjestoDocument.GetChildNodes(Image)za ograničavanje ekstrakcije na jednu stranicu. - Metoda
Image.Replace(image)zamjenjuje sadržaj jednog čvora slike drugim u memoriji; spremanje natrag u.onenije podržano.