- Descrizione :
Wake Vision è un set di dati di grandi dimensioni e di alta qualità contenente oltre 6 milioni di immagini, che supera significativamente la scala e la diversità degli attuali set di dati tinyML (100x). Questo set di dati include immagini con annotazioni che indicano se ciascuna immagine contiene una persona. Inoltre, incorpora un benchmark completo e dettagliato per valutare l’equità e la robustezza, coprendo il genere percepito, l’età percepita, la distanza del soggetto, le condizioni di illuminazione e le rappresentazioni. Le etichette Wake Vision derivano dalle annotazioni di Open Image concesse in licenza da Google LLC con licenza CC BY 4.0. Le immagini sono elencate come aventi una licenza CC BY 2.0. Nota da Open Images: "anche se abbiamo cercato di identificare le immagini concesse in licenza con una licenza Creative Commons Attribution, non forniamo alcuna dichiarazione o garanzia in merito allo stato della licenza di ciascuna immagine e dovresti verificare tu stesso la licenza per ciascuna immagine."
Pagina iniziale : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC
Codice sorgente :
tfds.datasets.wake_vision.Builder
Versioni :
-
1.0.0
(impostazione predefinita): versione iniziale dei set di dati TensorFlow. Tieni presente che questo è basato sulla versione 2.0 di Wake Vision su Harvard Dataverse.
-
Dimensioni del download :
Unknown size
Dimensione del set di dati :
239.25 GiB
Memorizzazione nella cache automatica ( documentazione ): No
Divide :
Diviso | Esempi |
---|---|
'test' | 55.763 |
'train_large' | 5.760.428 |
'train_quality' | 1.248.230 |
'validation' | 18.582 |
- Struttura delle caratteristiche :
FeaturesDict({
'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
'filename': Text(shape=(), dtype=string),
'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'image': Image(shape=(None, None, 3), dtype=uint8),
'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
età_sconosciuta | ClassLabel | int64 | ||
parte_delcorpo | ClassLabel | int64 | ||
luminoso | ClassLabel | int64 | ||
buio | ClassLabel | int64 | ||
rappresentazione | ClassLabel | int64 | ||
lontano | ClassLabel | int64 | ||
nomefile | Testo | corda | ||
genere_sconosciuto | ClassLabel | int64 | ||
immagine | Immagine | (Nessuno, Nessuno, 3) | uint8 | |
media_distanza | ClassLabel | int64 | ||
mezza_età | ClassLabel | int64 | ||
vicino | ClassLabel | int64 | ||
non-person_depiction | ClassLabel | int64 | ||
non-persona_non-rappresentazione | ClassLabel | int64 | ||
illuminazione_normale | ClassLabel | int64 | ||
più vecchio | ClassLabel | int64 | ||
persona | ClassLabel | int64 | ||
person_depiction | ClassLabel | int64 | ||
prevalentemente_femminile | ClassLabel | int64 | ||
prevalentemente_maschile | ClassLabel | int64 | ||
giovane | ClassLabel | int64 |
Chiavi supervisionate (vedi il documento
as_supervised
):('image', 'person')
Figura ( tfds.show_examples ):
- Esempi ( tfds.as_dataframe ):
- Citazione :
@article{banbury2024wake,
title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
journal={arXiv preprint arXiv:2405.00892},
year={2024}
}