wake_vision

Descrizione :

Wake Vision è un set di dati di grandi dimensioni e di alta qualità contenente oltre 6 milioni di immagini, che supera significativamente la scala e la diversità degli attuali set di dati tinyML (100x). Questo set di dati include immagini con annotazioni che indicano se ciascuna immagine contiene una persona. Inoltre, incorpora un benchmark completo e dettagliato per valutare l’equità e la robustezza, coprendo il genere percepito, l’età percepita, la distanza del soggetto, le condizioni di illuminazione e le rappresentazioni. Le etichette Wake Vision derivano dalle annotazioni di Open Image concesse in licenza da Google LLC con licenza CC BY 4.0. Le immagini sono elencate come aventi una licenza CC BY 2.0. Nota da Open Images: "anche se abbiamo cercato di identificare le immagini concesse in licenza con una licenza Creative Commons Attribution, non forniamo alcuna dichiarazione o garanzia in merito allo stato della licenza di ciascuna immagine e dovresti verificare tu stesso la licenza per ciascuna immagine."

Pagina iniziale : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC
Codice sorgente : tfds.datasets.wake_vision.Builder
Versioni :
- 1.0.0 (impostazione predefinita): versione iniziale dei set di dati TensorFlow. Tieni presente che questo è basato sulla versione 2.0 di Wake Vision su Harvard Dataverse.
Dimensioni del download : Unknown size
Dimensione del set di dati : 239.25 GiB
Memorizzazione nella cache automatica ( documentazione ): No
Divide :

Diviso	Esempi
`'test'`	55.763
`'train_large'`	5.760.428
`'train_quality'`	1.248.230
`'validation'`	18.582

Struttura delle caratteristiche :

FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})

Documentazione delle funzionalità :

Caratteristica	Classe	Forma	Tipo D
	CaratteristicheDict
età_sconosciuta	ClassLabel		int64
parte_delcorpo	ClassLabel		int64
luminoso	ClassLabel		int64
buio	ClassLabel		int64
rappresentazione	ClassLabel		int64
lontano	ClassLabel		int64
nomefile	Testo		corda
genere_sconosciuto	ClassLabel		int64
immagine	Immagine	(Nessuno, Nessuno, 3)	uint8
media_distanza	ClassLabel		int64
mezza_età	ClassLabel		int64
vicino	ClassLabel		int64
non-person_depiction	ClassLabel		int64
non-persona_non-rappresentazione	ClassLabel		int64
illuminazione_normale	ClassLabel		int64
più vecchio	ClassLabel		int64
persona	ClassLabel		int64
person_depiction	ClassLabel		int64
prevalentemente_femminile	ClassLabel		int64
prevalentemente_maschile	ClassLabel		int64
giovane	ClassLabel		int64

Chiavi supervisionate (vedi il documento as_supervised ): ('image', 'person')
Figura ( tfds.show_examples ):

Visualizzazione

Esempi ( tfds.as_dataframe ):

Citazione :

@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}

wake_vision Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

wake_vision