wake_vision

Description :

Wake Vision est un vaste ensemble de données de haute qualité comprenant plus de 6 millions d'images, dépassant largement l'échelle et la diversité des ensembles de données tinyML actuels (100x). Cet ensemble de données comprend des images avec des annotations indiquant si chaque image contient une personne. De plus, il intègre une référence complète et fine pour évaluer l'équité et la robustesse, couvrant le sexe perçu, l'âge perçu, la distance du sujet, les conditions d'éclairage et les représentations. Les étiquettes Wake Vision sont dérivées des annotations d'Open Image qui sont sous licence Google LLC sous licence CC BY 4.0. Les images sont répertoriées comme ayant une licence CC BY 2.0. Remarque d'Open Images : "bien que nous ayons essayé d'identifier les images sous licence Creative Commons Attribution, nous ne faisons aucune déclaration ni garantie concernant le statut de licence de chaque image et vous devez vérifier vous-même la licence de chaque image."

Page d'accueil : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC
Code source : tfds.datasets.wake_vision.Builder
Versions :
- 1.0.0 (par défaut) : version initiale des ensembles de données TensorFlow. Notez que ceci est basé sur la version 2.0 de Wake Vision sur Harvard Dataverse.
Taille du téléchargement : Unknown size
Taille de l'ensemble de données : 239.25 GiB
Mise en cache automatique ( documentation ) : Non
Divisions :

Diviser	Exemples
`'test'`	55 763
`'train_large'`	5 760 428
`'train_quality'`	1 248 230
`'validation'`	18 582

Structure des fonctionnalités :

FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})

Documentation des fonctionnalités :

Fonctionnalité	Classe	Forme	Type D
	FonctionnalitésDict
âge_inconnu	Étiquette de classe		int64
partie_corps	Étiquette de classe		int64
brillant	Étiquette de classe		int64
sombre	Étiquette de classe		int64
représentation	Étiquette de classe		int64
loin	Étiquette de classe		int64
nom de fichier	Texte		chaîne
genre_inconnu	Étiquette de classe		int64
image	Image	(Aucun, Aucun, 3)	uint8
moyenne_distance	Étiquette de classe		int64
âge_moyen	Étiquette de classe		int64
près	Étiquette de classe		int64
non-person_depiction	Étiquette de classe		int64
non-person_non-depiction	Étiquette de classe		int64
éclairage_normal	Étiquette de classe		int64
plus vieux	Étiquette de classe		int64
personne	Étiquette de classe		int64
représentation_personne	Étiquette de classe		int64
majoritairement_femelle	Étiquette de classe		int64
majoritairement_masculin	Étiquette de classe		int64
jeune	Étiquette de classe		int64

Clés supervisées (Voir doc as_supervised ) : ('image', 'person')
Figure ( tfds.show_examples ) :

Visualisation

Exemples ( tfds.as_dataframe ) :

Citation :

@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}

wake_vision Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

wake_vision