- Descripción :
Wake Vision es un conjunto de datos grande y de alta calidad que presenta más de 6 millones de imágenes, lo que supera significativamente la escala y diversidad de los conjuntos de datos tinyML actuales (100x). Este conjunto de datos incluye imágenes con anotaciones sobre si cada imagen contiene una persona. Además, incorpora un punto de referencia integral y detallado para evaluar la equidad y la solidez, que abarca el género percibido, la edad percibida, la distancia del sujeto, las condiciones de iluminación y las representaciones. Las etiquetas de Wake Vision se derivan de las anotaciones de Open Image que tienen licencia de Google LLC bajo la licencia CC BY 4.0. Las imágenes figuran con una licencia CC BY 2.0. Nota de Open Images: "si bien intentamos identificar imágenes con licencia Creative Commons Attribution, no hacemos representaciones ni garantías con respecto al estado de la licencia de cada imagen y usted debe verificar la licencia de cada imagen usted mismo".
Página de inicio : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC
Código fuente :
tfds.datasets.wake_vision.Builder
Versiones :
-
1.0.0
(predeterminado): versión inicial de conjuntos de datos de TensorFlow. Tenga en cuenta que esto se basa en la versión 2.0 de Wake Vision en Harvard Dataverse.
-
Tamaño de descarga :
Unknown size
Tamaño del conjunto de datos :
239.25 GiB
Almacenamiento en caché automático ( documentación ): No
Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 55.763 |
'train_large' | 5.760.428 |
'train_quality' | 1.248.230 |
'validation' | 18.582 |
- Estructura de características :
FeaturesDict({
'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
'filename': Text(shape=(), dtype=string),
'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'image': Image(shape=(None, None, 3), dtype=uint8),
'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentación de funciones :
Característica | Clase | Forma | tipo D | Descripción |
---|---|---|---|---|
FuncionesDict | ||||
edad_desconocida | Etiqueta de clase | int64 | ||
parte_del_cuerpo | Etiqueta de clase | int64 | ||
brillante | Etiqueta de clase | int64 | ||
oscuro | Etiqueta de clase | int64 | ||
representación | Etiqueta de clase | int64 | ||
lejos | Etiqueta de clase | int64 | ||
Nombre del archivo | Texto | cadena | ||
género_desconocido | Etiqueta de clase | int64 | ||
imagen | Imagen | (Ninguno, Ninguno, 3) | uint8 | |
media_distancia | Etiqueta de clase | int64 | ||
mediana edad | Etiqueta de clase | int64 | ||
cerca | Etiqueta de clase | int64 | ||
representación_no-persona | Etiqueta de clase | int64 | ||
no persona_no-representación | Etiqueta de clase | int64 | ||
iluminación_normal | Etiqueta de clase | int64 | ||
más viejo | Etiqueta de clase | int64 | ||
persona | Etiqueta de clase | int64 | ||
representación_persona | Etiqueta de clase | int64 | ||
predominantemente_femenina | Etiqueta de clase | int64 | ||
predominantemente_masculino | Etiqueta de clase | int64 | ||
joven | Etiqueta de clase | int64 |
Claves supervisadas (Ver documento
as_supervised
):('image', 'person')
Figura ( tfds.show_examples ):
- Ejemplos ( tfds.as_dataframe ):
- Cita :
@article{banbury2024wake,
title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
journal={arXiv preprint arXiv:2405.00892},
year={2024}
}