despertar_vision

Descripción :

Wake Vision es un conjunto de datos grande y de alta calidad que presenta más de 6 millones de imágenes, lo que supera significativamente la escala y diversidad de los conjuntos de datos tinyML actuales (100x). Este conjunto de datos incluye imágenes con anotaciones sobre si cada imagen contiene una persona. Además, incorpora un punto de referencia integral y detallado para evaluar la equidad y la solidez, que abarca el género percibido, la edad percibida, la distancia del sujeto, las condiciones de iluminación y las representaciones. Las etiquetas de Wake Vision se derivan de las anotaciones de Open Image que tienen licencia de Google LLC bajo la licencia CC BY 4.0. Las imágenes figuran con una licencia CC BY 2.0. Nota de Open Images: "si bien intentamos identificar imágenes con licencia Creative Commons Attribution, no hacemos representaciones ni garantías con respecto al estado de la licencia de cada imagen y usted debe verificar la licencia de cada imagen usted mismo".

Página de inicio : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC
Código fuente : tfds.datasets.wake_vision.Builder
Versiones :
- 1.0.0 (predeterminado): versión inicial de conjuntos de datos de TensorFlow. Tenga en cuenta que esto se basa en la versión 2.0 de Wake Vision en Harvard Dataverse.
Tamaño de descarga : Unknown size
Tamaño del conjunto de datos : 239.25 GiB
Almacenamiento en caché automático ( documentación ): No
Divisiones :

Dividir	Ejemplos
`'test'`	55.763
`'train_large'`	5.760.428
`'train_quality'`	1.248.230
`'validation'`	18.582

Estructura de características :

FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})

Documentación de funciones :

Característica	Clase	Forma	tipo D
	FuncionesDict
edad_desconocida	Etiqueta de clase		int64
parte_del_cuerpo	Etiqueta de clase		int64
brillante	Etiqueta de clase		int64
oscuro	Etiqueta de clase		int64
representación	Etiqueta de clase		int64
lejos	Etiqueta de clase		int64
Nombre del archivo	Texto		cadena
género_desconocido	Etiqueta de clase		int64
imagen	Imagen	(Ninguno, Ninguno, 3)	uint8
media_distancia	Etiqueta de clase		int64
mediana edad	Etiqueta de clase		int64
cerca	Etiqueta de clase		int64
representación_no-persona	Etiqueta de clase		int64
no persona_no-representación	Etiqueta de clase		int64
iluminación_normal	Etiqueta de clase		int64
más viejo	Etiqueta de clase		int64
persona	Etiqueta de clase		int64
representación_persona	Etiqueta de clase		int64
predominantemente_femenina	Etiqueta de clase		int64
predominantemente_masculino	Etiqueta de clase		int64
joven	Etiqueta de clase		int64

Claves supervisadas (Ver documento as_supervised ): ('image', 'person')
Figura ( tfds.show_examples ):

Visualización

Ejemplos ( tfds.as_dataframe ):

Cita :

@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}

despertar_vision Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

despertar_vision