- Описание :
Wake Vision — это большой высококачественный набор данных, содержащий более 6 миллионов изображений, что значительно превышает масштаб и разнообразие текущих наборов данных tinyML (в 100 раз). Этот набор данных включает изображения с аннотациями о том, содержит ли каждое изображение человека. Кроме того, он включает в себя комплексный детальный критерий для оценки справедливости и надежности, охватывающий воспринимаемый пол, воспринимаемый возраст, расстояние до объекта, условия освещения и изображения. Ярлыки Wake Vision созданы на основе аннотаций Open Image, которые лицензированы Google LLC по лицензии CC BY 4.0. Изображения указаны как имеющие лицензию CC BY 2.0. Примечание от Open Images: «Хотя мы пытались идентифицировать изображения, лицензированные по лицензии Creative Commons Attribution, мы не делаем никаких заявлений и не даем гарантий относительно статуса лицензии каждого изображения, и вам следует проверить лицензию для каждого изображения самостоятельно».
Домашняя страница : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC.
Исходный код :
tfds.datasets.wake_vision.Builder.Версии :
-
1.0.0(по умолчанию): начальная версия наборов данных TensorFlow. Обратите внимание, что это основано на версии 2.0 Wake Vision в Harvard Dataverse.
-
Размер загрузки :
Unknown sizeРазмер набора данных :
239.25 GiBАвтокэширование ( документация ): Нет
Расколы :
| Расколоть | Примеры |
|---|---|
'test' | 55 763 |
'train_large' | 5 760 428 |
'train_quality' | 1 248 230 |
'validation' | 18 582 |
- Структура функции :
FeaturesDict({
'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
'filename': Text(shape=(), dtype=string),
'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'image': Image(shape=(None, None, 3), dtype=uint8),
'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Функциональная документация :
| Особенность | Сорт | Форма | Дтип | Описание |
|---|---|---|---|---|
| ВозможностиDict | ||||
| возраст_неизвестен | Класслейбл | int64 | ||
| часть_тела | Класслейбл | int64 | ||
| яркий | Класслейбл | int64 | ||
| темный | Класслейбл | int64 | ||
| описание | Класслейбл | int64 | ||
| далеко | Класслейбл | int64 | ||
| имя файла | Текст | нить | ||
| пол_неизвестен | Класслейбл | int64 | ||
| изображение | Изображение | (Нет, Нет, 3) | uint8 | |
| среднее_дистанция | Класслейбл | int64 | ||
| средний_возраст | Класслейбл | int64 | ||
| около | Класслейбл | int64 | ||
| не-person_depiction | Класслейбл | int64 | ||
| нечеловек_неизображение | Класслейбл | int64 | ||
| нормальное_освещение | Класслейбл | int64 | ||
| старше | Класслейбл | int64 | ||
| человек | Класслейбл | int64 | ||
| person_depiction | Класслейбл | int64 | ||
| преимущественно_женщины | Класслейбл | int64 | ||
| преимущественно_мужчины | Класслейбл | int64 | ||
| молодой | Класслейбл | int64 |
Контролируемые ключи (см. документ
as_supervised):('image', 'person')Рисунок ( tfds.show_examples ):

- Примеры ( tfds.as_dataframe ):
- Цитата :
@article{banbury2024wake,
title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
journal={arXiv preprint arXiv:2405.00892},
year={2024}
}