- 설명 :
Wake Vision은 600만 개가 넘는 이미지를 포함하는 대규모 고품질 데이터 세트로, 현재 TinyML 데이터 세트(100배)의 규모와 다양성을 훨씬 뛰어넘습니다. 이 데이터 세트에는 각 이미지에 사람이 포함되어 있는지 여부에 대한 주석이 포함된 이미지가 포함되어 있습니다. 또한 인지된 성별, 인지된 연령, 피사체 거리, 조명 조건 및 묘사를 포괄하여 공정성과 견고성을 평가하기 위한 포괄적이고 세분화된 벤치마크를 통합합니다. Wake Vision 라벨은 CC BY 4.0 라이선스에 따라 Google LLC에서 라이선스를 부여한 Open Image의 주석에서 파생됩니다. 이미지에는 CC BY 2.0 라이센스가 있는 것으로 나열됩니다. Open Images의 참고 사항: "Creative Commons Attribution 라이센스에 따라 라이센스가 부여된 이미지를 식별하려고 시도했지만 각 이미지의 라이센스 상태에 대해 어떠한 진술이나 보증도 하지 않으며 각 이미지에 대한 라이센스를 직접 확인해야 합니다."
홈페이지 : https://dataverse.harvard.edu/dataset.xhtml?pertantId=doi%3A10.7910%2FDVN%2F1HOPXC
버전 :
-
1.0.0
(기본값): 초기 TensorFlow 데이터세트 릴리스입니다. 이는 Harvard Dataverse의 Wake Vision 2.0 버전을 기반으로 합니다.
-
다운로드 크기 :
Unknown size
데이터세트 크기 :
239.25 GiB
자동 캐시 ( 문서 ): 아니요
분할 :
나뉘다 | 예 |
---|---|
'test' | 55,763 |
'train_large' | 5,760,428 |
'train_quality' | 1,248,230 |
'validation' | 18,582 |
- 기능 구조 :
FeaturesDict({
'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
'filename': Text(shape=(), dtype=string),
'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'image': Image(shape=(None, None, 3), dtype=uint8),
'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- 기능 문서 :
특징 | 수업 | 모양 | Dtype | 설명 |
---|---|---|---|---|
특징Dict | ||||
나이_알 수 없음 | 클래스 라벨 | 정수64 | ||
신체 부위 | 클래스 라벨 | 정수64 | ||
밝은 | 클래스 라벨 | 정수64 | ||
어두운 | 클래스 라벨 | 정수64 | ||
묘사 | 클래스 라벨 | 정수64 | ||
멀리 | 클래스 라벨 | 정수64 | ||
파일 이름 | 텍스트 | 끈 | ||
성별_알 수 없음 | 클래스 라벨 | 정수64 | ||
영상 | 영상 | (없음, 없음, 3) | uint8 | |
중간 거리 | 클래스 라벨 | 정수64 | ||
중년 | 클래스 라벨 | 정수64 | ||
가까운 | 클래스 라벨 | 정수64 | ||
사람이 아닌 묘사 | 클래스 라벨 | 정수64 | ||
사람이 아닌_비묘사 | 클래스 라벨 | 정수64 | ||
일반_조명 | 클래스 라벨 | 정수64 | ||
나이가 많은 | 클래스 라벨 | 정수64 | ||
사람 | 클래스 라벨 | 정수64 | ||
사람_묘사 | 클래스 라벨 | 정수64 | ||
주로_여성 | 클래스 라벨 | 정수64 | ||
주로_남성 | 클래스 라벨 | 정수64 | ||
어린 | 클래스 라벨 | 정수64 |
감독되는 키 (
as_supervised
doc 참조):('image', 'person')
그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):
- 인용 :
@article{banbury2024wake,
title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
journal={arXiv preprint arXiv:2405.00892},
year={2024}
}