- คำอธิบาย :
Wake Vision เป็นชุดข้อมูลขนาดใหญ่คุณภาพสูงที่มีรูปภาพมากกว่า 6 ล้านภาพ ซึ่งเกินขนาดและความหลากหลายของชุดข้อมูล TinyML ในปัจจุบันอย่างมาก (100x) ชุดข้อมูลนี้ประกอบด้วยรูปภาพพร้อมคำอธิบายประกอบว่าแต่ละรูปภาพมีบุคคลหรือไม่ นอกจากนี้ ยังรวมเกณฑ์มาตรฐานแบบละเอียดที่ครอบคลุมเพื่อประเมินความเป็นธรรมและความทนทาน ครอบคลุมเพศที่รับรู้ อายุที่รับรู้ ระยะห่างของวัตถุ สภาพแสง และการพรรณนา ป้าย Wake Vision มาจากคำอธิบายประกอบของ Open Image ซึ่งได้รับอนุญาตจาก Google LLC ภายใต้ใบอนุญาต CC BY 4.0 รูปภาพต่างๆ ระบุว่ามีใบอนุญาต CC BY 2.0 หมายเหตุจาก Open Images: "ในขณะที่เราพยายามระบุภาพที่ได้รับอนุญาตภายใต้ใบอนุญาต Creative Commons Attribution เราไม่ได้รับรองหรือรับประกันเกี่ยวกับสถานะใบอนุญาตของแต่ละภาพ และคุณควรตรวจสอบใบอนุญาตสำหรับภาพแต่ละภาพด้วยตัวเอง"
หน้าแรก : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC
ซอร์สโค้ด :
tfds.datasets.wake_vision.Builder
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): การเปิดตัวชุดข้อมูล TensorFlow เริ่มต้น โปรดทราบว่าสิ่งนี้อิงจาก Wake Vision เวอร์ชัน 2.0 บน Harvard Dataverse
-
ขนาดการดาวน์โหลด :
Unknown size
ขนาดชุดข้อมูล :
239.25 GiB
แคชอัตโนมัติ ( เอกสาร ): No
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 55,763 |
'train_large' | 5,760,428 |
'train_quality' | 1,248,230 |
'validation' | 18,582 |
- โครงสร้างคุณสมบัติ :
FeaturesDict({
'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
'filename': Text(shape=(), dtype=string),
'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'image': Image(shape=(None, None, 3), dtype=uint8),
'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | ประเภทD | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
อายุ_ไม่ทราบ | ClassLabel | int64 | ||
body_part | ClassLabel | int64 | ||
สว่าง | ClassLabel | int64 | ||
มืด | ClassLabel | int64 | ||
การพรรณนา | ClassLabel | int64 | ||
ไกล | ClassLabel | int64 | ||
ชื่อไฟล์ | ข้อความ | เชือก | ||
เพศ_ไม่ทราบ | ClassLabel | int64 | ||
ภาพ | ภาพ | (ไม่มี ไม่มี 3) | uint8 | |
ปานกลาง_ระยะทาง | ClassLabel | int64 | ||
วัยกลางคน | ClassLabel | int64 | ||
ใกล้ | ClassLabel | int64 | ||
ไม่ใช่รูปบุคคล | ClassLabel | int64 | ||
ไม่ใช่บุคคล_ไม่ใช่ภาพ | ClassLabel | int64 | ||
ปกติ_แสง | ClassLabel | int64 | ||
แก่กว่า | ClassLabel | int64 | ||
บุคคล | ClassLabel | int64 | ||
บุคคล_ภาพ | ClassLabel | int64 | ||
เด่น_หญิง | ClassLabel | int64 | ||
ส่วนใหญ่_ชาย | ClassLabel | int64 | ||
หนุ่มสาว | ClassLabel | int64 |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('image', 'person')
รูป ( tfds.show_examples ):
- ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@article{banbury2024wake,
title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
journal={arXiv preprint arXiv:2405.00892},
year={2024}
}