- คำอธิบาย :
Wake Vision เป็นชุดข้อมูลขนาดใหญ่คุณภาพสูงที่มีรูปภาพมากกว่า 6 ล้านภาพ ซึ่งเกินขนาดและความหลากหลายของชุดข้อมูล TinyML ในปัจจุบันอย่างมาก (100x) ชุดข้อมูลนี้ประกอบด้วยรูปภาพพร้อมคำอธิบายประกอบว่าแต่ละรูปภาพมีบุคคลหรือไม่ นอกจากนี้ ยังรวมเกณฑ์มาตรฐานแบบละเอียดที่ครอบคลุมเพื่อประเมินความเป็นธรรมและความทนทาน ครอบคลุมเพศที่รับรู้ อายุที่รับรู้ ระยะห่างของวัตถุ สภาพแสง และการพรรณนา ป้าย Wake Vision มาจากคำอธิบายประกอบของ Open Image ซึ่งได้รับอนุญาตจาก Google LLC ภายใต้ใบอนุญาต CC BY 4.0 รูปภาพต่างๆ ระบุว่ามีใบอนุญาต CC BY 2.0 หมายเหตุจาก Open Images: "ในขณะที่เราพยายามระบุภาพที่ได้รับอนุญาตภายใต้ใบอนุญาต Creative Commons Attribution เราไม่ได้รับรองหรือรับประกันเกี่ยวกับสถานะใบอนุญาตของแต่ละภาพ และคุณควรตรวจสอบใบอนุญาตสำหรับภาพแต่ละภาพด้วยตัวเอง"
หน้าแรก : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC
ซอร์สโค้ด :
tfds.datasets.wake_vision.Builderรุ่น :
-
1.0.0(ค่าเริ่มต้น): การเปิดตัวชุดข้อมูล TensorFlow เริ่มต้น โปรดทราบว่าสิ่งนี้อิงจาก Wake Vision เวอร์ชัน 2.0 บน Harvard Dataverse
-
ขนาดการดาวน์โหลด :
Unknown sizeขนาดชุดข้อมูล :
239.25 GiBแคชอัตโนมัติ ( เอกสาร ): No
แยก :
| แยก | ตัวอย่าง |
|---|---|
'test' | 55,763 |
'train_large' | 5,760,428 |
'train_quality' | 1,248,230 |
'validation' | 18,582 |
- โครงสร้างคุณสมบัติ :
FeaturesDict({
'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
'filename': Text(shape=(), dtype=string),
'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'image': Image(shape=(None, None, 3), dtype=uint8),
'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- เอกสารคุณสมบัติ :
| คุณสมบัติ | ระดับ | รูปร่าง | ประเภทD | คำอธิบาย |
|---|---|---|---|---|
| คุณสมบัติDict | ||||
| อายุ_ไม่ทราบ | ClassLabel | int64 | ||
| body_part | ClassLabel | int64 | ||
| สว่าง | ClassLabel | int64 | ||
| มืด | ClassLabel | int64 | ||
| การพรรณนา | ClassLabel | int64 | ||
| ไกล | ClassLabel | int64 | ||
| ชื่อไฟล์ | ข้อความ | เชือก | ||
| เพศ_ไม่ทราบ | ClassLabel | int64 | ||
| ภาพ | ภาพ | (ไม่มี ไม่มี 3) | uint8 | |
| ปานกลาง_ระยะทาง | ClassLabel | int64 | ||
| วัยกลางคน | ClassLabel | int64 | ||
| ใกล้ | ClassLabel | int64 | ||
| ไม่ใช่รูปบุคคล | ClassLabel | int64 | ||
| ไม่ใช่บุคคล_ไม่ใช่ภาพ | ClassLabel | int64 | ||
| ปกติ_แสง | ClassLabel | int64 | ||
| แก่กว่า | ClassLabel | int64 | ||
| บุคคล | ClassLabel | int64 | ||
| บุคคล_ภาพ | ClassLabel | int64 | ||
| เด่น_หญิง | ClassLabel | int64 | ||
| ส่วนใหญ่_ชาย | ClassLabel | int64 | ||
| หนุ่มสาว | ClassLabel | int64 |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('image', 'person')รูป ( tfds.show_examples ):

- ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@article{banbury2024wake,
title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
journal={arXiv preprint arXiv:2405.00892},
year={2024}
}