wake_vision

  • คำอธิบาย :

Wake Vision เป็นชุดข้อมูลขนาดใหญ่คุณภาพสูงที่มีรูปภาพมากกว่า 6 ล้านภาพ ซึ่งเกินขนาดและความหลากหลายของชุดข้อมูล TinyML ในปัจจุบันอย่างมาก (100x) ชุดข้อมูลนี้ประกอบด้วยรูปภาพพร้อมคำอธิบายประกอบว่าแต่ละรูปภาพมีบุคคลหรือไม่ นอกจากนี้ ยังรวมเกณฑ์มาตรฐานแบบละเอียดที่ครอบคลุมเพื่อประเมินความเป็นธรรมและความทนทาน ครอบคลุมเพศที่รับรู้ อายุที่รับรู้ ระยะห่างของวัตถุ สภาพแสง และการพรรณนา ป้าย Wake Vision มาจากคำอธิบายประกอบของ Open Image ซึ่งได้รับอนุญาตจาก Google LLC ภายใต้ใบอนุญาต CC BY 4.0 รูปภาพต่างๆ ระบุว่ามีใบอนุญาต CC BY 2.0 หมายเหตุจาก Open Images: "ในขณะที่เราพยายามระบุภาพที่ได้รับอนุญาตภายใต้ใบอนุญาต Creative Commons Attribution เราไม่ได้รับรองหรือรับประกันเกี่ยวกับสถานะใบอนุญาตของแต่ละภาพ และคุณควรตรวจสอบใบอนุญาตสำหรับภาพแต่ละภาพด้วยตัวเอง"

แยก ตัวอย่าง
'test' 55,763
'train_large' 5,760,428
'train_quality' 1,248,230
'validation' 18,582
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
อายุ_ไม่ทราบ ClassLabel int64
body_part ClassLabel int64
สว่าง ClassLabel int64
มืด ClassLabel int64
การพรรณนา ClassLabel int64
ไกล ClassLabel int64
ชื่อไฟล์ ข้อความ เชือก
เพศ_ไม่ทราบ ClassLabel int64
ภาพ ภาพ (ไม่มี ไม่มี 3) uint8
ปานกลาง_ระยะทาง ClassLabel int64
วัยกลางคน ClassLabel int64
ใกล้ ClassLabel int64
ไม่ใช่รูปบุคคล ClassLabel int64
ไม่ใช่บุคคล_ไม่ใช่ภาพ ClassLabel int64
ปกติ_แสง ClassLabel int64
แก่กว่า ClassLabel int64
บุคคล ClassLabel int64
บุคคล_ภาพ ClassLabel int64
เด่น_หญิง ClassLabel int64
ส่วนใหญ่_ชาย ClassLabel int64
หนุ่มสาว ClassLabel int64

การแสดงภาพ

  • การอ้างอิง :
@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}