Wake_vision

  • وصف :

Wake Vision عبارة عن مجموعة بيانات كبيرة وعالية الجودة تضم أكثر من 6 ملايين صورة، وهو ما يتجاوز بشكل كبير حجم وتنوع مجموعات بيانات tinyML الحالية (100x). تتضمن مجموعة البيانات هذه صورًا مع تعليقات توضيحية حول ما إذا كانت كل صورة تحتوي على شخص ما. بالإضافة إلى ذلك، فهو يتضمن معيارًا شاملاً ودقيقًا لتقييم العدالة والقوة، ويغطي الجنس المدرك، والعمر المتصور، ومسافة الهدف، وظروف الإضاءة، والصور. ملصقات Wake Vision مشتقة من تعليقات Open Image المرخصة من شركة Google LLC بموجب ترخيص CC BY 4.0. تم إدراج الصور على أنها تحتوي على ترخيص CC BY 2.0. ملاحظة من Open Images: "بينما كنا نحاول تحديد الصور المرخصة بموجب ترخيص Creative Commons Attribution، فإننا لا نقدم أي تعهدات أو ضمانات فيما يتعلق بحالة ترخيص كل صورة ويجب عليك التحقق من ترخيص كل صورة بنفسك."

ينقسم أمثلة
'test' 55,763
'train_large' 5,760,428
'train_quality' 1,248,230
'validation' 18,582
  • هيكل الميزة :
FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
age_unknown ClassLabel int64
body_part ClassLabel int64
ساطع ClassLabel int64
مظلم ClassLabel int64
تصوير ClassLabel int64
بعيد ClassLabel int64
اسم الملف نص خيط
الجنس_غير معروف ClassLabel int64
صورة صورة (لا شيء، لا شيء، 3) uint8
Medium_distance ClassLabel int64
middle_age ClassLabel int64
قريب ClassLabel int64
تصوير غير شخصي ClassLabel كثافة العمليات64
غير شخص_غير تصوير ClassLabel int64
Normal_lighting ClassLabel int64
كبار السن ClassLabel int64
شخص ClassLabel int64
person_depiction ClassLabel كثافة العمليات64
في الغالب_أنثى ClassLabel int64
في الغالب_ذكر ClassLabel int64
شاب ClassLabel كثافة العمليات64

التصور

  • الاقتباس :
@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}