- وصف :
Wake Vision عبارة عن مجموعة بيانات كبيرة وعالية الجودة تضم أكثر من 6 ملايين صورة، وهو ما يتجاوز بشكل كبير حجم وتنوع مجموعات بيانات tinyML الحالية (100x). تتضمن مجموعة البيانات هذه صورًا مع تعليقات توضيحية حول ما إذا كانت كل صورة تحتوي على شخص ما. بالإضافة إلى ذلك، فهو يتضمن معيارًا شاملاً ودقيقًا لتقييم العدالة والقوة، ويغطي الجنس المدرك، والعمر المتصور، ومسافة الهدف، وظروف الإضاءة، والصور. ملصقات Wake Vision مشتقة من تعليقات Open Image المرخصة من شركة Google LLC بموجب ترخيص CC BY 4.0. تم إدراج الصور على أنها تحتوي على ترخيص CC BY 2.0. ملاحظة من Open Images: "بينما كنا نحاول تحديد الصور المرخصة بموجب ترخيص Creative Commons Attribution، فإننا لا نقدم أي تعهدات أو ضمانات فيما يتعلق بحالة ترخيص كل صورة ويجب عليك التحقق من ترخيص كل صورة بنفسك."
الصفحة الرئيسية : https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi%3A10.7910%2FDVN%2F1HOPXC
كود المصدر :
tfds.datasets.wake_vision.Builder
الإصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي لمجموعات بيانات TensorFlow. لاحظ أن هذا يعتمد على الإصدار 2.0 من Wake Vision الموجود على Harvard Dataverse.
-
حجم التحميل :
Unknown size
حجم مجموعة البيانات :
239.25 GiB
التخزين المؤقت التلقائي ( الوثائق ): لا
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 55,763 |
'train_large' | 5,760,428 |
'train_quality' | 1,248,230 |
'validation' | 18,582 |
- هيكل الميزة :
FeaturesDict({
'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
'filename': Text(shape=(), dtype=string),
'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
'image': Image(shape=(None, None, 3), dtype=uint8),
'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
age_unknown | ClassLabel | int64 | ||
body_part | ClassLabel | int64 | ||
ساطع | ClassLabel | int64 | ||
مظلم | ClassLabel | int64 | ||
تصوير | ClassLabel | int64 | ||
بعيد | ClassLabel | int64 | ||
اسم الملف | نص | خيط | ||
الجنس_غير معروف | ClassLabel | int64 | ||
صورة | صورة | (لا شيء، لا شيء، 3) | uint8 | |
Medium_distance | ClassLabel | int64 | ||
middle_age | ClassLabel | int64 | ||
قريب | ClassLabel | int64 | ||
تصوير غير شخصي | ClassLabel | كثافة العمليات64 | ||
غير شخص_غير تصوير | ClassLabel | int64 | ||
Normal_lighting | ClassLabel | int64 | ||
كبار السن | ClassLabel | int64 | ||
شخص | ClassLabel | int64 | ||
person_depiction | ClassLabel | كثافة العمليات64 | ||
في الغالب_أنثى | ClassLabel | int64 | ||
في الغالب_ذكر | ClassLabel | int64 | ||
شاب | ClassLabel | كثافة العمليات64 |
المفاتيح الخاضعة للإشراف (راجع
as_supervised
doc ):('image', 'person')
الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@article{banbury2024wake,
title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
journal={arXiv preprint arXiv:2405.00892},
year={2024}
}