uyanıklık_vizyonu

  • Tanım :

Wake Vision, mevcut TinyML veri kümelerinin (100x) ölçeğini ve çeşitliliğini önemli ölçüde aşan, 6 milyondan fazla görüntü içeren büyük, yüksek kaliteli bir veri kümesidir. Bu veri kümesi, her görüntünün bir kişiyi içerip içermediğine ilişkin ek açıklamalar içeren görseller içerir. Ek olarak, adaleti ve sağlamlığı değerlendirmek için algılanan cinsiyeti, algılanan yaşı, konu mesafesini, aydınlatma koşullarını ve tasvirleri kapsayan kapsamlı, ayrıntılı bir kıyaslama içerir. Wake Vision etiketleri, Google LLC tarafından CC BY 4.0 lisansı kapsamında lisanslanan Open Image ek açıklamalarından türetilmiştir. Görseller CC BY 2.0 lisansına sahip olarak listelenmiştir. Açık Görsellerden Not: "Creative Commons Attribution lisansı kapsamında lisanslanan görselleri belirlemeye çalışsak da, her görselin lisans durumuyla ilgili hiçbir beyan veya garanti vermiyoruz ve her görselin lisansını kendiniz doğrulamanız gerekir."

Bölmek Örnekler
'test' 55.763
'train_large' 5.760.428
'train_quality' 1.248.230
'validation' 18.582
  • Özellik yapısı :
FeaturesDict({
    'age_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'body_part': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'bright': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'dark': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'far': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'filename': Text(shape=(), dtype=string),
    'gender_unknown': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'medium_distance': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'middle_age': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'near': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'non-person_non-depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'normal_lighting': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'older': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'person_depiction': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_female': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'predominantly_male': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'young': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
yaş_bilinmiyor SınıfEtiketi int64
vücut parçası SınıfEtiketi int64
parlak SınıfEtiketi int64
karanlık SınıfEtiketi int64
tasvir SınıfEtiketi int64
uzak SınıfEtiketi int64
dosya adı Metin sicim
cinsiyet_bilinmiyor SınıfEtiketi int64
görüntü Resim (Yok, Yok, 3) uint8
orta mesafe SınıfEtiketi int64
orta yaş SınıfEtiketi int64
yakın SınıfEtiketi int64
non-person_depiction SınıfEtiketi int64
non-person_non-tasvir SınıfEtiketi int64
normal_aydınlatma SınıfEtiketi int64
daha yaşlı SınıfEtiketi int64
kişi SınıfEtiketi int64
kişi_tasviri SınıfEtiketi int64
ağırlıklı olarak kadın SınıfEtiketi int64
ağırlıklı olarak erkek SınıfEtiketi int64
genç SınıfEtiketi int64

Görselleştirme

  • Alıntı :
@article{banbury2024wake,
  title={Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection},
  author={Banbury, Colby and Njor, Emil and Stewart, Matthew and Warden, Pete and Kudlur, Manjunath and Jeffries, Nat and Fafoutis, Xenofon and Reddi, Vijay Janapa},
  journal={arXiv preprint arXiv:2405.00892},
  year={2024}
}