- Tanım :
Bu veri seti, Sınıflandırma ve Tespit yarışmalarına karşılık gelen PASCAL Görsel Nesne Sınıfları Yarışmasından elde edilen verileri içerir.
Sınıflandırma yarışmasında amaç, görüntüde bulunan etiket kümesini tahmin etmektir; Tespit yarışmasında ise amaç, her bir nesnenin sınırlayıcı kutusunu ve etiketini tahmin etmektir. UYARI: Resmi veri setine göre VOC2012 test seti herhangi bir açıklama içermemektedir.
Kaynak kodu :
tfds.object_detection.Voc
Sürümler :
-
5.0.0
(varsayılan) : Sürüm notu yok.
-
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Özellik yapısı :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_difficult': bool,
'is_truncated': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=20),
'pose': ClassLabel(shape=(), dtype=int64, num_classes=5),
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
resim | Resim | (Yok, Yok, 3) | uint8 | |
resim/dosya adı | Metin | sicim | ||
etiketler | Sıra(SınıfEtiketi) | (Hiçbiri,) | int64 | |
labels_no_difficult | Sıra(SınıfEtiketi) | (Hiçbiri,) | int64 | |
nesneler | Sekans | |||
nesneler/bbox | BBoxÖzelliği | (4,) | kayan nokta32 | |
nesneler/is_difficult | Tensör | bool | ||
nesneler/is_truncated | Tensör | bool | ||
nesneler/etiket | SınıfEtiketi | int64 | ||
nesneler/poz | SınıfEtiketi | int64 |
- Denetlenen anahtarlar (
as_supervised
belgesine bakın):None
voc/2007 (varsayılan yapılandırma)
- Yapılandırma açıklaması : Bu veri kümesi, VOC2007 olarak da bilinen PASCAL Görsel Nesne Sınıfları Mücadelesi 2007'den verileri içerir.
Bu veri kümesine toplam 9963 görüntü dahil edilmiştir; burada her görüntü, 20 farklı sınıftan oluşan bir dizi nesne içerir ve bu da toplam 24640 açıklamalı nesne anlamına gelir.
Ana sayfa : http://host.robots.ox.ac.uk/pascal/VOC/voc2007/
İndirme boyutu :
868.85 MiB
Veri kümesi boyutu :
837.73 MiB
Bölünmeler :
Bölmek | Örnekler |
---|---|
'test' | 4.952 |
'train' | 2.501 |
'validation' | 2.510 |
- Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
- Alıntı :
@misc{pascal-voc-2007,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}
voc/2012
- Yapılandırma açıklaması : Bu veri kümesi, VOC2012 olarak da bilinen PASCAL Görsel Nesne Sınıfları Yarışması 2012'den verileri içerir.
Bu veri kümesine toplam 11540 görüntü dahil edilmiştir; burada her görüntü, 20 farklı sınıftan oluşan bir dizi nesne içerir ve toplamda 27450 açıklamalı nesne oluşturur.
Ana sayfa : http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
İndirme boyutu :
3.59 GiB
Veri kümesi boyutu :
2.44 GiB
Bölünmeler :
Bölmek | Örnekler |
---|---|
'test' | 10.991 |
'train' | 5.717 |
'validation' | 5.823 |
- Şekil ( tfds.show_examples ):
- Örnekler ( tfds.as_dataframe ):
- Alıntı :
@misc{pascal-voc-2012,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}