voc

  • وصف :

تحتوي مجموعة البيانات هذه على بيانات من تحدي PASCAL لفئات الكائنات المرئية، الموافق لمسابقات التصنيف والكشف.

في مسابقة التصنيف، الهدف هو التنبؤ بمجموعة التسميات الموجودة في الصورة، بينما في مسابقة الاكتشاف الهدف هو التنبؤ بالمربع المحيط والتسمية لكل كائن على حدة. تحذير: وفقًا لمجموعة البيانات الرسمية، لا تحتوي مجموعة اختبار VOC2012 على تعليقات توضيحية.

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/filename': Text(shape=(), dtype=string),
    'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
    'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
    'objects': Sequence({
        'bbox': BBoxFeature(shape=(4,), dtype=float32),
        'is_difficult': bool,
        'is_truncated': bool,
        'label': ClassLabel(shape=(), dtype=int64, num_classes=20),
        'pose': ClassLabel(shape=(), dtype=int64, num_classes=5),
    }),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
صورة صورة (لا شيء، لا شيء، 3) uint8
الصورة/اسم الملف نص خيط
التسميات التسلسل (ClassLabel) (لا أحد،) int64
labels_no_difficult التسلسل (ClassLabel) (لا أحد،) int64
أشياء تسلسل
الكائنات/bbox ميزة BBox (4،) float32
الكائنات/is_difficult الموتر منطقي
الكائنات/is_truncated الموتر منطقي
الكائنات/التسمية ClassLabel int64
الكائنات / تشكل ClassLabel int64

voc/2007 (التكوين الافتراضي)

  • وصف التكوين : تحتوي مجموعة البيانات هذه على بيانات من PASCAL Visual Object Classes Challenge 2007، المعروف أيضًا باسم VOC2007.

تم تضمين إجمالي 9963 صورة في مجموعة البيانات هذه، حيث تحتوي كل صورة على مجموعة من الكائنات، من أصل 20 فئة مختلفة، مما يجعل إجمالي 24640 كائنًا مشروحًا.

ينقسم أمثلة
'test' 4,952
'train' 2,501
'validation' 2,510

التصور

  • الاقتباس :
@misc{pascal-voc-2007,
    author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
    title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
    howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}

صوت/2012

  • وصف التكوين : تحتوي مجموعة البيانات هذه على بيانات من PASCAL Visual Object Classes Challenge 2012، المعروف أيضًا باسم VOC2012.

تم تضمين إجمالي 11540 صورة في مجموعة البيانات هذه، حيث تحتوي كل صورة على مجموعة من الكائنات، من أصل 20 فئة مختلفة، مما يجعل إجمالي 27450 كائنًا مشروحًا.

ينقسم أمثلة
'test' 10,991
'train' 5,717
'validation' 5,823

التصور

  • الاقتباس :
@misc{pascal-voc-2012,
    author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
    title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
    howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}