- وصف :
تحتوي مجموعة البيانات هذه على بيانات من تحدي PASCAL لفئات الكائنات المرئية، الموافق لمسابقات التصنيف والكشف.
في مسابقة التصنيف، الهدف هو التنبؤ بمجموعة التسميات الموجودة في الصورة، بينما في مسابقة الاكتشاف الهدف هو التنبؤ بالمربع المحيط والتسمية لكل كائن على حدة. تحذير: وفقًا لمجموعة البيانات الرسمية، لا تحتوي مجموعة اختبار VOC2012 على تعليقات توضيحية.
وثائق إضافية : استكشاف الأوراق باستخدام الكود
كود المصدر :
tfds.object_detection.Voc
الإصدارات :
-
5.0.0
(افتراضي) : لا توجد ملاحظات الإصدار.
-
التخزين المؤقت التلقائي ( الوثائق ): لا
هيكل الميزة :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_difficult': bool,
'is_truncated': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=20),
'pose': ClassLabel(shape=(), dtype=int64, num_classes=5),
}),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
صورة | صورة | (لا شيء، لا شيء، 3) | uint8 | |
الصورة/اسم الملف | نص | خيط | ||
التسميات | التسلسل (ClassLabel) | (لا أحد،) | int64 | |
labels_no_difficult | التسلسل (ClassLabel) | (لا أحد،) | int64 | |
أشياء | تسلسل | |||
الكائنات/bbox | ميزة BBox | (4،) | float32 | |
الكائنات/is_difficult | الموتر | منطقي | ||
الكائنات/is_truncated | الموتر | منطقي | ||
الكائنات/التسمية | ClassLabel | int64 | ||
الكائنات / تشكل | ClassLabel | int64 |
- المفاتيح الخاضعة للإشراف (راجع
as_supervised
doc ):None
voc/2007 (التكوين الافتراضي)
- وصف التكوين : تحتوي مجموعة البيانات هذه على بيانات من PASCAL Visual Object Classes Challenge 2007، المعروف أيضًا باسم VOC2007.
تم تضمين إجمالي 9963 صورة في مجموعة البيانات هذه، حيث تحتوي كل صورة على مجموعة من الكائنات، من أصل 20 فئة مختلفة، مما يجعل إجمالي 24640 كائنًا مشروحًا.
الصفحة الرئيسية : http://host.robots.ox.ac.uk/pascal/VOC/voc2007/
حجم التحميل :
868.85 MiB
حجم مجموعة البيانات :
837.73 MiB
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 4,952 |
'train' | 2,501 |
'validation' | 2,510 |
- الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@misc{pascal-voc-2007,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}
صوت/2012
- وصف التكوين : تحتوي مجموعة البيانات هذه على بيانات من PASCAL Visual Object Classes Challenge 2012، المعروف أيضًا باسم VOC2012.
تم تضمين إجمالي 11540 صورة في مجموعة البيانات هذه، حيث تحتوي كل صورة على مجموعة من الكائنات، من أصل 20 فئة مختلفة، مما يجعل إجمالي 27450 كائنًا مشروحًا.
الصفحة الرئيسية : http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
حجم التحميل :
3.59 GiB
حجم مجموعة البيانات :
2.44 GiB
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 10,991 |
'train' | 5,717 |
'validation' | 5,823 |
- الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@misc{pascal-voc-2012,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}