- الوصف :
تعد مجموعة بيانات HellaSwag معيارًا لـ Commonsense NLI. يتضمن السياق وبعض النهايات التي تكمل السياق.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية https://rowanzellers.com/hellaswag/
كود المصدر :
tfds.text.Hellaswagإصدارات :
-
0.0.1: لا توجد ملاحظات إصدار. -
1.0.0: إضافة تقسيمات منفصلة لمجموعات التحقق من الصحة / الاختبار داخل المجال وخارجه. -
1.1.0(افتراضي): بعد انقسام آخر للمصدر (wikiHow مقابل Activitynet)
-
حجم التحميل :
68.18 MiBحجم مجموعة البيانات :
107.45 MiBالتخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'test' | 10،003 |
'test_ind_activitynet' | 1،870 |
'test_ind_wikihow' | 3132 |
'test_ood_activitynet' | 1،651 |
'test_ood_wikihow' | 3350 |
'train' | 39905 |
'train_activitynet' | 14،740 |
'train_wikihow' | 25165 |
'validation' | 10،042 |
'validation_ind_activitynet' | 1،809 |
'validation_ind_wikihow' | 3،192 |
'validation_ood_activitynet' | 1،434 |
'validation_ood_wikihow' | 3،607 |
- هيكل الميزة :
FeaturesDict({
'activity_label': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'endings': Sequence(Text(shape=(), dtype=string)),
'label': int32,
'source_id': Text(shape=(), dtype=string),
'split_type': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| الميزات | ||||
| نشاط_تصنيف | نص | سلسلة | ||
| سياق الكلام | نص | سلسلة | ||
| النهايات | تسلسل (نص) | (لا أحد،) | سلسلة | |
| ضع الكلمة المناسبة | موتر | int32 | ||
| source_id | نص | سلسلة | ||
| نوع منقسم | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised):Noneالشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@inproceedings{zellers2019hellaswag,
title={HellaSwag: Can a Machine Really Finish Your Sentence?},
author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
year={2019}
}