- توضیحات :
QASC یک مجموعه داده پاسخگوی سوال با تمرکز بر ترکیب جمله است. این شامل 9980 سؤال 8 گزینه ای چند گزینه ای در مورد علوم پایه (8134 قطار، 926 توسعه، آزمون 920)، و همراه با مجموعه ای از 17 میلیون جمله است.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://allenai.org/data/qasc
کد منبع :
tfds.datasets.qasc.Builderنسخه ها :
-
0.1.0(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
1.54 MiBحجم مجموعه داده :
6.61 MiBذخیره خودکار ( اسناد ): بله
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'test' | 920 |
'train' | 8,134 |
'validation' | 926 |
- ساختار ویژگی :
FeaturesDict({
'answerKey': Text(shape=(), dtype=string),
'choices': Sequence({
'label': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
}),
'combinedfact': Text(shape=(), dtype=string),
'fact1': Text(shape=(), dtype=string),
'fact2': Text(shape=(), dtype=string),
'formatted_question': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| FeaturesDict | ||||
| کلید پاسخ | متن | رشته | ||
| انتخاب ها | توالی | |||
| انتخاب/برچسب | متن | رشته | ||
| انتخاب ها/متن | متن | رشته | ||
| واقعیت ترکیبی | متن | رشته | ||
| واقعیت 1 | متن | رشته | ||
| واقعیت 2 | متن | رشته | ||
| فرمت شده_سوال | متن | رشته | ||
| شناسه | متن | رشته | ||
| سوال | متن | رشته |
کلیدهای نظارت شده (به
as_superviseddoc مراجعه کنید):Noneشکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@article{allenai:qasc,
author = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
title = {QASC: A Dataset for Question Answering via Sentence Composition},
journal = {arXiv:1910.11473v2},
year = {2020},
}