- توضیحات :
Eraser Multi RC مجموعه داده ای برای پرس و جوها در قسمت های چند خطی، همراه با پاسخ ها و منطق است. هر نمونه در این مجموعه داده دارای 5 بخش زیر است
- یک متن چند خطی 2. یک پرس و جو در مورد قطعه 3. یک پاسخ به پرس و جو
- طبقه بندی درست یا غلط بودن پاسخ 5. توضیحی که طبقه بندی را توجیه می کند
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://cogcomp.seas.upenn.edu/multirc/
کد منبع :
tfds.text.EraserMultiRcنسخه ها :
-
0.1.1(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
1.59 MiBحجم مجموعه داده :
62.59 MiBذخیره خودکار ( اسناد ): بله
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'test' | 4,848 |
'train' | 24,029 |
'validation' | 3,214 |
- ساختار ویژگی :
FeaturesDict({
'evidences': Sequence(Text(shape=(), dtype=string)),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'passage': Text(shape=(), dtype=string),
'query_and_answer': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| FeaturesDict | ||||
| شواهد | دنباله (متن) | (هیچ یک،) | رشته | |
| برچسب | ClassLabel | int64 | ||
| گذر | متن | رشته | ||
| query_and_answer | متن | رشته |
کلیدهای نظارت شده (به
as_superviseddoc مراجعه کنید):Noneشکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@unpublished{eraser2019,
title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
booktitle = {NAACL},
year = {2018}
}