- الوصف :
Eraser Multi RC هي مجموعة بيانات للاستعلامات عبر مقاطع متعددة الأسطر ، جنبًا إلى جنب مع الإجابات والتعليل المنطقي. يحتوي كل مثال في مجموعة البيانات هذه على الأجزاء الخمسة التالية
- ممر متعدد الخطوط 2. استعلام عن المقطع 3. إجابة على الاستعلام
- تصنيف ما إذا كانت الإجابة صحيحة أم خاطئة 5. شرح يبرر التصنيف
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://cogcomp.seas.upenn.edu/multirc/
كود المصدر :
tfds.text.EraserMultiRcإصدارات :
-
0.1.1(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
1.59 MiBحجم مجموعة البيانات :
62.59 MiBالتخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'test' | 4848 |
'train' | 24،029 |
'validation' | 3214 |
- هيكل الميزة :
FeaturesDict({
'evidences': Sequence(Text(shape=(), dtype=string)),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'passage': Text(shape=(), dtype=string),
'query_and_answer': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| الميزات | ||||
| الأدلة | تسلسل (نص) | (لا أحد،) | سلسلة | |
| ضع الكلمة المناسبة | ClassLabel | int64 | ||
| الممر | نص | سلسلة | ||
| الاستعلام_و_الإجابة | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised):Noneالشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@unpublished{eraser2019,
title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
booktitle = {NAACL},
year = {2018}
}