- الوصف :
Race عبارة عن مجموعة بيانات واسعة النطاق لفهم القراءة تضم أكثر من 28000 مقطع وما يقرب من 100000 سؤال. يتم جمع مجموعة البيانات من اختبارات اللغة الإنجليزية في الصين ، والتي تم تصميمها لطلاب المدارس المتوسطة والثانوية. يمكن تقديم مجموعة البيانات كمجموعات تدريب واختبار لفهم الآلة.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
وصف التكوين : تكوين Builder لمجموعة بيانات RACE.
الصفحة الرئيسية : https://www.cs.cmu.edu/~glai1/data/race/
كود المصدر :
tfds.datasets.race.Builderإصدارات :
-
1.0.0: الإصدار الأولي. -
2.0.0(افتراضي): أضف معرف المثال.
-
حجم التحميل :
24.26 MiBالتخزين المؤقت التلقائي ( الوثائق ): نعم
هيكل الميزة :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| الميزات | ||||
| الإجابات | تسلسل (نص) | (لا أحد،) | سلسلة | |
| مقالة - سلعة | نص | سلسلة | ||
| example_id | نص | سلسلة | ||
| والخيارات | تسلسل (تسلسل (نص)) | (ليس ليس) | سلسلة | |
| أسئلة | تسلسل (نص) | (لا أحد،) | سلسلة |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised):Noneالشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
سباق / مرتفع (التكوين الافتراضي)
حجم مجموعة البيانات :
52.39 MiBالانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'dev' | 1،021 |
'test' | 1045 |
'train' | 18.728 |
- أمثلة ( tfds.as_dataframe ):
العرق / الوسط
حجم مجموعة البيانات :
12.51 MiBالانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6409 |
- أمثلة ( tfds.as_dataframe ):