- توضیحات :
Race یک مجموعه داده درک مطلب در مقیاس بزرگ با بیش از 28000 متن و نزدیک به 100000 سوال است. مجموعه داده از امتحانات انگلیسی در چین جمع آوری شده است که برای دانش آموزان دبیرستانی و دبیرستانی طراحی شده است. مجموعه داده را می توان به عنوان مجموعه آموزشی و آزمایشی برای درک ماشین استفاده کرد.
اسناد اضافی : کاوش در کاغذها با کد
توضیحات پیکربندی : پیکربندی سازنده برای مجموعه داده RACE.
صفحه اصلی : https://www.cs.cmu.edu/~glai1/data/race/
کد منبع :
tfds.datasets.race.Builderنسخه ها :
-
1.0.0: انتشار اولیه. -
2.0.0(پیش فرض): شناسه مثال را اضافه کنید.
-
حجم دانلود :
24.26 MiBذخیره خودکار ( اسناد ): بله
ساختار ویژگی :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| FeaturesDict | ||||
| پاسخ می دهد | دنباله (متن) | (هیچ یک،) | رشته | |
| مقاله | متن | رشته | ||
| example_id | متن | رشته | ||
| گزینه ها | دنباله (توالی (متن)) | (هیچ، هیچکدام) | رشته | |
| سوالات | دنباله (متن) | (هیچ یک،) | رشته |
کلیدهای نظارت شده (به
as_superviseddoc مراجعه کنید):Noneشکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
مسابقه/بالا (پیکربندی پیش فرض)
حجم مجموعه داده :
52.39 MiBتقسیم ها :
| شکاف | مثال ها |
|---|---|
'dev' | 1021 |
'test' | 1,045 |
'train' | 18728 |
- مثالها ( tfds.as_dataframe ):
نژاد / وسط
حجم مجموعه داده :
12.51 MiBتقسیم ها :
| شکاف | مثال ها |
|---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6,409 |
- مثالها ( tfds.as_dataframe ):