- توضیحات :
مجموعه داده LAMBADA قابلیت های مدل های محاسباتی را برای درک متن با استفاده از یک کار پیش بینی کلمه ارزیابی می کند. لامبادا مجموعهای از قسمتهای روایی است که این ویژگی را به اشتراک میگذارد که سوژههای انسانی در صورت قرار گرفتن در معرض کل قسمت میتوانند آخرین کلمه خود را حدس بزنند، اما اگر فقط آخرین جمله قبل از کلمه مورد نظر را ببینند نه.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://zenodo.org/record/2630551#.X4Xzn5NKjUI
کد منبع :
tfds.datasets.lambada.Builderنسخه ها :
-
1.0.0(پیش فرض): انتشار اولیه.
-
حجم دانلود :
319.03 MiBحجم مجموعه داده :
3.49 MiBذخیره خودکار ( اسناد ): بله
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'test' | 5,153 |
'train' | 4,869 |
- ساختار ویژگی :
FeaturesDict({
'passage': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| FeaturesDict | ||||
| گذر | متن | رشته |
کلیدهای نظارت شده (به
as_superviseddoc مراجعه کنید):Noneشکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@inproceedings{paperno-etal-2016-lambada,
title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
author = "Paperno, Denis and
Kruszewski, Germ{\'a}n and
Lazaridou, Angeliki and
Pham, Ngoc Quan and
Bernardi, Raffaella and
Pezzelle, Sandro and
Baroni, Marco and
Boleda, Gemma and
Fern{\'a}ndez, Raquel",
booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
month = aug,
year = "2016",
address = "Berlin, Germany",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P16-1144",
doi = "10.18653/v1/P16-1144",
pages = "1525--1534",
}