- বর্ণনা :
LAMBADA ডেটাসেট একটি শব্দ ভবিষ্যদ্বাণী টাস্কের মাধ্যমে পাঠ্য বোঝার জন্য গণনামূলক মডেলের ক্ষমতা মূল্যায়ন করে। LAMBADA হল বর্ণনামূলক প্যাসেজের একটি সংকলন যা বৈশিষ্ট্য শেয়ার করে যে মানব বিষয়গুলি তাদের শেষ শব্দটি অনুমান করতে সক্ষম হয় যদি তারা পুরো অনুচ্ছেদে উন্মোচিত হয়, তবে যদি তারা লক্ষ্য শব্দের আগে শেষ বাক্যটি দেখে তবে তা নয়।
অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন
সোর্স কোড :
tfds.datasets.lambada.Builderসংস্করণ :
-
1.0.0(ডিফল্ট): প্রাথমিক প্রকাশ।
-
ডাউনলোড আকার :
319.03 MiBডেটাসেটের আকার :
3.49 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 5,153 |
'train' | ৪,৮৬৯ |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'passage': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| উত্তরণ | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):Noneচিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@inproceedings{paperno-etal-2016-lambada,
title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
author = "Paperno, Denis and
Kruszewski, Germ{\'a}n and
Lazaridou, Angeliki and
Pham, Ngoc Quan and
Bernardi, Raffaella and
Pezzelle, Sandro and
Baroni, Marco and
Boleda, Gemma and
Fern{\'a}ndez, Raquel",
booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
month = aug,
year = "2016",
address = "Berlin, Germany",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P16-1144",
doi = "10.18653/v1/P16-1144",
pages = "1525--1534",
}