- বর্ণনা :
BoolQ হল 15942টি উদাহরণ সম্বলিত হ্যাঁ/না প্রশ্নের জন্য একটি প্রশ্নের উত্তর দেওয়ার ডেটাসেট। এই প্রশ্নগুলি স্বাভাবিকভাবেই ঘটছে, এগুলি অপ্রস্তুত এবং অনিয়ন্ত্রিত সেটিংসে তৈরি হয়।
প্রতিটি উদাহরণ হল ঐচ্ছিক অতিরিক্ত প্রসঙ্গ হিসাবে পৃষ্ঠার শিরোনাম সহ (প্রশ্ন, উত্তরণ, উত্তর) এর একটি ট্রিপলেট। পাঠ্য-জোড়া শ্রেণীবিভাগ সেটআপ বিদ্যমান প্রাকৃতিক ভাষা অনুমান কার্যের অনুরূপ।
অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন
হোমপেজ : https://github.com/google-research-datasets/boolean-questions
সোর্স কোড :
tfds.datasets.bool_q.Builderসংস্করণ :
-
1.0.0(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড সাইজ :
8.36 MiBডেটাসেটের আকার :
8.51 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 9,427 |
'validation' | 3,270 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'answer': bool,
'passage': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| উত্তর | টেনসর | bool | ||
| উত্তরণ | পাঠ্য | স্ট্রিং | ||
| প্রশ্ন | পাঠ্য | স্ট্রিং | ||
| শিরোনাম | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):Noneচিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@inproceedings{clark2019boolq,
title = {BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions},
author = {Clark, Christopher and Lee, Kenton and Chang, Ming-Wei, and Kwiatkowski, Tom and Collins, Michael, and Toutanova, Kristina},
booktitle = {NAACL},
year = {2019},
}