- বর্ণনা :
MLQA (Multilingual Question Answering Dataset) হল বহুভাষিক প্রশ্নের উত্তরের কার্যকারিতা মূল্যায়নের জন্য একটি বেঞ্চমার্ক ডেটাসেট। ডেটাসেটটি 7টি ভাষা নিয়ে গঠিত: আরবি, জার্মান, স্প্যানিশ, ইংরেজি, হিন্দি, ভিয়েতনামী, চীনা।
অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন
সোর্স কোড :
tfds.datasets.mlqa.Builderসংস্করণ :
-
1.0.0(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড সাইজ :
72.21 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বৈশিষ্ট্য গঠন :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| উত্তর | ক্রম | |||
| উত্তর/উত্তর_শুরু | টেনসর | int32 | ||
| উত্তর/পাঠ্য | পাঠ্য | স্ট্রিং | ||
| প্রসঙ্গ | পাঠ্য | স্ট্রিং | ||
| আইডি | টেনসর | স্ট্রিং | ||
| প্রশ্ন | পাঠ্য | স্ট্রিং | ||
| শিরোনাম | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):Noneচিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@article{lewis2019mlqa,
title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel, Sebastian and Schwenk, Holger},
journal={arXiv preprint arXiv:1910.07475},
year={2019}
}
mlqa/ar (ডিফল্ট কনফিগারেশন)
কনফিগারেশনের বিবরণ : MLQA 'ar' ডেভ এবং টেস্ট স্প্লিট।
ডেটাসেটের আকার :
9.28 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | ৫,৩৩৫ |
'validation' | 517 |
- উদাহরণ ( tfds.as_dataframe ):
mlqa/de
কনফিগারেশনের বিবরণ : MLQA 'de' ডেভ এবং টেস্ট স্প্লিট।
ডেটাসেটের আকার :
5.06 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 4,517 |
'validation' | 512 |
- উদাহরণ ( tfds.as_dataframe ):
mlqa/en
কনফিগারেশনের বিবরণ : MLQA 'en' ডেভ এবং টেস্ট স্প্লিট।
ডেটাসেটের আকার :
15.72 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 11,590 |
'validation' | 1,148 |
- উদাহরণ ( tfds.as_dataframe ):
mlqa/es
কনফিগারেশনের বিবরণ : MLQA 'es' ডেভ এবং টেস্ট স্প্লিট।
ডেটাসেটের আকার :
5.09 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 5,253 |
'validation' | 500 |
- উদাহরণ ( tfds.as_dataframe ):
mlqa/hi
কনফিগারেশনের বিবরণ : MLQA 'হাই' ডেভ এবং টেস্ট স্প্লিট।
ডেটাসেটের আকার :
12.83 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 4,918 |
'validation' | 507 |
- উদাহরণ ( tfds.as_dataframe ):
mlqa/vi
কনফিগারেশনের বিবরণ : MLQA 'vi' ডেভ এবং টেস্ট স্প্লিট।
ডেটাসেটের আকার :
8.77 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | ৫,৪৯৫ |
'validation' | 511 |
- উদাহরণ ( tfds.as_dataframe ):
mlqa/zh
কনফিগারেশনের বিবরণ : MLQA 'zh' ডেভ এবং টেস্ট স্প্লিট।
ডেটাসেটের আকার :
5.13 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 5,137 |
'validation' | 504 |
- উদাহরণ ( tfds.as_dataframe ):