- תיאור :
MLQA (Multilingual Question Answering Dataset) הוא מערך נתונים בהשוואה להערכת ביצועי מענה לשאלות רב-לשוניות. מערך הנתונים מורכב מ-7 שפות: ערבית, גרמנית, ספרדית, אנגלית, הינדית, וייטנאמית, סינית.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://github.com/facebookresearch/MLQA
קוד מקור :
tfds.datasets.mlqa.Builderגרסאות :
-
1.0.0(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
72.21 MiBשמור אוטומטי במטמון ( תיעוד ): כן
מבנה תכונה :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| FeaturesDict | ||||
| תשובות | סדר פעולות | |||
| answers/answer_start | מוֹתֵחַ | int32 | ||
| תשובות/טקסט | טֶקסט | חוּט | ||
| הֶקשֵׁר | טֶקסט | חוּט | ||
| תְעוּדַת זֶהוּת | מוֹתֵחַ | חוּט | ||
| שְׁאֵלָה | טֶקסט | חוּט | ||
| כותרת | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):Noneאיור ( tfds.show_examples ): לא נתמך.
ציטוט :
@article{lewis2019mlqa,
title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel, Sebastian and Schwenk, Holger},
journal={arXiv preprint arXiv:1910.07475},
year={2019}
}
mlqa/ar (תצורת ברירת המחדל)
תיאור תצורה : MLQA 'ar' dev and test splits.
גודל מערך נתונים :
9.28 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 5,335 |
'validation' | 517 |
- דוגמאות ( tfds.as_dataframe ):
mlqa/de
תיאור תצורה : MLQA 'de' dev and test splits.
גודל מערך נתונים :
5.06 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 4,517 |
'validation' | 512 |
- דוגמאות ( tfds.as_dataframe ):
mlqa/en
תיאור תצורה : MLQA 'en' dev and test splits.
גודל ערכת נתונים :
15.72 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 11,590 |
'validation' | 1,148 |
- דוגמאות ( tfds.as_dataframe ):
mlqa/es
תיאור תצורה : MLQA 'es' dev and test splits.
גודל מערך נתונים :
5.09 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 5,253 |
'validation' | 500 |
- דוגמאות ( tfds.as_dataframe ):
mlqa/hi
תיאור תצורה : MLQA 'hi' dev and test splits.
גודל ערכת נתונים:
12.83 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 4,918 |
'validation' | 507 |
- דוגמאות ( tfds.as_dataframe ):
mlqa/vi
תיאור תצורה : MLQA 'vi' dev and test splits.
גודל מערך נתונים :
8.77 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 5,495 |
'validation' | 511 |
- דוגמאות ( tfds.as_dataframe ):
mlqa/zh
תיאור תצורה : MLQA 'zh' dev and test splits.
גודל מערך נתונים :
5.13 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 5,137 |
'validation' | 504 |
- דוגמאות ( tfds.as_dataframe ):