- Описание :
MLQA (набор данных для ответов на многоязычные вопросы) — это эталонный набор данных для оценки эффективности ответов на многоязычные вопросы. Набор данных состоит из 7 языков: арабский, немецкий, испанский, английский, хинди, вьетнамский, китайский.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://github.com/facebookresearch/MLQA
Исходный код :
tfds.datasets.mlqa.BuilderВерсии :
-
1.0.0(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
72.21 MiBАвтоматическое кэширование ( документация ): Да
Структура функции :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| ОсобенностиDict | ||||
| ответы | Последовательность | |||
| ответы/answer_start | Тензор | int32 | ||
| ответы/текст | Текст | нить | ||
| контекст | Текст | нить | ||
| идентификатор | Тензор | нить | ||
| вопрос | Текст | нить | ||
| заголовок | Текст | нить |
Ключи под наблюдением (см . документ
as_supervised):NoneРисунок ( tfds.show_examples ): не поддерживается.
Цитата :
@article{lewis2019mlqa,
title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel, Sebastian and Schwenk, Holger},
journal={arXiv preprint arXiv:1910.07475},
year={2019}
}
mlqa/ar (конфигурация по умолчанию)
Описание конфигурации : MLQA 'ar' для разработчиков и тестов.
Размер набора данных :
9.28 MiB.Сплиты :
| Расколоть | Примеры |
|---|---|
'test' | 5335 |
'validation' | 517 |
- Примеры ( tfds.as_dataframe ):
млка/де
Описание конфигурации : MLQA 'de' dev и test разделены.
Размер набора данных :
5.06 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 4517 |
'validation' | 512 |
- Примеры ( tfds.as_dataframe ):
mlqa/ru
Описание конфигурации : MLQA 'en' dev и test разделены.
Размер набора данных :
15.72 MiB.Сплиты :
| Расколоть | Примеры |
|---|---|
'test' | 11 590 |
'validation' | 1148 |
- Примеры ( tfds.as_dataframe ):
mlqa/es
Описание конфигурации : MLQA 'es' dev и test разделены.
Размер набора данных :
5.09 MiB.Сплиты :
| Расколоть | Примеры |
|---|---|
'test' | 5253 |
'validation' | 500 |
- Примеры ( tfds.as_dataframe ):
млка/привет
Описание конфигурации : MLQA 'hi' dev и test разделены.
Размер набора данных :
12.83 MiB.Сплиты :
| Расколоть | Примеры |
|---|---|
'test' | 4918 |
'validation' | 507 |
- Примеры ( tfds.as_dataframe ):
млка/ви
Описание конфигурации : MLQA 'vi' dev и test разделены.
Размер набора данных :
8.77 MiB.Сплиты :
| Расколоть | Примеры |
|---|---|
'test' | 5495 |
'validation' | 511 |
- Примеры ( tfds.as_dataframe ):
млкв/ч
Описание конфигурации : MLQA 'zh' dev и test разделены.
Размер набора данных :
5.13 MiBСплиты :
| Расколоть | Примеры |
|---|---|
'test' | 5137 |
'validation' | 504 |
- Примеры ( tfds.as_dataframe ):