- Descriptif :
MLQA (Multilingual Question Answering Dataset) est un ensemble de données de référence pour évaluer les performances de réponse aux questions multilingues. Le jeu de données se compose de 7 langues : arabe, allemand, espagnol, anglais, hindi, vietnamien, chinois.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://github.com/facebookresearch/MLQA
Code source :
tfds.datasets.mlqa.BuilderVersions :
-
1.0.0(par défaut) : aucune note de version.
-
Taille du téléchargement :
72.21 MiBMise en cache automatique ( documentation ): Oui
Structure des fonctionnalités :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
| Fonctionnalité | Classe | Forme | Dtype | Description |
|---|---|---|---|---|
| FonctionnalitésDict | ||||
| réponses | Séquence | |||
| réponses/answer_start | Tenseur | int32 | ||
| réponses/texte | Texte | chaîne | ||
| contexte | Texte | chaîne | ||
| identifiant | Tenseur | chaîne | ||
| question | Texte | chaîne | ||
| titre | Texte | chaîne |
Clés supervisées (Voir
as_superviseddoc ):NoneFigure ( tfds.show_examples ) : non pris en charge.
Citation :
@article{lewis2019mlqa,
title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel, Sebastian and Schwenk, Holger},
journal={arXiv preprint arXiv:1910.07475},
year={2019}
}
mlqa/ar (configuration par défaut)
Description de la configuration : MLQA 'ar' dev et test splits.
Taille du jeu de données :
9.28 MiBFractionnements :
| Diviser | Exemples |
|---|---|
'test' | 5 335 |
'validation' | 517 |
- Exemples ( tfds.as_dataframe ):
mlqa/de
Description de la configuration : MLQA 'de' dev et test splits.
Taille du jeu de données :
5.06 MiBFractionnements :
| Diviser | Exemples |
|---|---|
'test' | 4 517 |
'validation' | 512 |
- Exemples ( tfds.as_dataframe ):
mlqa/fr
Description de la configuration : MLQA 'en' dev et test splits.
Taille du jeu de données :
15.72 MiBFractionnements :
| Diviser | Exemples |
|---|---|
'test' | 11 590 |
'validation' | 1 148 |
- Exemples ( tfds.as_dataframe ):
mlqa/es
Description de la configuration : MLQA 'es' dev et test splits.
Taille du jeu de données :
5.09 MiBFractionnements :
| Diviser | Exemples |
|---|---|
'test' | 5 253 |
'validation' | 500 |
- Exemples ( tfds.as_dataframe ):
mlqa/salut
Description de la configuration : MLQA 'hi' dev et test splits.
Taille du jeu de données :
12.83 MiBFractionnements :
| Diviser | Exemples |
|---|---|
'test' | 4 918 |
'validation' | 507 |
- Exemples ( tfds.as_dataframe ):
mlqa/vi
Description de la configuration : MLQA 'vi' dev et test splits.
Taille du jeu de données :
8.77 MiBFractionnements :
| Diviser | Exemples |
|---|---|
'test' | 5 495 |
'validation' | 511 |
- Exemples ( tfds.as_dataframe ):
mlqa/zh
Description de la configuration : MLQA 'zh' dev et test splits.
Taille du jeu de données :
5.13 MiBFractionnements :
| Diviser | Exemples |
|---|---|
'test' | 5 137 |
'validation' | 504 |
- Exemples ( tfds.as_dataframe ):