- Descriptif :
Cet ensemble de données contient des traductions automatiques de MNLI dans chacune des langues XNLI. Les données de traduction sont fournies par XTREME. Notez que cela est différent des données traduites par machine fournies par le papier XNLI d'origine.
Page d' accueil : https://www.nyu.edu/projects/bowman/xnli/
Code source :
tfds.text.xtreme_xnli.XtremeXnliVersions :
-
1.1.0(par défaut) : aucune note de version.
-
Taille du téléchargement :
2.31 GiBTaille du jeu de données :
1.59 GiBMise en cache automatique ( documentation ): Non
Fractionnements :
| Diviser | Exemples |
|---|---|
'train' | 392 570 |
- Structure des fonctionnalités :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=string),
'translation': Text(shape=(), dtype=string),
}),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=string),
'bg': Text(shape=(), dtype=string),
'de': Text(shape=(), dtype=string),
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
'hi': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
'sw': Text(shape=(), dtype=string),
'th': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
'ur': Text(shape=(), dtype=string),
'vi': Text(shape=(), dtype=string),
'zh': Text(shape=(), dtype=string),
}),
})
- Documentation des fonctionnalités :
| Caractéristique | Classer | Forme | Dtype | La description |
|---|---|---|---|---|
| FonctionnalitésDict | ||||
| hypothèse | TraductionVariableLanguages | |||
| hypothèse/langage | Texte | chaîne de caractères | ||
| hypothèse/traduction | Texte | chaîne de caractères | ||
| étiquette | Étiquette de classe | int64 | ||
| prémisse | Traduction | |||
| prémisse / ar | Texte | chaîne de caractères | ||
| prémisse/bg | Texte | chaîne de caractères | ||
| prémisse/de | Texte | chaîne de caractères | ||
| prémisse / el | Texte | chaîne de caractères | ||
| prémisse/fr | Texte | chaîne de caractères | ||
| prémisse(s) | Texte | chaîne de caractères | ||
| prémisse/en | Texte | chaîne de caractères | ||
| prémisse/salut | Texte | chaîne de caractères | ||
| prémisse/ru | Texte | chaîne de caractères | ||
| prémisse/sw | Texte | chaîne de caractères | ||
| prémisse/th | Texte | chaîne de caractères | ||
| prémisse/tr | Texte | chaîne de caractères | ||
| prémisse / votre | Texte | chaîne de caractères | ||
| prémisse/vi | Texte | chaîne de caractères | ||
| prémisse/zh | Texte | chaîne de caractères |
Clés supervisées (Voir
as_superviseddoc ):NoneFigure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}