- Descriptif :
L'ensemble de données LAMBADA évalue les capacités des modèles informatiques pour la compréhension de texte au moyen d'une tâche de prédiction de mots. LAMBADA est une collection de passages narratifs partageant la caractéristique que les sujets humains sont capables de deviner leur dernier mot s'ils sont exposés à l'ensemble du passage, mais pas s'ils ne voient que la dernière phrase précédant le mot cible
Documentation complémentaire : Explorer sur Papers With Code
Page d'accueil : https://zenodo.org/record/2630551#.X4Xzn5NKjUI
Code source :
tfds.datasets.lambada.BuilderVersions :
-
1.0.0(par défaut) : version initiale.
-
Taille du téléchargement :
319.03 MiBTaille du jeu de données :
3.49 MiBMise en cache automatique ( documentation ): Oui
Fractionnements :
| Diviser | Exemples |
|---|---|
'test' | 5 153 |
'train' | 4 869 |
- Structure des fonctionnalités :
FeaturesDict({
'passage': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
| Caractéristique | Classer | Forme | Dtype | La description |
|---|---|---|---|---|
| FonctionnalitésDict | ||||
| passage | Texte | chaîne de caractères |
Clés supervisées (Voir
as_superviseddoc ):NoneFigure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{paperno-etal-2016-lambada,
title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
author = "Paperno, Denis and
Kruszewski, Germ{\'a}n and
Lazaridou, Angeliki and
Pham, Ngoc Quan and
Bernardi, Raffaella and
Pezzelle, Sandro and
Baroni, Marco and
Boleda, Gemma and
Fern{\'a}ndez, Raquel",
booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
month = aug,
year = "2016",
address = "Berlin, Germany",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P16-1144",
doi = "10.18653/v1/P16-1144",
pages = "1525--1534",
}