- Descrizione :
Il set di dati LAMBADA valuta le capacità dei modelli computazionali per la comprensione del testo mediante un'attività di previsione delle parole. LAMBADA è una raccolta di passaggi narrativi accomunati dalla caratteristica che i soggetti umani sono in grado di indovinare la loro ultima parola se sono esposti all'intero brano, ma non se vedono solo l'ultima frase che precede la parola bersaglio
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://zenodo.org/record/2630551#.X4Xzn5NKjUI
Codice sorgente :
tfds.datasets.lambada.BuilderVersioni :
-
1.0.0(impostazione predefinita): versione iniziale.
-
Dimensione del download :
319.03 MiBDimensione del set di dati :
3.49 MiBAuto-cache ( documentazione ): Sì
Divisioni :
| Diviso | Esempi |
|---|---|
'test' | 5.153 |
'train' | 4.869 |
- Struttura delle caratteristiche :
FeaturesDict({
'passage': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
| Caratteristica | Classe | Forma | Tipo D | Descrizione |
|---|---|---|---|---|
| CaratteristicheDict | ||||
| passaggio | Testo | corda |
Chiavi supervisionate (Vedi
as_superviseddoc ):NoneFigura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@inproceedings{paperno-etal-2016-lambada,
title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
author = "Paperno, Denis and
Kruszewski, Germ{\'a}n and
Lazaridou, Angeliki and
Pham, Ngoc Quan and
Bernardi, Raffaella and
Pezzelle, Sandro and
Baroni, Marco and
Boleda, Gemma and
Fern{\'a}ndez, Raquel",
booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
month = aug,
year = "2016",
address = "Berlin, Germany",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P16-1144",
doi = "10.18653/v1/P16-1144",
pages = "1525--1534",
}