- opis :
Zbiór danych LAMBADA ocenia możliwości modeli obliczeniowych do rozumienia tekstu za pomocą zadania przewidywania słów. LAMBADA jest zbiorem narracyjnych fragmentów, których wspólną cechą jest to, że osoby badane są w stanie odgadnąć swoje ostatnie słowo, jeśli są wystawione na cały fragment, ale nie, jeśli widzą tylko ostatnie zdanie poprzedzające słowo docelowe
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem
Strona główna : https://zenodo.org/record/2630551#.X4Xzn5NKjUI
Kod źródłowy :
tfds.datasets.lambada.BuilderWersje :
-
1.0.0(domyślnie): Wersja początkowa.
-
Rozmiar pliku do pobrania :
319.03 MiBRozmiar zestawu danych :
3.49 MiBAutomatyczne buforowanie ( dokumentacja ): Tak
Podziały :
| Rozdzielać | Przykłady |
|---|---|
'test' | 5153 |
'train' | 4869 |
- Struktura funkcji :
FeaturesDict({
'passage': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| przejście | Tekst | strunowy |
Klucze nadzorowane (Zobacz dokument
as_supervised):NoneRysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@inproceedings{paperno-etal-2016-lambada,
title = "The {LAMBADA} dataset: Word prediction requiring a broad discourse context",
author = "Paperno, Denis and
Kruszewski, Germ{\'a}n and
Lazaridou, Angeliki and
Pham, Ngoc Quan and
Bernardi, Raffaella and
Pezzelle, Sandro and
Baroni, Marco and
Boleda, Gemma and
Fern{\'a}ndez, Raquel",
booktitle = "Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
month = aug,
year = "2016",
address = "Berlin, Germany",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P16-1144",
doi = "10.18653/v1/P16-1144",
pages = "1525--1534",
}