- opis :
Zestawy danych do oceny dla tłumaczenia maszynowego o niskich zasobach: nepalsko-angielski i syngalesko-angielski.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://github.com/facebookresearch/flores/
Kod źródłowy :
tfds.translate.FloresWersje :
-
1.2.0(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
1.47 MiBAutomatyczne buforowanie ( dokumentacja ): Tak
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@misc{guzmn2019new,
title={Two New Evaluation Datasets for Low-Resource Machine Translation: Nepali-English and Sinhala-English},
author={Francisco Guzman and Peng-Jen Chen and Myle Ott and Juan Pino and Guillaume Lample and Philipp Koehn and Vishrav Chaudhary and Marc'Aurelio Ranzato},
year={2019},
eprint={1902.01382},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
flores/neen (domyślna konfiguracja)
Opis konfiguracji : zestaw danych translacji z ne na en.
Rozmiar zestawu danych :
1.89 MiBPodziały :
| Rozdzielać | Przykłady |
|---|---|
'test' | 2835 |
'validation' | 2559 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'ne': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| Tłumaczenie | ||||
| en | Tekst | strunowy | ||
| nie | Tekst | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised):('ne', 'en')Przykłady ( tfds.as_dataframe ):
flores/sien
Opis konfiguracji : Translacja zestawu danych z si na en.
Rozmiar zestawu danych :
2.05 MiBPodziały :
| Rozdzielać | Przykłady |
|---|---|
'test' | 2766 |
'validation' | 2898 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'si': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| Tłumaczenie | ||||
| en | Tekst | strunowy | ||
| si | Tekst | strunowy |
Nadzorowane klucze (zobacz
as_superviseddoc ):('si', 'en')Przykłady ( tfds.as_dataframe ):