- Deskripsi :
Kumpulan data ini berisi terjemahan mesin MNLI ke dalam setiap bahasa XNLI. Data terjemahan disediakan oleh XTREME. Perhatikan bahwa ini berbeda dari data terjemahan mesin yang disediakan oleh kertas XNLI asli.
Kode sumber :
tfds.text.xtreme_xnli.XtremeXnliVersi :
-
1.1.0(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
2.31 GiBUkuran dataset :
1.59 GiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 392.570 |
- Struktur fitur :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=string),
'translation': Text(shape=(), dtype=string),
}),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=string),
'bg': Text(shape=(), dtype=string),
'de': Text(shape=(), dtype=string),
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
'hi': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
'sw': Text(shape=(), dtype=string),
'th': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
'ur': Text(shape=(), dtype=string),
'vi': Text(shape=(), dtype=string),
'zh': Text(shape=(), dtype=string),
}),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| hipotesa | Terjemahan VariabelBahasa | |||
| hipotesis/bahasa | Teks | rangkaian | ||
| hipotesis/terjemahan | Teks | rangkaian | ||
| label | LabelKelas | int64 | ||
| premis | Terjemahan | |||
| premis/ar | Teks | rangkaian | ||
| premis/bg | Teks | rangkaian | ||
| premis/de | Teks | rangkaian | ||
| premis/el | Teks | rangkaian | ||
| premis/en | Teks | rangkaian | ||
| premis | Teks | rangkaian | ||
| premis/fr | Teks | rangkaian | ||
| premis / hai | Teks | rangkaian | ||
| premis/ru | Teks | rangkaian | ||
| premis / sw | Teks | rangkaian | ||
| premis/th | Teks | rangkaian | ||
| premis/tr | Teks | rangkaian | ||
| premis/ur | Teks | rangkaian | ||
| premis/vi | Teks | rangkaian | ||
| premis/zh | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):NoneGambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}