- Deskripsi :
Korpus SNLI (versi 1.0) adalah kumpulan 570k pasangan kalimat bahasa Inggris tulisan manusia yang dilabeli secara manual untuk klasifikasi berimbang dengan label keterisian, kontradiksi, dan netral, mendukung tugas inferensi bahasa alami (NLI), juga dikenal sebagai mengenali keteraturan tekstual (RTE).
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://nlp.stanford.edu/projects/snli/
Kode sumber :
tfds.datasets.snli.BuilderVersi :
-
1.1.0(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
90.17 MiBUkuran dataset :
87.00 MiBDi-cache otomatis ( dokumentasi ): Ya
Perpecahan :
| Membelah | Contoh |
|---|---|
'test' | 10.000 |
'train' | 550.152 |
'validation' | 10.000 |
- Struktur fitur :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| hipotesa | Teks | rangkaian | ||
| label | LabelKelas | int64 | ||
| premis | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):NoneGambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{snli:emnlp2015,
Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
Publisher = {Association for Computational Linguistics},
Title = {A large annotated corpus for learning natural language inference},
Year = {2015}
}