- Deskripsi :
Eraser Multi RC adalah kumpulan data untuk kueri melalui bagian multi-baris, bersama dengan jawaban dan alasan. Setiap contoh dalam kumpulan data ini memiliki 5 bagian berikut
- Bagian Mutli-line 2. Permintaan tentang bagian 3. Jawaban untuk pertanyaan
- A Klasifikasi jawaban benar atau salah 5. Penjelasan yang membenarkan klasifikasi
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://cogcomp.seas.upenn.edu/multirc/
Kode sumber :
tfds.text.EraserMultiRcVersi :
-
0.1.1(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
1.59 MiBUkuran dataset :
62.59 MiBDi-cache otomatis ( dokumentasi ): Ya
Perpecahan :
| Membelah | Contoh |
|---|---|
'test' | 4.848 |
'train' | 24.029 |
'validation' | 3.214 |
- Struktur fitur :
FeaturesDict({
'evidences': Sequence(Text(shape=(), dtype=string)),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'passage': Text(shape=(), dtype=string),
'query_and_answer': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| bukti | Urutan (Teks) | (Tidak ada,) | rangkaian | |
| label | LabelKelas | int64 | ||
| jalan | Teks | rangkaian | ||
| query_and_answer | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):NoneGambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@unpublished{eraser2019,
title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
booktitle = {NAACL},
year = {2018}
}