- Deskripsi :
Dataset Kesetaraan Jawaban berisi peringkat manusia pada prediksi model dari beberapa model pada dataset SQuAD. Peringkat menentukan apakah jawaban yang diprediksi 'setara' dengan jawaban emas (dengan mempertimbangkan pertanyaan dan konteks).
Lebih khusus lagi, dengan 'setara' kami maksudkan bahwa jawaban yang diprediksi berisi setidaknya informasi yang sama dengan jawaban emas dan tidak menambahkan informasi yang berlebihan. Kumpulan data berisi anotasi untuk: * prediksi dari BiDAF di SQuAD dev * prediksi dari XLNet di SQuAD dev * prediksi dari Luke di SQuAD dev * prediksi dari Albert pada contoh pelatihan, pengembangan, dan pengujian SQuAD
Beranda : https://github.com/google-research-datasets/answer-equivalence-dataset
Kode sumber :
tfds.datasets.answer_equivalence.BuilderVersi :
-
1.0.0(default): Rilis awal.
-
Ukuran unduhan :
45.86 MiBUkuran dataset :
47.24 MiBDi-cache otomatis ( dokumentasi ): Ya
Perpecahan :
| Membelah | Contoh |
|---|---|
'ae_dev' | 4.446 |
'ae_test' | 9.724 |
'dev_bidaf' | 7.522 |
'dev_luke' | 4.590 |
'dev_xlnet' | 7.932 |
'train' | 9.090 |
- Struktur fitur :
FeaturesDict({
'candidate': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'gold_index': int32,
'qid': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'question_1': ClassLabel(shape=(), dtype=int64, num_classes=3),
'question_2': ClassLabel(shape=(), dtype=int64, num_classes=3),
'question_3': ClassLabel(shape=(), dtype=int64, num_classes=3),
'question_4': ClassLabel(shape=(), dtype=int64, num_classes=3),
'reference': Text(shape=(), dtype=string),
'score': float32,
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| calon | Teks | rangkaian | ||
| konteks | Teks | rangkaian | ||
| indeks_emas | Tensor | int32 | ||
| qid | Teks | rangkaian | ||
| pertanyaan | Teks | rangkaian | ||
| pertanyaan 1 | LabelKelas | int64 | ||
| pertanyaan_2 | LabelKelas | int64 | ||
| pertanyaan_3 | LabelKelas | int64 | ||
| pertanyaan_4 | LabelKelas | int64 | ||
| referensi | Teks | rangkaian | ||
| skor | Tensor | float32 |
Kunci yang diawasi (Lihat
as_superviseddoc ):NoneGambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@article{bulian-etal-2022-tomayto,
title={Tomayto, Tomahto. Beyond Token-level Answer Equivalence for Question Answering Evaluation},
author={Jannis Bulian and Christian Buck and Wojciech Gajewski and Benjamin Boerschinger and Tal Schuster},
year={2022},
eprint={2202.07654},
archivePrefix={arXiv},
primaryClass={cs.CL}
}