- Deskripsi :
QASC adalah kumpulan data penjawab pertanyaan dengan fokus pada komposisi kalimat. Ini terdiri dari 9.980 pertanyaan pilihan ganda 8 arah tentang sains sekolah dasar (8.134 kereta, 926 dev, 920 tes), dan dilengkapi dengan kumpulan 17 juta kalimat.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://allenai.org/data/qasc
Kode sumber :
tfds.datasets.qasc.BuilderVersi :
-
0.1.0(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
1.54 MiBUkuran dataset :
6.61 MiBDi-cache otomatis ( dokumentasi ): Ya
Perpecahan :
| Membelah | Contoh |
|---|---|
'test' | 920 |
'train' | 8.134 |
'validation' | 926 |
- Struktur fitur :
FeaturesDict({
'answerKey': Text(shape=(), dtype=string),
'choices': Sequence({
'label': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
}),
'combinedfact': Text(shape=(), dtype=string),
'fact1': Text(shape=(), dtype=string),
'fact2': Text(shape=(), dtype=string),
'formatted_question': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| kunci jawaban | Teks | rangkaian | ||
| pilihan | Urutan | |||
| pilihan/label | Teks | rangkaian | ||
| pilihan/teks | Teks | rangkaian | ||
| fakta gabungan | Teks | rangkaian | ||
| fakta1 | Teks | rangkaian | ||
| fakta2 | Teks | rangkaian | ||
| formatted_question | Teks | rangkaian | ||
| Indo | Teks | rangkaian | ||
| pertanyaan | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):NoneGambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@article{allenai:qasc,
author = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
title = {QASC: A Dataset for Question Answering via Sentence Composition},
journal = {arXiv:1910.11473v2},
year = {2020},
}