- Deskripsi :
MC-TACO adalah kumpulan data dari 13k pasangan pertanyaan-jawaban yang membutuhkan pemahaman akal sehat temporal. Dataset berisi lima properti temporal:
- durasi (berapa lama waktu yang dibutuhkan suatu acara)
- pemesanan temporal (urutan khas peristiwa)
- waktu yang khas (ketika suatu peristiwa terjadi)
- frekuensi (seberapa sering suatu peristiwa terjadi)
- stasioneritas (apakah suatu keadaan dipertahankan untuk waktu yang sangat lama atau tanpa batas waktu)
Kami berharap kumpulan data ini dapat mempromosikan eksplorasi masa depan dari kelas masalah penalaran khusus ini.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://github.com/CogComp/MCTACO
Kode sumber :
tfds.datasets.mctaco.BuilderVersi :
-
1.0.0(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
2.27 MiBUkuran dataset :
3.18 MiBDi-cache otomatis ( dokumentasi ): Ya
Perpecahan :
| Membelah | Contoh |
|---|---|
'test' | 9.442 |
'validation' | 3.783 |
- Struktur fitur :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'question': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| menjawab | Teks | rangkaian | ||
| kategori | LabelKelas | int64 | ||
| label | LabelKelas | int64 | ||
| pertanyaan | Teks | rangkaian | ||
| kalimat | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):NoneGambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{ZKNR19,
author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
booktitle = {EMNLP},
year = {2019},
}