- Deskripsi :
Dataset berisi pasangan tabel-pertanyaan, dan jawaban masing-masing. Pertanyaan membutuhkan penalaran multi-langkah dan berbagai operasi data seperti perbandingan, agregasi, dan perhitungan aritmatika. Tabel dipilih secara acak di antara tabel Wikipedia dengan setidaknya 8 baris dan 5 kolom.
(Sesuai catatan penggunaan dokumentasi)
Dev: Rata-rata akurasi lebih dari tiga (bukan lima) pembagian data pelatihan. Dengan kata lain, latih pada 'split-{1,2,3}-train' dan uji pada 'split-{1,2,3}-dev', masing-masing, lalu rata-ratakan akurasinya.
Tes: Latih di 'kereta' dan uji di 'tes'.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://ppasupat.github.io/WikiTableQuestions/#usage-notes
Kode sumber :
tfds.structured.wiki_table_questions.WikiTableQuestionsVersi :
-
1.0.0(default): Rilis awal.
-
Ukuran unduhan :
65.36 MiBUkuran dataset :
237.24 MiBDi-cache otomatis ( dokumentasi ): Ya
Perpecahan :
| Membelah | Contoh |
|---|---|
'split-1-dev' | 2.810 |
'split-1-train' | 11.321 |
'split-2-dev' | 2.838 |
'split-2-train' | 11.312 |
'split-3-dev' | 2.838 |
'split-3-train' | 11.311 |
'test' | 4.344 |
'train' | 14.149 |
- Struktur fitur :
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| Masukkan teks | fiturDict | |||
| masukan_teks/konteks | Tensor | rangkaian | ||
| masukan_teks/tabel | Urutan | |||
| input_text/table/column_header | Tensor | rangkaian | ||
| input_teks/tabel/konten | Tensor | rangkaian | ||
| input_teks/tabel/nomor_baris | Tensor | int16 | ||
| target_text | Tensor | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('input_text', 'target_text')Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{pasupat-liang-2015-compositional,
title = "Compositional Semantic Parsing on Semi-Structured Tables",
author = "Pasupat, Panupong and
Liang, Percy",
booktitle = "Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
month = jul,
year = "2015",
address = "Beijing, China",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/P15-1142",
doi = "10.3115/v1/P15-1142",
pages = "1470--1480",
}