- คำอธิบาย :
QASC เป็นชุดข้อมูลตอบคำถามโดยเน้นที่องค์ประกอบประโยค ประกอบด้วยคำถามแบบปรนัย 8 ทาง 9,980 ข้อเกี่ยวกับวิทยาศาสตร์ระดับประถมศึกษา (8,134 รถไฟ, 926 dev, 920 การทดสอบ) และมาพร้อมกับคลังข้อมูล 17 ล้านประโยค
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
โฮมเพจ : https://allenai.org/data/qasc
รหัสที่มา :
tfds.datasets.qasc.Builderรุ่น :
-
0.1.0(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดการดาวน์โหลด :
1.54 MiBขนาดชุดข้อมูล :
6.61 MiBแคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'test' | 920 |
'train' | 8,134 |
'validation' | 926 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'answerKey': Text(shape=(), dtype=string),
'choices': Sequence({
'label': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
}),
'combinedfact': Text(shape=(), dtype=string),
'fact1': Text(shape=(), dtype=string),
'fact2': Text(shape=(), dtype=string),
'formatted_question': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| คุณสมบัติDict | ||||
| คีย์คำตอบ | ข้อความ | สตริง | ||
| ทางเลือก | ลำดับ | |||
| ตัวเลือก/ฉลาก | ข้อความ | สตริง | ||
| ตัวเลือก/ข้อความ | ข้อความ | สตริง | ||
| รวมข้อเท็จจริง | ข้อความ | สตริง | ||
| ข้อเท็จจริง1 | ข้อความ | สตริง | ||
| ข้อเท็จจริง2 | ข้อความ | สตริง | ||
| รูปแบบคำถาม | ข้อความ | สตริง | ||
| รหัส | ข้อความ | สตริง | ||
| คำถาม | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):Noneรูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@article{allenai:qasc,
author = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
title = {QASC: A Dataset for Question Answering via Sentence Composition},
journal = {arXiv:1910.11473v2},
year = {2020},
}