- คำอธิบาย :
ชุดข้อมูลใหม่ของคำถามวิทยาศาสตร์แบบปรนัยระดับประถมศึกษาของแท้ 7,787 ข้อ รวบรวมเพื่อสนับสนุนการวิจัยในการตอบคำถามขั้นสูง ชุดข้อมูลถูกแบ่งออกเป็น Challenge Set และ Easy Set โดยที่ชุดแรกมีเพียงคำถามที่ตอบผิดโดยทั้งอัลกอริทึมที่ใช้การดึงข้อมูลและอัลกอริธึมการเกิดร่วมกันของคำ นอกจากนี้ เรายังรวมคลังข้อมูลประโยควิทยาศาสตร์กว่า 14 ล้านประโยคที่เกี่ยวข้องกับงาน และการนำโมเดลพื้นฐานทางประสาทสามแบบมาใช้สำหรับชุดข้อมูลนี้ เรากำหนดให้ ARC เป็นความท้าทายต่อชุมชน
เมื่อเปรียบเทียบกับชุดข้อมูลดั้งเดิม สิ่งนี้จะเพิ่มประโยคบริบทที่ได้รับจากการดึงข้อมูลในลักษณะเดียวกับ UnifiedQA (ดู: https://arxiv.org/abs/2005.00700 )
- เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส 
- โฮมเพจ : https://allenai.org/data/arc 
- รหัสแหล่งที่มา : - tfds.datasets.ai2_arc_with_ir.Builder
- รุ่น : -  1.0.0(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
 
-  
- ขนาดการดาวน์โหลด : - 3.68 MiB
- แคชอัตโนมัติ ( เอกสาร ): ใช่ 
- โครงสร้างคุณลักษณะ : 
FeaturesDict({
    'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=5),
    'choices': Sequence({
        'label': ClassLabel(shape=(), dtype=int64, num_classes=5),
        'text': Text(shape=(), dtype=string),
    }),
    'id': Text(shape=(), dtype=string),
    'paragraph': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย | 
|---|---|---|---|---|
| คุณสมบัติDict | ||||
| คีย์คำตอบ | ป้ายกำกับคลาส | int64 | ||
| ทางเลือก | ลำดับ | |||
| ตัวเลือก/ฉลาก | ป้ายกำกับคลาส | int64 | ||
| ตัวเลือก/ข้อความ | ข้อความ | สตริง | ||
| รหัส | ข้อความ | สตริง | ||
| ย่อหน้า | ข้อความ | สตริง | ||
| คำถาม | ข้อความ | สตริง | 
- คีย์ภายใต้การดูแล (ดู - as_superviseddoc ):- None
- รูปภาพ ( tfds.show_examples ): ไม่รองรับ 
- การอ้างอิง : 
@article{allenai:arc,
      author    = {Peter Clark  and Isaac Cowhey and Oren Etzioni and Tushar Khot and
                    Ashish Sabharwal and Carissa Schoenick and Oyvind Tafjord},
      title     = {Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge},
      journal   = {arXiv:1803.05457v1},
      year      = {2018},
}
@article{2020unifiedqa,
    title={UnifiedQA: Crossing Format Boundaries With a Single QA System},
    author={D. Khashabi and S. Min and T. Khot and A. Sabhwaral and O. Tafjord and P. Clark and H. Hajishirzi},
    journal={arXiv preprint},
    year={2020}
}
ai2_arc_with_ir/ARC-Challenge-IR (ค่าเริ่มต้น)
- คำอธิบาย การกำหนดค่า : Challenge Set of 2590 คำถาม "ยาก" (ผู้ที่ทั้งวิธีดึงข้อมูลและวิธีที่เกิดขึ้นร่วมกันไม่สามารถตอบได้อย่างถูกต้อง) 
- ขนาดชุดข้อมูล : - 3.76 MiB
- แยก : 
| แยก | ตัวอย่าง | 
|---|---|
| 'test' | 1,172 | 
| 'train' | 1,119 | 
| 'validation' | 299 | 
- ตัวอย่าง ( tfds.as_dataframe ):
ai2_arc_with_ir/ARC-Easy-IR
- คำอธิบาย การกำหนดค่า: ชุดคำถาม 5197 ข้ออย่างง่ายสำหรับ ARC Challenge 
- ขนาดชุดข้อมูล : - 7.49 MiB
- แยก : 
| แยก | ตัวอย่าง | 
|---|---|
| 'test' | 2,376 | 
| 'train' | 2,251 | 
| 'validation' | 570 | 
- ตัวอย่าง ( tfds.as_dataframe ):