- คำอธิบาย :
ชุดข้อมูลความเท่าเทียมกันของคำตอบประกอบด้วยการให้คะแนนโดยมนุษย์ในการคาดคะเนแบบจำลองจากแบบจำลองต่างๆ ในชุดข้อมูล SQuAD การให้คะแนนกำหนดว่าคำตอบที่คาดคะเนนั้น 'เทียบเท่า' กับคำตอบทองคำหรือไม่ (พิจารณาทั้งคำถามและบริบท)
โดยเฉพาะอย่างยิ่ง โดยคำว่า 'เทียบเท่า' เราหมายความว่าคำตอบที่คาดคะเนมีข้อมูลอย่างน้อยเหมือนกับคำตอบทองคำ และไม่เพิ่มข้อมูลที่ไม่จำเป็น ชุดข้อมูลประกอบด้วยคำอธิบายประกอบสำหรับ: * การคาดคะเนจาก BiDAF บน SQuAD dev * การคาดคะเนจาก XLNet บน SQuAD dev * การคาดคะเนจาก Luke บน SQuAD dev * การคาดคะเนจาก Albert ในการฝึกอบรม SQuAD ผู้พัฒนา และตัวอย่างการทดสอบ
- หน้าแรก : https://github.com/google-research-datasets/answer-equivalence-dataset 
- ซอร์สโค้ด : - tfds.datasets.answer_equivalence.Builder
- รุ่น : -  1.0.0(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
 
-  
- ขนาดการดาวน์โหลด : - 45.86 MiB
- ขนาดชุดข้อมูล : - 47.24 MiB
- แคชอัตโนมัติ ( เอกสาร ): ใช่ 
- แยก : 
| แยก | ตัวอย่าง | 
|---|---|
| 'ae_dev' | 4,446 | 
| 'ae_test' | 9,724 | 
| 'dev_bidaf' | 7,522 | 
| 'dev_luke' | 4,590 | 
| 'dev_xlnet' | 7,932 | 
| 'train' | 9,090 | 
- โครงสร้างคุณลักษณะ :
FeaturesDict({
    'candidate': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'gold_index': int32,
    'qid': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
    'question_1': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_2': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_3': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'question_4': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'reference': Text(shape=(), dtype=string),
    'score': float32,
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย | 
|---|---|---|---|---|
| คุณสมบัติDict | ||||
| ผู้สมัคร | ข้อความ | สตริง | ||
| บริบท | ข้อความ | สตริง | ||
| gold_index | เทนเซอร์ | int32 | ||
| คิด | ข้อความ | สตริง | ||
| คำถาม | ข้อความ | สตริง | ||
| คำถามที่ 1 | ป้ายกำกับคลาส | int64 | ||
| คำถามที่ 2 | ป้ายกำกับคลาส | int64 | ||
| คำถามที่ 3 | ป้ายกำกับคลาส | int64 | ||
| คำถามที่ 4 | ป้ายกำกับคลาส | int64 | ||
| อ้างอิง | ข้อความ | สตริง | ||
| คะแนน | เทนเซอร์ | ลอย32 | 
- คีย์ภายใต้การดูแล (ดู - as_superviseddoc ):- None
- รูปภาพ ( tfds.show_examples ): ไม่รองรับ 
- ตัวอย่าง ( tfds.as_dataframe ): 
- การอ้างอิง :
@article{bulian-etal-2022-tomayto,
      title={Tomayto, Tomahto. Beyond Token-level Answer Equivalence for Question Answering Evaluation},
      author={Jannis Bulian and Christian Buck and Wojciech Gajewski and Benjamin Boerschinger and Tal Schuster},
      year={2022},
      eprint={2202.07654},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}