- คำอธิบาย :
ชุดข้อมูล Bot Adversarial Dialogue
ชุดข้อมูลการสนทนาที่มีป้ายกำกับว่ามีความไม่เหมาะสมจากงาน Bot Adversarial Dialogue บทสนทนาถูกรวบรวมโดยการขอให้มนุษย์พูดคุยกับบอทในทางตรงข้าม
รายละเอียดเพิ่มเติมใน กระดาษ
หน้าแรก : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
ซอร์สโค้ด :
tfds.datasets.bot_adversarial_dialogue.Builderรุ่น :
-
1.0.0(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
แคชอัตโนมัติ ( เอกสาร ): ใช่
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):Noneรูปภาพ ( tfds.show_examples ): ไม่รองรับ
การอ้างอิง :
@misc{xu2021recipes,
title={Recipes for Safety in Open-domain Chatbots},
author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
year={2021},
eprint={2010.07079},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
bot_adversarial_dialogue/dialogue_datasets (การกำหนดค่าเริ่มต้น)
คำอธิบายการกำหนดค่า : ชุดข้อมูลบทสนทนา แบ่งออกเป็นแบบฝึก การตรวจสอบ และการแยกการทดสอบ
ขนาดดาวน์โหลด :
3.06 MiBขนาดชุดข้อมูล :
23.38 MiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'test' | 2,598 |
'train' | 69,274 |
'valid' | 7,002 |
- โครงสร้างคุณสมบัติ :
FeaturesDict({
'bot_persona': Sequence(Text(shape=(), dtype=string)),
'dialogue_id': float32,
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'round_id': float32,
'speaker_to_eval': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| คุณสมบัติ | ระดับ | รูปร่าง | ประเภทD | คำอธิบาย |
|---|---|---|---|---|
| คุณสมบัติDict | ||||
| bot_persona | ลำดับ(ข้อความ) | (ไม่มี,) | เชือก | บุคคลที่แอบอ้างโดยบอท |
| บทสนทนา_id | เทนเซอร์ | ลอย32 | ||
| ตอน_เสร็จแล้ว | เทนเซอร์ | บูล | ||
| รหัส | ข้อความ | เชือก | รหัสของตัวอย่าง | |
| ฉลาก | ClassLabel | int64 | ||
| รอบ_id | เทนเซอร์ | ลอย32 | ||
| Speaker_to_eval | ข้อความ | เชือก | ผู้พูดของคำพูดที่มีป้ายกำกับ | |
| ข้อความ | ข้อความ | เชือก | คำพูดที่จะจำแนก |
- ตัวอย่าง ( tfds.as_dataframe ):
bot_adversarial_dialogue/human_nonadv_safety_eval
คำอธิบายการกำหนดค่า : ชุดการประเมินความปลอดภัยของมนุษย์ซึ่งประเมินโดยพนักงานที่รวบรวมมวลชนสำหรับการโจมตี
ขนาดดาวน์โหลด :
10.57 KiBขนาดชุดข้อมูล :
34.55 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'test' | 180 |
- โครงสร้างคุณสมบัติ :
FeaturesDict({
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'text': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| คุณสมบัติ | ระดับ | รูปร่าง | ประเภทD | คำอธิบาย |
|---|---|---|---|---|
| คุณสมบัติDict | ||||
| ตอน_เสร็จแล้ว | เทนเซอร์ | บูล | ||
| รหัส | ข้อความ | เชือก | รหัสของตัวอย่าง | |
| ฉลาก | ClassLabel | int64 | ||
| ข้อความ | ข้อความ | เชือก | คำพูดที่จะจำแนก |
- ตัวอย่าง ( tfds.as_dataframe ):