- คำอธิบาย :
WikiDialog เป็นชุดข้อมูลขนาดใหญ่ของการสนทนาเพื่อแสวงหาข้อมูลที่สร้างขึ้นโดยสังเคราะห์ แต่ละบทสนทนาในชุดข้อมูลมีผู้พูดสองคนซึ่งมีพื้นฐานมาจากข้อความจากวิกิพีเดียภาษาอังกฤษ: คำพูดของผู้พูดคนหนึ่งประกอบด้วยประโยคที่แน่นอนจากข้อความ; ลำโพงอีกตัวถูกสร้างขึ้นโดยโมเดลภาษาขนาดใหญ่
คำอธิบาย การกำหนดค่า: WikiDialog สร้างขึ้นจากไดอะล็อก inpainter ที่ปรับแต่งบน OR-QuAC และ QReCC
OQย่อมาจาก OR-QuAC และ QReCCหน้าแรก : https://github.com/google-research/dialog-inpainting#wikidialog-oq
รหัสแหล่งที่มา :
tfds.text.wiki_dialog.WikiDialogรุ่น :
-
1.0.0(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
ขนาดการดาวน์โหลด :
7.04 GiBขนาดชุดข้อมูล :
36.58 GiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 11,264,129 |
'validation' | 113,822 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'author_num': Sequence(int32),
'passage': Text(shape=(), dtype=string),
'pid': Text(shape=(), dtype=string),
'sentences': Sequence(Text(shape=(), dtype=string)),
'title': Text(shape=(), dtype=string),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| คุณสมบัติDict | ||||
| ผู้เขียน_num | ลำดับ (เทนเซอร์) | (ไม่มี,) | int32 | |
| ทางเดิน | ข้อความ | สตริง | ||
| ปิด | ข้อความ | สตริง | ||
| ประโยค | ลำดับ (ข้อความ) | (ไม่มี,) | สตริง | |
| ชื่อ | ข้อความ | สตริง | ||
| คำพูด | ลำดับ (ข้อความ) | (ไม่มี,) | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):Noneรูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@inproceedings{dai2022dialoginpainting,
title={Dialog Inpainting: Turning Documents to Dialogs},
author={Dai, Zhuyun and Chaganty, Arun Tejasvi and Zhao, Vincent and Amini, Aida and Green, Mike and Rashid, Qazi and Guu, Kelvin},
booktitle={International Conference on Machine Learning (ICML)},
year={2022},
organization={PMLR}
}