- คำอธิบาย :
databricks-dolly-15k เป็นชุดข้อมูลโอเพ่นซอร์สของบันทึกการปฏิบัติตามคำสั่งที่ใช้ในการฝึกอบรม databricks/dolly-v2-12b ที่สร้างขึ้นโดยพนักงาน Databricks หลายพันคนในหมวดหมู่พฤติกรรมหลายประเภทที่ระบุไว้ในรายงาน InstructGPT รวมถึงการระดมความคิด การจำแนกประเภท QA แบบปิด การสร้าง การดึงข้อมูล QA แบบเปิด และการสรุป
ชุดข้อมูลนี้สามารถใช้เพื่อวัตถุประสงค์ใดก็ได้ ไม่ว่าจะเป็นเชิงวิชาการหรือเชิงพาณิชย์ ภายใต้เงื่อนไขของ Creative Commons Attribution-ShareAlike 3.0 Unported License
หน้าแรก : https://github.com/databrickslabs/dolly
ซอร์สโค้ด :
tfds.datasets.databricks_dolly.Builderรุ่น :
-
1.0.0(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
ขนาดดาวน์โหลด :
12.60 MiBขนาดชุดข้อมูล :
12.69 MiBแคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 15,014 |
- โครงสร้างคุณสมบัติ :
FeaturesDict({
'category': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'response': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| คุณสมบัติ | ระดับ | รูปร่าง | ประเภทD | คำอธิบาย |
|---|---|---|---|---|
| คุณสมบัติDict | ||||
| หมวดหมู่ | ข้อความ | เชือก | ||
| บริบท | ข้อความ | เชือก | ||
| คำแนะนำ | ข้อความ | เชือก | ||
| การตอบสนอง | ข้อความ | เชือก |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):Noneรูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :