- توضیحات :
databricks-dolly-15k یک مجموعه داده منبع باز از سوابق پیروی از دستورالعمل است که در آموزش databricks/dolly-v2-12b استفاده می شود که توسط هزاران کارمند Databricks در چندین دسته رفتاری که در مقاله InstructGPT ذکر شده است، از جمله طوفان فکری، طبقه بندی، تولید شده است. QA بسته، تولید، استخراج اطلاعات، QA باز و خلاصه سازی.
این مجموعه داده را می توان برای هر هدفی، اعم از دانشگاهی یا تجاری، تحت شرایط Creative Commons Attribution-ShareAlike 3.0 Unported License استفاده کرد.
صفحه اصلی : https://github.com/databrickslabs/dolly
کد منبع :
tfds.datasets.databricks_dolly.Builderنسخه ها :
-
1.0.0(پیش فرض): انتشار اولیه.
-
حجم دانلود :
12.60 MiBحجم مجموعه داده :
12.69 MiBذخیره خودکار ( اسناد ): بله
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 15,014 |
- ساختار ویژگی :
FeaturesDict({
'category': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'response': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| FeaturesDict | ||||
| دسته بندی | متن | رشته | ||
| متن نوشته | متن | رشته | ||
| دستورالعمل | متن | رشته | ||
| واکنش | متن | رشته |
کلیدهای نظارت شده (به
as_superviseddoc مراجعه کنید):Noneشکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :