- توضیحات :
مجموعه داده شرح داده شده در مقاله: دستورالعمل های غیر طبیعی: مدل های زبان تنظیم با (تقریباً) بدون کار انسانی (2022). شامل مجموعهای از دستورالعملهای زبان طبیعی، با محدودیتهای اختیاری / فرمولبندیهای مجدد ایجاد شده توسط LLM.
صفحه اصلی : https://github.com/orhonovich/unnatural-instructions
کد منبع :
tfds.text.unnatural_instructions.UnnaturalInstructionsنسخه ها :
-
0.0.1(پیش فرض): انتشار اولیه. دستورالعمل ها / ورودی ها را حذف کنید، زیرا آنها نیاز به پردازش اضافی دارند. Instruction_with_inputs و reformulation ها حاوی دستورالعمل ها و زمینه ها هستند.
-
حجم دانلود :
17.48 MiBحجم مجموعه داده :
154.71 MiBذخیره خودکار ( مستندات ): فقط زمانی که
shuffle_files=False(قطار)تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 66010 |
- ساختار ویژگی :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'instances': Sequence({
'constraints': Text(shape=(), dtype=string),
'input': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
'instruction': Text(shape=(), dtype=string),
'reformulations': Sequence({
'input': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| FeaturesDict | ||||
| شناسه | متن | رشته | به عنوان مثال شناسه منحصر به فرد. | |
| نمونه ها | توالی | |||
| موارد/محدودیت ها | متن | رشته | محدودیت های خاص وظیفه | |
| نمونه ها / ورودی | متن | رشته | ورودی باید برای دستورالعمل داده شده به متغیرهایی وارد شود. | |
| instances/instruction_with_input | متن | رشته | دستورالعملهایی با ورودیهای ارائه شده به جایبانها. | |
| نمونه ها/خروجی ها | متن | رشته | خروجی هدف برای کار داده شده | |
| دستورالعمل | متن | رشته | دستورالعمل با متغیرهایی برای ورودی ها. | |
| فرمول بندی مجدد | توالی | |||
| فرمول بندی مجدد / ورودی | متن | رشته | ورودی باید برای دستورالعمل داده شده به متغیرهایی وارد شود. | |
| فرمول بندی مجدد/دستورالعمل | متن | رشته | دستورالعمل با متغیرهایی برای ورودی ها. | |
| فرمول بندی مجدد/دستورالعمل_با_ورودی | متن | رشته | دستورالعملهایی با ورودیهای ارائه شده به جایبانها. | |
| فرمول بندی مجدد / خروجی | متن | رشته | خروجی هدف برای کار داده شده |
کلیدهای نظارت شده (به
as_superviseddoc مراجعه کنید):Noneشکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@misc{honovich2022unnatural,
title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
url = {https://arxiv.org/abs/2212.09689},
publisher = {arXiv},
year={2022}
}