- Описание :
databricks-dolly-15k — это набор данных с открытым исходным кодом, содержащий записи следования инструкциям, используемые при обучении databricks/dolly-v2-12b, который был создан тысячами сотрудников Databricks в нескольких поведенческих категориях, изложенных в документе InstructGPT , включая мозговой штурм, классификацию, закрытый контроль качества, генерация, извлечение информации, открытый контроль качества и обобщение.
Этот набор данных можно использовать для любых целей, академических или коммерческих, в соответствии с условиями непортированной лицензии Creative Commons Attribution-ShareAlike 3.0 .
Домашняя страница : https://github.com/databrickslabs/dolly .
Исходный код :
tfds.datasets.databricks_dolly.Builder.Версии :
-
1.0.0(по умолчанию): первоначальный выпуск.
-
Размер загрузки :
12.60 MiBРазмер набора данных :
12.69 MiBАвтокэширование ( документация ): Да
Расколы :
| Расколоть | Примеры |
|---|---|
'train' | 15 014 |
- Структура функции :
FeaturesDict({
'category': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'response': Text(shape=(), dtype=string),
})
- Функциональная документация :
| Особенность | Сорт | Форма | Дтип | Описание |
|---|---|---|---|---|
| ВозможностиDict | ||||
| категория | Текст | нить | ||
| контекст | Текст | нить | ||
| инструкция | Текст | нить | ||
| ответ | Текст | нить |
Контролируемые ключи (см. документ
as_supervised):NoneРисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :