- 説明:
databricks-dolly-15k databricks/dolly-v2-12bのトレーニングで使用される指示に従う記録のオープンソース データセットです。このデータセットは、ブレーンストーミング、分類、クローズド QA、生成、情報抽出、オープン QA、および要約。
このデータセットは、クリエイティブ コモンズ 表示-継承 3.0 非移植ライセンスの条件に基づいて、学術的または商業的であるかを問わず、あらゆる目的に使用できます。
バージョン:
-
1.0.0(デフォルト): 初期リリース。
-
ダウンロードサイズ:
12.60 MiBデータセットのサイズ:
12.69 MiB自動キャッシュ(ドキュメント): はい
分割:
| スプリット | 例 |
|---|---|
'train' | 15,014 |
- 機能の構造:
FeaturesDict({
'category': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'response': Text(shape=(), dtype=string),
})
- 機能ドキュメント:
| 特徴 | クラス | 形 | Dタイプ | 説明 |
|---|---|---|---|---|
| 特徴辞書 | ||||
| カテゴリー | 文章 | 弦 | ||
| コンテクスト | 文章 | 弦 | ||
| 命令 | 文章 | 弦 | ||
| 応答 | 文章 | 弦 |
監視キー(
as_superviseddocを参照):None図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用: