- 説明:
Groove MIDI データセット (GMD) は、Roland TD-11 V-Drum 電子ドラム キットでキャプチャされた人間が演奏し、テンポを合わせた表現力豊かなドラミングの 13.6 時間の整列された MIDI と (合成された) オーディオで構成されています。
追加のドキュメント:コードを使用したペーパーの探索
ソース コード:
tfds.datasets.groove.Builderバージョン:
-
2.0.1(デフォルト): リリース ノートはありません。
-
監視されたキー(
as_superviseddocを参照):None図( tfds.show_examples ): サポートされていません。
引用:
@inproceedings{groove2019,
Author = {Jon Gillick and Adam Roberts and Jesse Engel and Douglas Eck and David Bamman},
Title = {Learning to Groove with Inverse Sequence Transformations},
Booktitle = {International Conference on Machine Learning (ICML)}
Year = {2019},
}
グルーブ/フル ミディオンリー (デフォルト設定)
構成の説明: オーディオなし、分割されていないグルーブ データセット。
ダウンロードサイズ:
3.11 MiBデータセットサイズ:
5.22 MiB自動キャッシュ(ドキュメント): はい
スプリット:
| スプリット | 例 |
|---|---|
'test' | 129 |
'train' | 897 |
'validation' | 124 |
- 機能構造:
FeaturesDict({
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- 機能のドキュメント:
| 特徴 | クラス | 形 | Dtype | 説明 |
|---|---|---|---|---|
| 特徴辞書 | ||||
| bpm | テンソル | int32 | ||
| ドラマー | クラスラベル | int64 | ||
| ID | テンソル | ストリング | ||
| ミディ | テンソル | ストリング | ||
| スタイル | 特徴辞書 | |||
| スタイル/プライマリ | クラスラベル | int64 | ||
| スタイル/セカンダリ | テンソル | ストリング | ||
| time_signature | クラスラベル | int64 | ||
| タイプ | クラスラベル | int64 |
- 例( tfds.as_dataframe ):
グルーブ/フル-16000hz
構成の説明: オーディオ付き、分割されていないグルーブ データセット。
ダウンロードサイズ:
4.76 GiBデータセットサイズ:
2.33 GiB自動キャッシュ(ドキュメント): いいえ
スプリット:
| スプリット | 例 |
|---|---|
'test' | 124 |
'train' | 846 |
'validation' | 120 |
- 機能構造:
FeaturesDict({
'audio': Audio(shape=(None,), dtype=float32),
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- 機能のドキュメント:
| 特徴 | クラス | 形 | Dtype | 説明 |
|---|---|---|---|---|
| 特徴辞書 | ||||
| オーディオ | オーディオ | (なし、) | float32 | |
| bpm | テンソル | int32 | ||
| ドラマー | クラスラベル | int64 | ||
| ID | テンソル | ストリング | ||
| ミディ | テンソル | ストリング | ||
| スタイル | 特徴辞書 | |||
| スタイル/プライマリ | クラスラベル | int64 | ||
| スタイル/セカンダリ | テンソル | ストリング | ||
| time_signature | クラスラベル | int64 | ||
| タイプ | クラスラベル | int64 |
- 例( tfds.as_dataframe ):
グルーブ/2bar-ミディアムリー
構成の説明: 2 小節のチャンクに分割された、オーディオのないグルーブ データセット。
ダウンロードサイズ:
3.11 MiBデータセットのサイズ:
19.59 MiB自動キャッシュ(ドキュメント): はい
スプリット:
| スプリット | 例 |
|---|---|
'test' | 2,204 |
'train' | 18,163 |
'validation' | 2,252 |
- 機能構造:
FeaturesDict({
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- 機能のドキュメント:
| 特徴 | クラス | 形 | Dtype | 説明 |
|---|---|---|---|---|
| 特徴辞書 | ||||
| bpm | テンソル | int32 | ||
| ドラマー | クラスラベル | int64 | ||
| ID | テンソル | ストリング | ||
| ミディ | テンソル | ストリング | ||
| スタイル | 特徴辞書 | |||
| スタイル/プライマリ | クラスラベル | int64 | ||
| スタイル/セカンダリ | テンソル | ストリング | ||
| time_signature | クラスラベル | int64 | ||
| タイプ | クラスラベル | int64 |
- 例( tfds.as_dataframe ):
グルーブ/2bar-16000hz
構成の説明: 2 小節のチャンクに分割された、オーディオを含むグルーブ データセット。
ダウンロードサイズ:
4.76 GiBデータセットサイズ:
4.61 GiB自動キャッシュ(ドキュメント): いいえ
スプリット:
| スプリット | 例 |
|---|---|
'test' | 1,873 |
'train' | 14,390 |
'validation' | 2,034 |
- 機能構造:
FeaturesDict({
'audio': Audio(shape=(None,), dtype=float32),
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- 機能のドキュメント:
| 特徴 | クラス | 形 | Dtype | 説明 |
|---|---|---|---|---|
| 特徴辞書 | ||||
| オーディオ | オーディオ | (なし、) | float32 | |
| bpm | テンソル | int32 | ||
| ドラマー | クラスラベル | int64 | ||
| ID | テンソル | ストリング | ||
| ミディ | テンソル | ストリング | ||
| スタイル | 特徴辞書 | |||
| スタイル/プライマリ | クラスラベル | int64 | ||
| スタイル/セカンダリ | テンソル | ストリング | ||
| time_signature | クラスラベル | int64 | ||
| タイプ | クラスラベル | int64 |
- 例( tfds.as_dataframe ):
グルーブ/4bar-ミディアムリー
構成の説明: 4 小節のチャンクに分割された、オーディオのないグルーブ データセット。
ダウンロードサイズ:
3.11 MiBデータセットサイズ:
27.32 MiB自動キャッシュ(ドキュメント): はい
スプリット:
| スプリット | 例 |
|---|---|
'test' | 2,033 |
'train' | 17,261 |
'validation' | 2,121 |
- 機能構造:
FeaturesDict({
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- 機能のドキュメント:
| 特徴 | クラス | 形 | Dtype | 説明 |
|---|---|---|---|---|
| 特徴辞書 | ||||
| bpm | テンソル | int32 | ||
| ドラマー | クラスラベル | int64 | ||
| ID | テンソル | ストリング | ||
| ミディ | テンソル | ストリング | ||
| スタイル | 特徴辞書 | |||
| スタイル/プライマリ | クラスラベル | int64 | ||
| スタイル/セカンダリ | テンソル | ストリング | ||
| time_signature | クラスラベル | int64 | ||
| タイプ | クラスラベル | int64 |
- 例( tfds.as_dataframe ):