- Descripción :
El Groove MIDI Dataset (GMD) se compone de 13,6 horas de MIDI alineado y audio (sintetizado) de percusión expresiva interpretada por humanos y alineada con el tempo capturada en un kit de batería electrónica Roland TD-11 V-Drum.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://g.co/magenta/groove-dataset
Código fuente :
tfds.datasets.groove.BuilderVersiones :
-
2.0.1(predeterminado): Sin notas de la versión.
-
Claves supervisadas (Ver
as_superviseddoc ):NoneFigura ( tfds.show_examples ): no compatible.
Cita :
@inproceedings{groove2019,
Author = {Jon Gillick and Adam Roberts and Jesse Engel and Douglas Eck and David Bamman},
Title = {Learning to Groove with Inverse Sequence Transformations},
Booktitle = {International Conference on Machine Learning (ICML)}
Year = {2019},
}
groove/full-midionly (configuración predeterminada)
Descripción de la configuración : conjunto de datos de Groove sin audio, sin dividir.
Tamaño de la descarga :
3.11 MiBTamaño del conjunto de datos :
5.22 MiBAlmacenamiento automático en caché ( documentación ): Sí
Divisiones :
| Separar | Ejemplos |
|---|---|
'test' | 129 |
'train' | 897 |
'validation' | 124 |
- Estructura de características :
FeaturesDict({
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| CaracterísticasDict | ||||
| bpm | Tensor | int32 | ||
| batería | Etiqueta de clase | int64 | ||
| identificación | Tensor | cuerda | ||
| midi | Tensor | cuerda | ||
| estilo | CaracterísticasDict | |||
| estilo/primario | Etiqueta de clase | int64 | ||
| estilo/secundario | Tensor | cuerda | ||
| Signatura de compás | Etiqueta de clase | int64 | ||
| escribe | Etiqueta de clase | int64 |
- Ejemplos ( tfds.as_dataframe ):
surco/completo-16000hz
Descripción de la configuración : conjunto de datos de Groove con audio, sin dividir.
Tamaño de descarga :
4.76 GiBTamaño del conjunto de datos :
2.33 GiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'test' | 124 |
'train' | 846 |
'validation' | 120 |
- Estructura de características :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=float32),
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| CaracterísticasDict | ||||
| audio | Audio | (Ninguna,) | flotar32 | |
| bpm | Tensor | int32 | ||
| batería | Etiqueta de clase | int64 | ||
| identificación | Tensor | cuerda | ||
| midi | Tensor | cuerda | ||
| estilo | CaracterísticasDict | |||
| estilo/primario | Etiqueta de clase | int64 | ||
| estilo/secundario | Tensor | cuerda | ||
| Signatura de compás | Etiqueta de clase | int64 | ||
| escribe | Etiqueta de clase | int64 |
- Ejemplos ( tfds.as_dataframe ):
surco/2bar-midionly
Descripción de la configuración : conjunto de datos de Groove sin audio, dividido en fragmentos de 2 compases.
Tamaño de la descarga :
3.11 MiBTamaño del conjunto de datos :
19.59 MiBAlmacenamiento automático en caché ( documentación ): Sí
Divisiones :
| Separar | Ejemplos |
|---|---|
'test' | 2,204 |
'train' | 18,163 |
'validation' | 2,252 |
- Estructura de características :
FeaturesDict({
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| CaracterísticasDict | ||||
| bpm | Tensor | int32 | ||
| batería | Etiqueta de clase | int64 | ||
| identificación | Tensor | cuerda | ||
| midi | Tensor | cuerda | ||
| estilo | CaracterísticasDict | |||
| estilo/primario | Etiqueta de clase | int64 | ||
| estilo/secundario | Tensor | cuerda | ||
| Signatura de compás | Etiqueta de clase | int64 | ||
| escribe | Etiqueta de clase | int64 |
- Ejemplos ( tfds.as_dataframe ):
ranura/2bar-16000hz
Descripción de la configuración : conjunto de datos de Groove con audio, dividido en fragmentos de 2 compases.
Tamaño de descarga :
4.76 GiBTamaño del conjunto de datos :
4.61 GiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'test' | 1,873 |
'train' | 14,390 |
'validation' | 2,034 |
- Estructura de características :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=float32),
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| CaracterísticasDict | ||||
| audio | Audio | (Ninguna,) | flotar32 | |
| bpm | Tensor | int32 | ||
| batería | Etiqueta de clase | int64 | ||
| identificación | Tensor | cuerda | ||
| midi | Tensor | cuerda | ||
| estilo | CaracterísticasDict | |||
| estilo/primario | Etiqueta de clase | int64 | ||
| estilo/secundario | Tensor | cuerda | ||
| Signatura de compás | Etiqueta de clase | int64 | ||
| escribe | Etiqueta de clase | int64 |
- Ejemplos ( tfds.as_dataframe ):
surco/4bar-midionly
Descripción de la configuración : conjunto de datos de Groove sin audio, dividido en fragmentos de 4 compases.
Tamaño de la descarga :
3.11 MiBTamaño del conjunto de datos :
27.32 MiBAlmacenamiento automático en caché ( documentación ): Sí
Divisiones :
| Separar | Ejemplos |
|---|---|
'test' | 2,033 |
'train' | 17,261 |
'validation' | 2,121 |
- Estructura de características :
FeaturesDict({
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| CaracterísticasDict | ||||
| bpm | Tensor | int32 | ||
| batería | Etiqueta de clase | int64 | ||
| identificación | Tensor | cuerda | ||
| midi | Tensor | cuerda | ||
| estilo | CaracterísticasDict | |||
| estilo/primario | Etiqueta de clase | int64 | ||
| estilo/secundario | Tensor | cuerda | ||
| Signatura de compás | Etiqueta de clase | int64 | ||
| escribe | Etiqueta de clase | int64 |
- Ejemplos ( tfds.as_dataframe ):