- توضیحات :
مجموعه داده شامل 1000 آهنگ صوتی هر 30 ثانیه است. این شامل 10 ژانر است که هر کدام با 100 آهنگ نمایش داده می شوند. آهنگ ها همگی فایل های صوتی 16 بیتی مونو با فرکانس 22050 هرتز و با فرمت wav.
ژانرها عبارتند از:
- بلوز
- کلاسیک
- کشور
- دیسکو
- هیپ هاپ
- جاز
- فلز
- ترکیدن
- رگی
سنگ
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : http://marsyas.info/index.html
کد منبع :
tfds.audio.gtzan.GTZANنسخه ها :
-
1.0.0(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
1.14 GiBحجم مجموعه داده :
3.71 GiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 1000 |
- ساختار ویژگی :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| FeaturesDict | ||||
| سمعی | سمعی | (هیچ یک،) | int64 | |
| صدا/نام فایل | متن | رشته | ||
| برچسب | ClassLabel | int64 |
کلیدهای نظارت شده (مشاهده
as_superviseddoc ):('audio', 'label')شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@misc{tzanetakis_essl_cook_2001,
author = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title = "Automatic Musical Genre Classification Of Audio Signals",
url = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year = "2001"
}