- תיאור :
מערך שמע בחינם של ספרות מדוברות. תחשוב על MNIST לאודיו.
מערך נתונים פשוט של שמע/דיבור המורכב מהקלטות של ספרות מדוברות בקבצי WAV בתדר 8kHz. ההקלטות גזוזות כך שתהיה להן שקט כמעט מינימלי בהתחלה ובסוף.
5 רמקולים
2,500 הקלטות (50 מכל ספרה לכל רמקול)
הגיות באנגלית
הקבצים נקראים בפורמט הבא: {digitLabel} {speakerName} {index}.wav
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://github.com/Jakobovski/free-spoken-digit-dataset
קוד מקור :
tfds.datasets.spoken_digit.Builderגרסאות :
-
1.0.9(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
11.42 MiBגודל מערך נתונים :
45.68 MiBשמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 2,500 |
- מבנה תכונה :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| FeaturesDict | ||||
| שֶׁמַע | שֶׁמַע | (אף אחד,) | int64 | |
| אודיו/שם קובץ | טֶקסט | חוּט | ||
| תווית | ClassLabel | int64 |
מפתחות בפיקוח (ראה
as_superviseddoc ):('audio', 'label')איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@ONLINE {Free Spoken Digit Dataset,
author = "Zohar Jackson",
title = "Spoken_Digit",
year = "2016",
url = "https://github.com/Jakobovski/free-spoken-digit-dataset"
}