- תיאור :
זהו מערך דיבור ברשות הרבים המורכב מ-13,100 קטעי אודיו קצרים של דובר יחיד שקורא קטעים מ-7 ספרי עיון. לכל קליפ מסופק תמלול. אורכם של קליפים נע בין 1 ל-10 שניות ואורך כולל של כ-24 שעות.
הטקסטים פורסמו בין 1884 ל-1964, והם נחלת הכלל. האודיו הוקלט בשנים 2016-17 על ידי פרויקט LibriVox והוא גם ברשות הציבור.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://keithito.com/LJ-Speech-Dataset/
קוד מקור :
tfds.datasets.ljspeech.Builderגרסאות :
-
1.1.1(ברירת מחדל): תקן את סוג נתוני הדיבור באמצעות dtype=tf.int16.
-
גודל הורדה :
2.56 GiBגודל מערך נתונים :
10.73 GiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 13,100 |
- מבנה תכונה :
FeaturesDict({
'id': string,
'speech': Audio(shape=(None,), dtype=int16),
'text': Text(shape=(), dtype=string),
'text_normalized': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| FeaturesDict | ||||
| תְעוּדַת זֶהוּת | מוֹתֵחַ | חוּט | ||
| נְאוּם | שֶׁמַע | (אף אחד,) | int16 | |
| טֶקסט | טֶקסט | חוּט | ||
| text_normalized | טֶקסט | חוּט |
מפתחות בפיקוח (ראה כמסמך
as_supervised):('text_normalized', 'speech')איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@misc{ljspeech17,
author = {Keith Ito},
title = {The LJ Speech Dataset},
howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
year = 2017
}