- توضیحات :
منابع مدل سازی زبان برای استفاده در ارتباط با مجموعه LibriSpeech ASR.
صفحه اصلی : http://www.openslr.org/11
کد منبع :
tfds.datasets.librispeech_lm.Builderنسخه ها :
-
0.1.0(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
1.40 GiBحجم مجموعه داده :
4.62 GiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 40,418,260 |
- ساختار ویژگی :
FeaturesDict({
'text': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| FeaturesDict | ||||
| متن | متن | رشته |
کلیدهای نظارت شده (مشاهده
as_superviseddoc ):('text', 'text')شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@inproceedings{panayotov2015librispeech,
title={Librispeech: an ASR corpus based on public domain audio books},
author={Panayotov, Vassil and Chen, Guoguo and Povey, Daniel and Khudanpur, Sanjeev},
booktitle={Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on},
pages={5206--5210},
year={2015},
organization={IEEE}
}