- คำอธิบาย :
นี่คือชุดข้อมูลคำพูดที่เป็นสาธารณสมบัติซึ่งประกอบด้วยคลิปเสียงสั้นๆ 13,100 คลิปของข้อความอ่านโดยผู้พูดคนเดียวจากหนังสือสารคดี 7 เล่ม มีการถอดความสำหรับแต่ละคลิป คลิปมีความยาวตั้งแต่ 1 ถึง 10 วินาที และมีความยาวรวมประมาณ 24 ชั่วโมง
ข้อความถูกตีพิมพ์ระหว่างปี พ.ศ. 2427 ถึง พ.ศ. 2507 และเป็นสาธารณสมบัติ เสียงถูกบันทึกในปี 2559-2560 โดยโครงการ LibriVox และเป็นสาธารณสมบัติด้วย
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
หน้าแรก : https://keithito.com/LJ-Speech-Dataset/
รหัสที่มา :
tfds.datasets.ljspeech.Builderรุ่น :
-
1.1.1(ค่าเริ่มต้น): แก้ไขประเภทข้อมูลคำพูดด้วย dtype=tf.int16
-
ขนาดการดาวน์โหลด :
2.56 GiBขนาดชุดข้อมูล :
10.73 GiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 13,100 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'id': string,
'speech': Audio(shape=(None,), dtype=int16),
'text': Text(shape=(), dtype=string),
'text_normalized': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| คุณสมบัติDict | ||||
| รหัส | เทนเซอร์ | สตริง | ||
| คำพูด | เครื่องเสียง | (ไม่มี,) | int16 | |
| ข้อความ | ข้อความ | สตริง | ||
| text_normalized | ข้อความ | สตริง |
คีย์ควบคุม (ดู
as_superviseddoc ):('text_normalized', 'speech')รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@misc{ljspeech17,
author = {Keith Ito},
title = {The LJ Speech Dataset},
howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
year = 2017
}