- Deskripsi :
Kumpulan data berasal dari transkrip pembicaraan TED untuk membandingkan pasangan bahasa yang serupa di mana yang satu memiliki sumber daya yang tinggi dan yang lainnya memiliki sumber daya yang rendah.
Kode sumber :
tfds.datasets.ted_hrlr_translate.BuilderVersi :
-
1.0.0(default): API split baru ( https://tensorflow.org/datasets/splits )
-
Ukuran unduhan :
124.94 MiBDi-cache otomatis ( dokumentasi ): Ya
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@inproceedings{Ye2018WordEmbeddings,
author = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
title = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
booktitle = {HLT-NAACL},
year = {2018},
}
ted_hrlr_translate/az_to_en (konfigurasi default)
Deskripsi konfigurasi : Terjemahan dataset dari az ke en dalam teks biasa.
Ukuran dataset :
1.61 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 903 |
'train' | 5.946 |
'validation' | 671 |
- Struktur fitur :
Translation({
'az': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| az | Teks | rangkaian | ||
| en | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('az', 'en')Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/aztr_to_en
Deskripsi konfigurasi : Terjemahan dataset dari az_tr ke en dalam teks biasa.
Ukuran dataset :
42.54 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 903 |
'train' | 188.396 |
'validation' | 671 |
- Struktur fitur :
Translation({
'az_tr': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| az_tr | Teks | rangkaian | ||
| en | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('az_tr', 'en')Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/be_to_en
Deskripsi konfigurasi : Terjemahan dataset dari be ke en dalam teks biasa.
Ukuran dataset :
1.47 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 664 |
'train' | 4.509 |
'validation' | 248 |
- Struktur fitur :
Translation({
'be': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| menjadi | Teks | rangkaian | ||
| en | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('be', 'en')Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/beru_to_en
Deskripsi konfigurasi : Terjemahan dataset dari be_ru ke en dalam teks biasa.
Ukuran dataset :
62.45 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 664 |
'train' | 212.614 |
'validation' | 248 |
- Struktur fitur :
Translation({
'be_ru': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| be_ru | Teks | rangkaian | ||
| en | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('be_ru', 'en')Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/es_to_pt
Deskripsi konfigurasi : Terjemahan dataset dari es ke pt dalam teks biasa.
Ukuran dataset :
9.62 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 1.763 |
'train' | 44.938 |
'validation' | 1.016 |
- Struktur fitur :
Translation({
'es': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| es | Teks | rangkaian | ||
| pt | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('es', 'pt')Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/fr_to_pt
Deskripsi konfigurasi : Terjemahan dataset dari fr ke pt dalam teks biasa.
Ukuran dataset :
9.74 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 1.494 |
'train' | 43.873 |
'validation' | 1.131 |
- Struktur fitur :
Translation({
'fr': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| fr | Teks | rangkaian | ||
| pt | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('fr', 'pt')Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/gl_to_en
Deskripsi konfigurasi : Terjemahan dataset dari gl ke en dalam teks biasa.
Ukuran dataset :
2.41 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 1.007 |
'train' | 10.017 |
'validation' | 682 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'gl': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| gl | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('gl', 'en')Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/glpt_to_en
Deskripsi konfigurasi : Terjemahan dataset dari gl_pt ke en dalam teks biasa.
Ukuran dataset :
12.90 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 1.007 |
'train' | 61.802 |
'validation' | 682 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'gl_pt': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| gl_pt | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('gl_pt', 'en')Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/he_to_pt
Deskripsi konfigurasi : Terjemahan dataset dari he ke pt dalam teks biasa.
Ukuran dataset :
11.71 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 1.623 |
'train' | 48.511 |
'validation' | 1.145 |
- Struktur fitur :
Translation({
'he': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| Dia | Teks | rangkaian | ||
| pt | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('he', 'pt')Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/it_to_pt
Deskripsi konfigurasi : Terjemahan dataset dari itu ke pt dalam teks biasa.
Ukuran dataset :
9.94 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 1.669 |
'train' | 46.259 |
'validation' | 1.162 |
- Struktur fitur :
Translation({
'it': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| dia | Teks | rangkaian | ||
| pt | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('it', 'pt')Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/pt_to_en
Deskripsi konfigurasi : Terjemahan dataset dari pt ke en dalam teks biasa.
Ukuran dataset :
10.89 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 1.803 |
'train' | 51.785 |
'validation' | 1.193 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| pt | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('pt', 'en')Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_en
Deskripsi konfigurasi : Terjemahan dataset dari ru ke en dalam teks biasa.
Ukuran dataset :
63.22 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 5.476 |
'train' | 208.106 |
'validation' | 4.805 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| ru | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('ru', 'en')Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_pt
Deskripsi konfigurasi : Terjemahan dataset dari ru ke pt dalam teks biasa.
Ukuran dataset :
13.00 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 1.588 |
'train' | 47.278 |
'validation' | 1.184 |
- Struktur fitur :
Translation({
'pt': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| pt | Teks | rangkaian | ||
| ru | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('ru', 'pt')Contoh ( tfds.as_dataframe ):
ted_hrlr_translate/tr_to_en
Deskripsi konfigurasi : Terjemahan dataset dari tr ke en dalam teks biasa.
Ukuran dataset :
42.33 MiBPerpecahan :
| Membelah | Contoh |
|---|---|
'test' | 5.029 |
'train' | 182.450 |
'validation' | 4.045 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| tr | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('tr', 'en')Contoh ( tfds.as_dataframe ):