- Açıklama :
 
Birinin yüksek kaynak ve diğerinin düşük kaynak olduğu benzer dil çiftlerini karşılaştırmak için TED konuşma transkriptlerinden türetilen veri setleri.
Ana Sayfa : https://github.com/neulab/word-embeddings-for-nmt
Kaynak kodu :
tfds.datasets.ted_hrlr_translate.Buildersürümler :
-  
1.0.0(varsayılan): Yeni bölünmüş API ( https://tensorflow.org/datasets/splits ) 
-  
 İndirme boyutu :
124.94 MiBOtomatik önbelleğe alınmış ( belgeleme ): Evet
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@inproceedings{Ye2018WordEmbeddings,
  author  = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
  title   = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
  booktitle = {HLT-NAACL},
  year    = {2018},
  }
ted_hrlr_translate/az_to_en (varsayılan yapılandırma)
Yapılandırma açıklaması : Düz metin olarak az'dan en'e çeviri veri kümesi.
Veri kümesi boyutu :
1.61 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 903 | 
 'train' | 5.946 | 
 'validation' | 671 | 
- Özellik yapısı :
 
Translation({
    'az': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| az | Metin | sicim | ||
| tr | Metin | sicim | 
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):('az', 'en')Örnekler ( tfds.as_dataframe ):
ted_hrlr_translate/aztr_to_en
Yapılandırma açıklaması : Düz metin olarak az_tr'den tr'ye çeviri veri kümesi.
Veri kümesi boyutu :
42.54 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 903 | 
 'train' | 188.396 | 
 'validation' | 671 | 
- Özellik yapısı :
 
Translation({
    'az_tr': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| az_tr | Metin | sicim | ||
| tr | Metin | sicim | 
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):('az_tr', 'en')Örnekler ( tfds.as_dataframe ):
ted_hrlr_translate/be_to_en
Yapılandırma açıklaması : be'den en'e çeviri veri kümesi düz metin olarak.
Veri kümesi boyutu :
1.47 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 664 | 
 'train' | 4.509 | 
 'validation' | 248 | 
- Özellik yapısı :
 
Translation({
    'be': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| olmak | Metin | sicim | ||
| tr | Metin | sicim | 
Denetimli anahtarlar (Bkz.
as_superviseddoc ):('be', 'en')Örnekler ( tfds.as_dataframe ):
ted_hrlr_translate/beru_to_en
Yapılandırma açıklaması : be_ru'dan en'e düz metin olarak çeviri veri kümesi.
Veri kümesi boyutu :
62.45 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 664 | 
 'train' | 212.614 | 
 'validation' | 248 | 
- Özellik yapısı :
 
Translation({
    'be_ru': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| be_ru | Metin | sicim | ||
| tr | Metin | sicim | 
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):('be_ru', 'en')Örnekler ( tfds.as_dataframe ):
ted_hrlr_translate/es_to_pt
Yapılandırma açıklaması : Düz metin olarak es'den pt'ye çeviri veri kümesi.
Veri kümesi boyutu :
9.62 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 1.763 | 
 'train' | 44.938 | 
 'validation' | 1.016 | 
- Özellik yapısı :
 
Translation({
    'es': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| es | Metin | sicim | ||
| nokta | Metin | sicim | 
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):('es', 'pt')Örnekler ( tfds.as_dataframe ):
ted_hrlr_translate/fr_to_pt
Yapılandırma açıklaması : Düz metin olarak fr'den pt'ye çeviri veri kümesi.
Veri kümesi boyutu :
9.74 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 1.494 | 
 'train' | 43.873 | 
 'validation' | 1.131 | 
- Özellik yapısı :
 
Translation({
    'fr': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| fr | Metin | sicim | ||
| nokta | Metin | sicim | 
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):('fr', 'pt')Örnekler ( tfds.as_dataframe ):
ted_hrlr_translate/gl_to_en
Yapılandırma açıklaması : Düz metin olarak gl'den en'e çeviri veri kümesi.
Veri kümesi boyutu :
2.41 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 1.007 | 
 'train' | 10.017 | 
 'validation' | 682 | 
- Özellik yapısı :
 
Translation({
    'en': Text(shape=(), dtype=string),
    'gl': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| tr | Metin | sicim | ||
| gl | Metin | sicim | 
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):('gl', 'en')Örnekler ( tfds.as_dataframe ):
ted_hrlr_translate/glpt_to_en
Yapılandırma açıklaması : Düz metin olarak gl_pt'den tr'ye çeviri veri kümesi.
Veri kümesi boyutu :
12.90 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 1.007 | 
 'train' | 61.802 | 
 'validation' | 682 | 
- Özellik yapısı :
 
Translation({
    'en': Text(shape=(), dtype=string),
    'gl_pt': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| tr | Metin | sicim | ||
| gl_pt | Metin | sicim | 
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):('gl_pt', 'en')Örnekler ( tfds.as_dataframe ):
ted_hrlr_translate/he_to_pt
Yapılandırma açıklaması : He'den pt'ye düz metin olarak çeviri veri kümesi.
Veri kümesi boyutu :
11.71 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 1.623 | 
 'train' | 48.511 | 
 'validation' | 1.145 | 
- Özellik yapısı :
 
Translation({
    'he': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| O | Metin | sicim | ||
| nokta | Metin | sicim | 
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):('he', 'pt')Örnekler ( tfds.as_dataframe ):
ted_hrlr_translate/it_to_pt
Yapılandırma açıklaması : Düz metin olarak ondan pt'ye çeviri veri kümesi.
Veri kümesi boyutu :
9.94 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 1.669 | 
 'train' | 46.259 | 
 'validation' | 1.162 | 
- Özellik yapısı :
 
Translation({
    'it': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| BT | Metin | sicim | ||
| nokta | Metin | sicim | 
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):('it', 'pt')Örnekler ( tfds.as_dataframe ):
ted_hrlr_translate/pt_to_en
Yapılandırma açıklaması : Düz metin olarak pt'den en'e çeviri veri kümesi.
Veri kümesi boyutu :
10.89 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 1.803 | 
 'train' | 51.785 | 
 'validation' | 1.193 | 
- Özellik yapısı :
 
Translation({
    'en': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| tr | Metin | sicim | ||
| nokta | Metin | sicim | 
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):('pt', 'en')Örnekler ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_en
Yapılandırma açıklaması : Düz metin olarak ru'dan en'e çeviri veri kümesi.
Veri kümesi boyutu :
63.22 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 5.476 | 
 'train' | 208.106 | 
 'validation' | 4.805 | 
- Özellik yapısı :
 
Translation({
    'en': Text(shape=(), dtype=string),
    'ru': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| tr | Metin | sicim | ||
| ru | Metin | sicim | 
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):('ru', 'en')Örnekler ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_pt
Yapılandırma açıklaması : Düz metin olarak ru'dan pt'ye çeviri veri kümesi.
Veri kümesi boyutu :
13.00 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 1.588 | 
 'train' | 47.278 | 
 'validation' | 1.184 | 
- Özellik yapısı :
 
Translation({
    'pt': Text(shape=(), dtype=string),
    'ru': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| nokta | Metin | sicim | ||
| ru | Metin | sicim | 
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):('ru', 'pt')Örnekler ( tfds.as_dataframe ):
ted_hrlr_translate/tr_to_en
Yapılandırma açıklaması : Düz metin olarak tr'den en'e çeviri veri kümesi.
Veri kümesi boyutu :
42.33 MiBbölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 5.029 | 
 'train' | 182.450 | 
 'validation' | 4.045 | 
- Özellik yapısı :
 
Translation({
    'en': Text(shape=(), dtype=string),
    'tr': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| tr | Metin | sicim | ||
| tr | Metin | sicim | 
Denetlenen anahtarlar (Bkz.
as_superviseddoc ):('tr', 'en')Örnekler ( tfds.as_dataframe ):