- תיאור :
מערכי נתונים שנגזרו מתמלולי דיבור ב-TED להשוואת צמדי שפות דומים כאשר אחד מהם הוא משאב גבוה והשני הוא משאב נמוך.
קוד מקור :
tfds.datasets.ted_hrlr_translate.Builderגרסאות :
-
1.0.0(ברירת מחדל): API חדש מפוצל ( https://tensorflow.org/datasets/splits )
-
גודל הורדה :
124.94 MiBשמור אוטומטי במטמון ( תיעוד ): כן
איור ( tfds.show_examples ): לא נתמך.
ציטוט :
@inproceedings{Ye2018WordEmbeddings,
author = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
title = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
booktitle = {HLT-NAACL},
year = {2018},
}
ted_hrlr_translate/az_to_en (תצורת ברירת המחדל)
תיאור תצורה : מערך נתונים של תרגום מ-az ל-en בטקסט רגיל.
גודל ערכת נתונים :
1.61 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 903 |
'train' | 5,946 |
'validation' | 671 |
- מבנה תכונה :
Translation({
'az': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| az | טֶקסט | חוּט | ||
| he | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('az', 'en')דוגמאות ( tfds.as_dataframe ):
ted_hrlr_translate/aztr_to_en
תיאור תצורה : מערך נתונים של תרגום מ-az_tr ל-en בטקסט רגיל.
גודל ערכת נתונים:
42.54 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 903 |
'train' | 188,396 |
'validation' | 671 |
- מבנה תכונה :
Translation({
'az_tr': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| az_tr | טֶקסט | חוּט | ||
| he | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('az_tr', 'en')דוגמאות ( tfds.as_dataframe ):
ted_hrlr_translate/be_to_en
תיאור תצורה : מערך נתונים של תרגום מ-be ל-en בטקסט רגיל.
גודל מערך נתונים :
1.47 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 664 |
'train' | 4,509 |
'validation' | 248 |
- מבנה תכונה :
Translation({
'be': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| לִהיוֹת | טֶקסט | חוּט | ||
| he | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('be', 'en')דוגמאות ( tfds.as_dataframe ):
ted_hrlr_translate/beru_to_en
תיאור תצורה : מערך נתונים של תרגום מ-be_ru ל-en בטקסט רגיל.
גודל ערכת נתונים:
62.45 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 664 |
'train' | 212,614 |
'validation' | 248 |
- מבנה תכונה :
Translation({
'be_ru': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| be_ru | טֶקסט | חוּט | ||
| he | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('be_ru', 'en')דוגמאות ( tfds.as_dataframe ):
ted_hrlr_translate/es_to_pt
תיאור תצורה : מערך נתונים של תרגום מ-es ל-pt בטקסט רגיל.
גודל ערכת נתונים :
9.62 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 1,763 |
'train' | 44,938 |
'validation' | 1,016 |
- מבנה תכונה :
Translation({
'es': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| es | טֶקסט | חוּט | ||
| pt | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('es', 'pt')דוגמאות ( tfds.as_dataframe ):
ted_hrlr_translate/fr_to_pt
תיאור תצורה : מערך נתונים של תרגום מ-fr ל-pt בטקסט רגיל.
גודל ערכת נתונים :
9.74 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 1,494 |
'train' | 43,873 |
'validation' | 1,131 |
- מבנה תכונה :
Translation({
'fr': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| fr | טֶקסט | חוּט | ||
| pt | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('fr', 'pt')דוגמאות ( tfds.as_dataframe ):
ted_hrlr_translate/gl_to_en
תיאור תצורה : מערך נתונים של תרגום מ-gl ל-en בטקסט רגיל.
גודל ערכת נתונים :
2.41 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 1,007 |
'train' | 10,017 |
'validation' | 682 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'gl': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| gl | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('gl', 'en')דוגמאות ( tfds.as_dataframe ):
ted_hrlr_translate/glpt_to_en
תיאור תצורה : מערך נתונים של תרגום מ-gl_pt ל-en בטקסט רגיל.
גודל ערכת נתונים :
12.90 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 1,007 |
'train' | 61,802 |
'validation' | 682 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'gl_pt': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| gl_pt | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('gl_pt', 'en')דוגמאות ( tfds.as_dataframe ):
ted_hrlr_translate/he_to_pt
תיאור תצורה : תרגום מערך נתונים מ-he ל-pt בטקסט רגיל.
גודל ערכת נתונים :
11.71 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 1,623 |
'train' | 48,511 |
'validation' | 1,145 |
- מבנה תכונה :
Translation({
'he': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| הוא | טֶקסט | חוּט | ||
| pt | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('he', 'pt')דוגמאות ( tfds.as_dataframe ):
ted_hrlr_translate/it_to_pt
תיאור תצורה : תרגום מערך נתונים ממנו ל-pt בטקסט רגיל.
גודל ערכת נתונים :
9.94 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 1,669 |
'train' | 46,259 |
'validation' | 1,162 |
- מבנה תכונה :
Translation({
'it': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| זה | טֶקסט | חוּט | ||
| pt | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('it', 'pt')דוגמאות ( tfds.as_dataframe ):
ted_hrlr_translate/pt_to_en
תיאור תצורה : מערך נתונים של תרגום מ-pt ל-en בטקסט רגיל.
גודל מערך נתונים :
10.89 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 1,803 |
'train' | 51,785 |
'validation' | 1,193 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| pt | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('pt', 'en')דוגמאות ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_en
תיאור תצורה : מערך נתונים של תרגום מ-ru ל-en בטקסט רגיל.
גודל ערכת נתונים:
63.22 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 5,476 |
'train' | 208,106 |
'validation' | 4,805 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| ru | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('ru', 'en')דוגמאות ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_pt
תיאור תצורה : מערך נתונים של תרגום מ-ru ל-pt בטקסט רגיל.
גודל ערכת נתונים :
13.00 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 1,588 |
'train' | 47,278 |
'validation' | 1,184 |
- מבנה תכונה :
Translation({
'pt': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| pt | טֶקסט | חוּט | ||
| ru | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('ru', 'pt')דוגמאות ( tfds.as_dataframe ):
ted_hrlr_translate/tr_to_en
תיאור תצורה : מערך נתונים של תרגום מ-tr ל-en בטקסט רגיל.
גודל מערך נתונים :
42.33 MiBפיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 5,029 |
'train' | 182,450 |
'validation' | 4,045 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| tr | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('tr', 'en')דוגמאות ( tfds.as_dataframe ):