- বর্ণনা :
একই ভাষার জোড়া তুলনা করার জন্য TED টক ট্রান্সক্রিপ্ট থেকে প্রাপ্ত ডেটা সেট যেখানে একটি উচ্চ সম্পদ এবং অন্যটি নিম্ন সম্পদ।
উত্স কোড :
tfds.datasets.ted_hrlr_translate.Builderসংস্করণ :
-
1.0.0(ডিফল্ট): নতুন স্প্লিট API ( https://tensorflow.org/datasets/splits )
-
ডাউনলোড সাইজ :
124.94 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@inproceedings{Ye2018WordEmbeddings,
author = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
title = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
booktitle = {HLT-NAACL},
year = {2018},
}
ted_hrlr_translate/az_to_en (ডিফল্ট কনফিগারেশন)
কনফিগারেশনের বিবরণ : az থেকে en এ প্লেইন টেক্সটে অনুবাদ ডেটাসেট।
ডেটাসেটের আকার :
1.61 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 903 |
'train' | 5,946 |
'validation' | 671 |
- বৈশিষ্ট্য গঠন :
Translation({
'az': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| অনুবাদ | ||||
| az | পাঠ্য | স্ট্রিং | ||
| en | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):('az', 'en')উদাহরণ ( tfds.as_dataframe ):
ted_hrlr_translate/aztr_to_en
কনফিগারেশনের বিবরণ : az_tr থেকে en এ প্লেইন টেক্সটে অনুবাদ ডেটাসেট।
ডেটাসেটের আকার :
42.54 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 903 |
'train' | 188,396 |
'validation' | 671 |
- বৈশিষ্ট্য গঠন :
Translation({
'az_tr': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| অনুবাদ | ||||
| az_tr | পাঠ্য | স্ট্রিং | ||
| en | পাঠ্য | স্ট্রিং |
তত্ত্বাবধানে থাকা কীগুলি (
as_superviseddoc হিসাবে ):('az_tr', 'en')উদাহরণ ( tfds.as_dataframe ):
ted_hrlr_translate/be_to_en
কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে be থেকে en পর্যন্ত অনুবাদ ডেটাসেট।
ডেটাসেটের আকার :
1.47 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 664 |
'train' | 4,509 |
'validation' | 248 |
- বৈশিষ্ট্য গঠন :
Translation({
'be': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| অনুবাদ | ||||
| থাকা | পাঠ্য | স্ট্রিং | ||
| en | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):('be', 'en')উদাহরণ ( tfds.as_dataframe ):
ted_hrlr_translate/beru_to_en
কনফিগারেশনের বিবরণ : be_ru থেকে en এ প্লেইন টেক্সটে অনুবাদ ডেটাসেট।
ডেটাসেটের আকার :
62.45 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 664 |
'train' | 212,614 |
'validation' | 248 |
- বৈশিষ্ট্য গঠন :
Translation({
'be_ru': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| অনুবাদ | ||||
| be_ru | পাঠ্য | স্ট্রিং | ||
| en | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (
as_supervisedডক হিসাবে ):('be_ru', 'en')উদাহরণ ( tfds.as_dataframe ):
ted_hrlr_translate/es_to_pt
কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে es থেকে pt পর্যন্ত অনুবাদ ডেটাসেট।
ডেটাসেটের আকার :
9.62 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 1,763 |
'train' | 44,938 |
'validation' | 1,016 |
- বৈশিষ্ট্য গঠন :
Translation({
'es': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| অনুবাদ | ||||
| es | পাঠ্য | স্ট্রিং | ||
| pt | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (
as_supervisedডক ):('es', 'pt')উদাহরণ ( tfds.as_dataframe ):
ted_hrlr_translate/fr_to_pt
কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে fr থেকে pt পর্যন্ত অনুবাদ ডেটাসেট।
ডেটাসেটের আকার :
9.74 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 1,494 |
'train' | 43,873 |
'validation' | 1,131 |
- বৈশিষ্ট্য গঠন :
Translation({
'fr': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| অনুবাদ | ||||
| fr | পাঠ্য | স্ট্রিং | ||
| pt | পাঠ্য | স্ট্রিং |
তত্ত্বাবধানে থাকা কী (
as_superviseddoc হিসাবে ):('fr', 'pt')উদাহরণ ( tfds.as_dataframe ):
ted_hrlr_translate/gl_to_en
কনফিগারেশনের বিবরণ : সাধারণ পাঠ্যে gl থেকে en পর্যন্ত অনুবাদ ডেটাসেট।
ডেটাসেটের আকার :
2.41 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 1,007 |
'train' | 10,017 |
'validation' | 682 |
- বৈশিষ্ট্য গঠন :
Translation({
'en': Text(shape=(), dtype=string),
'gl': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| অনুবাদ | ||||
| en | পাঠ্য | স্ট্রিং | ||
| gl | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):('gl', 'en')উদাহরণ ( tfds.as_dataframe ):
ted_hrlr_translate/glpt_to_en
কনফিগারেশনের বিবরণ : অনুবাদ ডেটাসেট gl_pt থেকে en এ প্লেইন টেক্সটে।
ডেটাসেটের আকার :
12.90 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 1,007 |
'train' | 61,802 |
'validation' | 682 |
- বৈশিষ্ট্য গঠন :
Translation({
'en': Text(shape=(), dtype=string),
'gl_pt': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| অনুবাদ | ||||
| en | পাঠ্য | স্ট্রিং | ||
| gl_pt | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (
as_supervisedডক ):('gl_pt', 'en')উদাহরণ ( tfds.as_dataframe ):
ted_hrlr_translate/he_to_pt
কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে হি থেকে পিটি পর্যন্ত অনুবাদ ডেটাসেট।
ডেটাসেটের আকার :
11.71 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 1,623 |
'train' | 48,511 |
'validation' | 1,145 |
- বৈশিষ্ট্য গঠন :
Translation({
'he': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| অনুবাদ | ||||
| তিনি | পাঠ্য | স্ট্রিং | ||
| pt | পাঠ্য | স্ট্রিং |
তত্ত্বাবধানে থাকা কী (দেখুন
as_superviseddoc ):('he', 'pt')উদাহরণ ( tfds.as_dataframe ):
ted_hrlr_translate/it_to_pt
কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে pt থেকে অনুবাদ ডেটাসেট।
ডেটাসেটের আকার :
9.94 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 1,669 |
'train' | 46,259 |
'validation' | 1,162 |
- বৈশিষ্ট্য গঠন :
Translation({
'it': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| অনুবাদ | ||||
| এটা | পাঠ্য | স্ট্রিং | ||
| pt | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):('it', 'pt')উদাহরণ ( tfds.as_dataframe ):
ted_hrlr_translate/pt_to_en
কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে pt থেকে en পর্যন্ত অনুবাদ ডেটাসেট।
ডেটাসেটের আকার :
10.89 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 1,803 |
'train' | 51,785 |
'validation' | 1,193 |
- বৈশিষ্ট্য গঠন :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| অনুবাদ | ||||
| en | পাঠ্য | স্ট্রিং | ||
| pt | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):('pt', 'en')উদাহরণ ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_en
কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে ru থেকে en পর্যন্ত অনুবাদ ডেটাসেট।
ডেটাসেটের আকার :
63.22 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | ৫,৪৭৬ |
'train' | 208,106 |
'validation' | 4,805 |
- বৈশিষ্ট্য গঠন :
Translation({
'en': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| অনুবাদ | ||||
| en | পাঠ্য | স্ট্রিং | ||
| ru | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):('ru', 'en')উদাহরণ ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_pt
কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে ru থেকে pt পর্যন্ত অনুবাদ ডেটাসেট।
ডেটাসেটের আকার :
13.00 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 1,588 |
'train' | 47,278 |
'validation' | 1,184 |
- বৈশিষ্ট্য গঠন :
Translation({
'pt': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| অনুবাদ | ||||
| pt | পাঠ্য | স্ট্রিং | ||
| ru | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):('ru', 'pt')উদাহরণ ( tfds.as_dataframe ):
ted_hrlr_translate/tr_to_en
কনফিগারেশনের বিবরণ : tr থেকে en এ প্লেইন টেক্সটে অনুবাদ ডেটাসেট।
ডেটাসেটের আকার :
42.33 MiBবিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | ৫,০২৯ |
'train' | 182,450 |
'validation' | ৪,০৪৫ |
- বৈশিষ্ট্য গঠন :
Translation({
'en': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| অনুবাদ | ||||
| en | পাঠ্য | স্ট্রিং | ||
| tr | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):('tr', 'en')উদাহরণ ( tfds.as_dataframe ):