- توضیحات :
مجموعه های موازی مقیاس وب برای زبان های رسمی اروپایی.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://paracrawl.eu/releases.html
کد منبع :
tfds.datasets.para_crawl.Builderنسخه ها :
-
1.2.0(پیش فرض): بدون یادداشت انتشار.
-
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl/enbg (پیکربندی پیشفرض)
توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به bg.
حجم دانلود :
98.94 MiBحجم مجموعه داده :
362.46 MiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 1,039,885 |
- ساختار ویژگی :
Translation({
'bg': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| bg | متن | رشته | ||
| en | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'bg')مثالها ( tfds.as_dataframe ):
para_crawl/encs
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به cs.
حجم دانلود :
187.31 MiBحجم مجموعه داده :
666.34 MiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 2,981,949 |
- ساختار ویژگی :
Translation({
'cs': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| cs | متن | رشته | ||
| en | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'cs')مثالها ( tfds.as_dataframe ):
para_crawl/enda
توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به da.
حجم دانلود :
174.34 MiBحجم مجموعه داده :
619.77 MiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 2,414,895 |
- ساختار ویژگی :
Translation({
'da': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| دا | متن | رشته | ||
| en | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'da')مثالها ( tfds.as_dataframe ):
para_crawl/ende
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به de.
حجم دانلود :
1.22 GiBحجم مجموعه داده :
4.04 GiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 16,264,448 |
- ساختار ویژگی :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| de | متن | رشته | ||
| en | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'de')مثالها ( tfds.as_dataframe ):
para_crawl/enel
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به el.
حجم دانلود :
184.59 MiBحجم مجموعه داده :
698.75 MiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 1,985,233 |
- ساختار ویژگی :
Translation({
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| el | متن | رشته | ||
| en | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'el')مثالها ( tfds.as_dataframe ):
para_crawl/enes
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به es.
حجم دانلود :
1.82 GiBحجم مجموعه داده :
6.23 GiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 21,987,267 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| es | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'es')مثالها ( tfds.as_dataframe ):
para_crawl/enet
توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به et.
حجم دانلود :
66.91 MiBحجم مجموعه داده :
209.16 MiBذخیره خودکار ( مستندات ): فقط زمانی که
shuffle_files=False(قطار)تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 853,422 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'et': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| et | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'et')مثالها ( tfds.as_dataframe ):
para_crawl/enfi
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به fi.
حجم دانلود :
151.83 MiBحجم مجموعه داده :
543.85 MiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 2,156,069 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'fi': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| فی | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'fi')مثالها ( tfds.as_dataframe ):
para_crawl/enfr
توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به fr.
حجم دانلود :
2.63 GiBحجم مجموعه داده :
9.04 GiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 31,374,161 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| fr | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'fr')مثالها ( tfds.as_dataframe ):
para_crawl/enga
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به ga.
حجم دانلود :
28.03 MiBحجم مجموعه داده :
107.09 MiBذخیره خودکار ( اسناد ): بله
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 357,399 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'ga': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| GA | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'ga')مثالها ( tfds.as_dataframe ):
para_crawl/enhr
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به hr.
حجم دانلود :
80.97 MiBحجم مجموعه داده :
256.37 MiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 1,002,053 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'hr': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| ساعت | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'hr')مثالها ( tfds.as_dataframe ):
para_crawl/enhu
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به hu.
حجم دانلود :
114.24 MiBحجم مجموعه داده :
421.40 MiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 1,901,342 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'hu': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| هو | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'hu')مثالها ( tfds.as_dataframe ):
para_crawl/enit
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به آن.
حجم دانلود :
1017.30 MiBحجم مجموعه داده :
3.36 GiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 12,162,239 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'it': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| آی تی | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'it')مثالها ( tfds.as_dataframe ):
para_crawl/enlt
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به lt.
حجم دانلود :
63.28 MiBحجم مجموعه داده :
204.70 MiBذخیره خودکار ( مستندات ): فقط زمانی که
shuffle_files=False(قطار)تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 844,643 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'lt': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| آن | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'lt')مثالها ( tfds.as_dataframe ):
para_crawl/enlv
توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به lv.
حجم دانلود :
45.17 MiBحجم مجموعه داده :
147.09 MiBذخیره خودکار ( مستندات ): فقط زمانی که
shuffle_files=False(قطار)تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 553,060 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'lv': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| lv | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'lv')مثالها ( tfds.as_dataframe ):
para_crawl/enmt
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به mt.
حجم دانلود :
18.15 MiBحجم مجموعه داده :
54.36 MiBذخیره خودکار ( اسناد ): بله
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 195,502 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'mt': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| mt | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'mt')مثالها ( tfds.as_dataframe ):
para_crawl/ennl
توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به nl.
حجم دانلود :
400.63 MiBحجم مجموعه داده :
1.40 GiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 5,659,268 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'nl': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| nl | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'nl')مثالها ( tfds.as_dataframe ):
para_crawl/enpl
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به pl.
حجم دانلود :
257.90 MiBحجم مجموعه داده :
885.63 MiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 3,503,276 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'pl': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| pl | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'pl')مثالها ( tfds.as_dataframe ):
para_crawl/enpt
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به pt.
حجم دانلود :
608.62 MiBحجم مجموعه داده :
2.05 GiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 8,141,940 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| pt | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'pt')مثالها ( tfds.as_dataframe ):
para_crawl/enro
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به ro.
حجم دانلود :
153.24 MiBحجم مجموعه داده :
534.34 MiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 1,952,043 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'ro': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| ro | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'ro')مثالها ( tfds.as_dataframe ):
para_crawl/ensk
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به sk.
حجم دانلود :
96.61 MiBحجم مجموعه داده :
352.91 MiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 1,591,831 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'sk': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| sk | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'sk')مثالها ( tfds.as_dataframe ):
para_crawl/ensl
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به sl.
حجم دانلود :
62.02 MiBحجم مجموعه داده :
187.66 MiBذخیره خودکار ( مستندات ): فقط زمانی که
shuffle_files=False(قطار)تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 660,161 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'sl': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| sl | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'sl')مثالها ( tfds.as_dataframe ):
para_crawl/ensv
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به sv.
حجم دانلود :
262.76 MiBحجم مجموعه داده :
905.72 MiBذخیره خودکار ( اسناد ): خیر
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'train' | 3,476,729 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'sv': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| ترجمه | ||||
| en | متن | رشته | ||
| sv | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('en', 'sv')مثالها ( tfds.as_dataframe ):