- الوصف :
Corpora الموازي على نطاق الويب للغات الأوروبية الرسمية.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://paracrawl.eu/releases.html
كود المصدر :
tfds.datasets.para_crawl.Builderإصدارات :
-
1.2.0(افتراضي): لا توجد ملاحظات حول الإصدار.
-
الشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl / enbg (التكوين الافتراضي)
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى bg.
حجم التحميل :
98.94 MiBحجم مجموعة البيانات :
362.46 MiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 1،039،885 |
- هيكل الميزة :
Translation({
'bg': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| bg | نص | سلسلة | ||
| en | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'bg')أمثلة ( tfds.as_dataframe ):
para_crawl / encs
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى cs.
حجم التحميل :
187.31 MiBحجم مجموعة البيانات :
666.34 MiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 2،981،949 |
- هيكل الميزة :
Translation({
'cs': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| CS | نص | سلسلة | ||
| en | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'cs')أمثلة ( tfds.as_dataframe ):
الفقرة_crawl / النهاية
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى da.
حجم التحميل :
174.34 MiBحجم مجموعة البيانات :
619.77 MiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 2،414،895 |
- هيكل الميزة :
Translation({
'da': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| دا | نص | سلسلة | ||
| en | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'da')أمثلة ( tfds.as_dataframe ):
الفقرة_crawl / نهاية
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى de.
حجم التحميل :
1.22 GiBحجم مجموعة البيانات :
4.04 GiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 1626448 |
- هيكل الميزة :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| دي | نص | سلسلة | ||
| en | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'de')أمثلة ( tfds.as_dataframe ):
الفقرة_crawl / enel
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى el.
حجم التحميل :
184.59 MiBحجم مجموعة البيانات :
698.75 MiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 1،985،233 |
- هيكل الميزة :
Translation({
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| el | نص | سلسلة | ||
| en | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'el')أمثلة ( tfds.as_dataframe ):
para_crawl / enes
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى الإنجليزية.
حجم التحميل :
1.82 GiBحجم مجموعة البيانات :
6.23 GiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 21987267 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| إس | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'es')أمثلة ( tfds.as_dataframe ):
para_crawl / enet
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى et.
حجم التحميل :
66.91 MiBحجم مجموعة البيانات :
209.16 MiBالتخزين المؤقت التلقائي ( التوثيق ): فقط عندما يكون
shuffle_files=False(قطار)الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 853،422 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'et': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| وآخرون | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'et')أمثلة ( tfds.as_dataframe ):
para_crawl / enfi
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى fi.
حجم التحميل :
151.83 MiBحجم مجموعة البيانات :
543.85 MiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 2،156،069 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'fi': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| فاي | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'fi')أمثلة ( tfds.as_dataframe ):
الفقرة_crawl / enfr
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى الفرنسية.
حجم التحميل : ٢ ٫
2.63 GiBحجم مجموعة البيانات :
9.04 GiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 31374161 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| الاب | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'fr')أمثلة ( tfds.as_dataframe ):
para_crawl / enga
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى ga.
حجم التحميل :
28.03 MiBحجم مجموعة البيانات :
107.09 MiBالتخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 357.399 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'ga': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| الجا | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'ga')أمثلة ( tfds.as_dataframe ):
الفقرة_crawl / enhr
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى hr.
حجم التحميل :
80.97 MiBحجم مجموعة البيانات :
256.37 MiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 1،002،053 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'hr': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| ساعة | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'hr')أمثلة ( tfds.as_dataframe ):
الفقرة_crawl / enhu
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى hu.
حجم التحميل :
114.24 MiBحجم مجموعة البيانات :
421.40 MiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 1،901،342 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'hu': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| هو | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'hu')أمثلة ( tfds.as_dataframe ):
para_crawl / enit
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إليها.
حجم التحميل :
1017.30 MiBحجم مجموعة البيانات :
3.36 GiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 12162239 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'it': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| هو - هي | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'it')أمثلة ( tfds.as_dataframe ):
الفقرة_crawl / enlt
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى الملازم الأول.
حجم التحميل :
63.28 MiBحجم مجموعة البيانات :
204.70 MiBالتخزين المؤقت التلقائي ( التوثيق ): فقط عندما يكون
shuffle_files=False(قطار)الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 844643 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'lt': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| لتر | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'lt')أمثلة ( tfds.as_dataframe ):
الفقرة_crawl / enlv
وصف التكوين : مجموعة بيانات الترجمة من اللغة الإنجليزية إلى المستوى.
حجم التحميل :
45.17 MiBحجم مجموعة البيانات :
147.09 MiBالتخزين المؤقت التلقائي ( التوثيق ): فقط عندما يكون
shuffle_files=False(قطار)الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 553،060 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'lv': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| lv | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'lv')أمثلة ( tfds.as_dataframe ):
para_crawl / enmt
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى طن متري.
حجم التحميل :
18.15 MiBحجم مجموعة البيانات :
54.36 MiBالتخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 195502 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'mt': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| طن متري | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'mt')أمثلة ( tfds.as_dataframe ):
الفقرة_crawl / ennl
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى nl.
حجم التحميل :
400.63 MiBحجم مجموعة البيانات :
1.40 GiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 5،659،268 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'nl': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| nl | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'nl')أمثلة ( tfds.as_dataframe ):
الفقرة_crawl / enpl
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى pl.
حجم التحميل :
257.90 MiBحجم مجموعة البيانات :
885.63 MiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 3،503،276 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'pl': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| رر | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'pl')أمثلة ( tfds.as_dataframe ):
para_crawl / enpt
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى pt.
حجم التحميل :
608.62 MiBحجم مجموعة البيانات :
2.05 GiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 8141940 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| نقطة | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'pt')أمثلة ( tfds.as_dataframe ):
para_crawl / enro
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى ريال عماني.
حجم التحميل :
153.24 MiBحجم مجموعة البيانات :
534.34 MiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 1،952،043 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'ro': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| ريال عماني | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'ro')أمثلة ( tfds.as_dataframe ):
para_crawl / انسك
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى sk.
حجم التحميل :
96.61 MiBحجم مجموعة البيانات :
352.91 MiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 1،591،831 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'sk': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| كورونا | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'sk')أمثلة ( tfds.as_dataframe ):
para_crawl / ensl
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى sl.
حجم التحميل :
62.02 MiBحجم مجموعة البيانات :
187.66 MiBالتخزين المؤقت التلقائي ( التوثيق ): فقط عندما يكون
shuffle_files=False(قطار)الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 660161 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'sl': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| sl | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'sl')أمثلة ( tfds.as_dataframe ):
الفقرة_crawl / snv
وصف التكوين : مجموعة بيانات الترجمة من الإنجليزية إلى sv.
حجم التحميل :
262.76 MiBحجم مجموعة البيانات :
905.72 MiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'train' | 3،476،729 |
- هيكل الميزة :
Translation({
'en': Text(shape=(), dtype=string),
'sv': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| ترجمة | ||||
| en | نص | سلسلة | ||
| سيفيرت | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('en', 'sv')أمثلة ( tfds.as_dataframe ):