- תיאור :
תאגיד מקביל בקנה מידה אינטרנט לשפות אירופאיות רשמיות.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://paracrawl.eu/releases.html
קוד מקור :
tfds.datasets.para_crawl.Builderגרסאות :
-
1.2.0(ברירת מחדל): אין הערות שחרור.
-
איור ( tfds.show_examples ): לא נתמך.
ציטוט :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl/enbg (תצורת ברירת המחדל)
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-bg.
גודל הורדה :
98.94 MiBגודל ערכת נתונים:
362.46 MiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 1,039,885 |
- מבנה תכונה :
Translation({
'bg': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| bg | טֶקסט | חוּט | ||
| he | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'bg')דוגמאות ( tfds.as_dataframe ):
para_crawl/encs
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-cs.
גודל הורדה :
187.31 MiBגודל מערך נתונים :
666.34 MiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 2,981,949 |
- מבנה תכונה :
Translation({
'cs': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| cs | טֶקסט | חוּט | ||
| he | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'cs')דוגמאות ( tfds.as_dataframe ):
para_crawl/enda
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-da.
גודל הורדה :
174.34 MiBגודל ערכת נתונים:
619.77 MiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 2,414,895 |
- מבנה תכונה :
Translation({
'da': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| דה | טֶקסט | חוּט | ||
| he | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'da')דוגמאות ( tfds.as_dataframe ):
para_crawl/ende
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-de.
גודל הורדה :
1.22 GiBגודל מערך נתונים :
4.04 GiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 16,264,448 |
- מבנה תכונה :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| דה | טֶקסט | חוּט | ||
| he | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'de')דוגמאות ( tfds.as_dataframe ):
para_crawl/enel
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-el.
גודל הורדה :
184.59 MiBגודל ערכת נתונים:
698.75 MiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 1,985,233 |
- מבנה תכונה :
Translation({
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| אל | טֶקסט | חוּט | ||
| he | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'el')דוגמאות ( tfds.as_dataframe ):
para_crawl/enes
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-es.
גודל הורדה :
1.82 GiBגודל מערך נתונים :
6.23 GiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 21,987,267 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| es | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'es')דוגמאות ( tfds.as_dataframe ):
para_crawl/enet
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-et.
גודל הורדה :
66.91 MiBגודל ערכת נתונים:
209.16 MiBשמור אוטומטי במטמון ( תיעוד ): רק כאשר
shuffle_files=False(רכבת)פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 853,422 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'et': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| et | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'et')דוגמאות ( tfds.as_dataframe ):
para_crawl/enfi
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-fi.
גודל הורדה :
151.83 MiBגודל מערך נתונים :
543.85 MiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 2,156,069 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'fi': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| fi | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'fi')דוגמאות ( tfds.as_dataframe ):
para_crawl/enfr
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-fr.
גודל הורדה :
2.63 GiBגודל מערך נתונים :
9.04 GiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 31,374,161 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| fr | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'fr')דוגמאות ( tfds.as_dataframe ):
para_crawl/enga
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-ga.
גודל הורדה :
28.03 MiBגודל מערך נתונים :
107.09 MiBשמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 357,399 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'ga': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| ga | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'ga')דוגמאות ( tfds.as_dataframe ):
para_crawl/enhr
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-hr.
גודל הורדה :
80.97 MiBגודל ערכת נתונים:
256.37 MiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 1,002,053 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'hr': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| שעה | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'hr')דוגמאות ( tfds.as_dataframe ):
para_crawl/enhu
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-hu.
גודל הורדה :
114.24 MiBגודל מערך נתונים :
421.40 MiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 1,901,342 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'hu': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| hu | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'hu')דוגמאות ( tfds.as_dataframe ):
para_crawl/enit
תיאור תצורה : תרגום מערך נתונים מאנגלית אליו.
גודל הורדה :
1017.30 MiBגודל מערך נתונים :
3.36 GiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 12,162,239 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'it': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| זה | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'it')דוגמאות ( tfds.as_dataframe ):
para_crawl/enlt
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-lt.
גודל הורדה :
63.28 MiBגודל ערכת נתונים:
204.70 MiBשמור אוטומטי במטמון ( תיעוד ): רק כאשר
shuffle_files=False(רכבת)פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 844,643 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'lt': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| לט | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'lt')דוגמאות ( tfds.as_dataframe ):
para_crawl/enlv
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-lv.
גודל הורדה :
45.17 MiBגודל מערך נתונים :
147.09 MiBשמור אוטומטי במטמון ( תיעוד ): רק כאשר
shuffle_files=False(רכבת)פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 553,060 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'lv': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| lv | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'lv')דוגמאות ( tfds.as_dataframe ):
para_crawl/enmt
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-mt.
גודל הורדה :
18.15 MiBגודל ערכת נתונים:
54.36 MiBשמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 195,502 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'mt': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| הר | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'mt')דוגמאות ( tfds.as_dataframe ):
para_crawl/ennl
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-nl.
גודל הורדה :
400.63 MiBגודל מערך נתונים :
1.40 GiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 5,659,268 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'nl': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| nl | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'nl')דוגמאות ( tfds.as_dataframe ):
para_crawl/enpl
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-pl.
גודל הורדה :
257.90 MiBגודל ערכת נתונים:
885.63 MiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 3,503,276 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'pl': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| pl | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'pl')דוגמאות ( tfds.as_dataframe ):
para_crawl/enpt
תיאור תצורה : מערך נתונים תרגום מאנגלית ל- pt.
גודל הורדה :
608.62 MiBגודל מערך נתונים :
2.05 GiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 8,141,940 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| pt | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'pt')דוגמאות ( tfds.as_dataframe ):
para_crawl/enro
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-ro.
גודל הורדה :
153.24 MiBגודל ערכת נתונים:
534.34 MiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 1,952,043 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'ro': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| ro | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'ro')דוגמאות ( tfds.as_dataframe ):
para_crawl/ensk
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-sk.
גודל הורדה :
96.61 MiBגודל ערכת נתונים:
352.91 MiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 1,591,831 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'sk': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| sk | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'sk')דוגמאות ( tfds.as_dataframe ):
para_crawl/ensl
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-SL.
גודל הורדה :
62.02 MiBגודל ערכת נתונים:
187.66 MiBשמור אוטומטי במטמון ( תיעוד ): רק כאשר
shuffle_files=False(רכבת)פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 660,161 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'sl': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| sl | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'sl')דוגמאות ( tfds.as_dataframe ):
para_crawl/ensv
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-sv.
גודל הורדה :
262.76 MiBגודל מערך נתונים :
905.72 MiBשמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 3,476,729 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'sv': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| תִרגוּם | ||||
| he | טֶקסט | חוּט | ||
| sv | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):('en', 'sv')דוגמאות ( tfds.as_dataframe ):