- विवरण :
आधिकारिक यूरोपीय भाषाओं के लिए वेब-स्केल समानांतर कॉर्पोरा।
अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें
होमपेज : https://paracrawl.eu/releases.html
स्रोत कोड :
tfds.datasets.para_crawl.Builderसंस्करण :
-
1.2.0(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl/enbg (डिफ़ॉल्ट कॉन्फ़िगरेशन)
विन्यास विवरण : अंग्रेजी से बीजी के लिए अनुवाद डेटासेट।
डाउनलोड आकार :
98.94 MiBडेटासेट का आकार :
362.46 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 1,039,885 |
- फ़ीचर संरचना :
Translation({
'bg': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| बीजी | मूलपाठ | डोरी | ||
| एन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_superviseddoc देखें):('en', 'bg')उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/encs
विन्यास विवरण : अंग्रेजी से सीएस के लिए अनुवाद डेटासेट।
डाउनलोड आकार :
187.31 MiBडेटासेट का आकार :
666.34 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 2,981,949 |
- फ़ीचर संरचना :
Translation({
'cs': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| सीएस | मूलपाठ | डोरी | ||
| एन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervisedदस्तावेज़ देखें):('en', 'cs')उदाहरण ( tfds.as_dataframe ):
para_crawl/enda
कॉन्फिग विवरण : अंग्रेजी से डीए में अनुवाद डेटासेट।
डाउनलोड आकार :
174.34 MiBडेटासेट का आकार :
619.77 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 2,414,895 |
- फ़ीचर संरचना :
Translation({
'da': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| दा | मूलपाठ | डोरी | ||
| एन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervisedदस्तावेज़ देखें):('en', 'da')उदाहरण ( tfds.as_dataframe ):
para_crawl/ende
कॉन्फ़िग विवरण : अनुवाद डेटासेट अंग्रेज़ी से de.
डाउनलोड आकार :
1.22 GiBडेटासेट का आकार :
4.04 GiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 16,264,448 |
- फ़ीचर संरचना :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| डे | मूलपाठ | डोरी | ||
| एन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervisedदस्तावेज़ देखें):('en', 'de')उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enel
कॉन्फिग विवरण : अंग्रेजी से el में अनुवाद डेटासेट।
डाउनलोड आकार :
184.59 MiBडेटासेट का आकार :
698.75 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 1,985,233 |
- फ़ीचर संरचना :
Translation({
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एल | मूलपाठ | डोरी | ||
| एन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervisedदस्तावेज़ देखें):('en', 'el')उदाहरण ( tfds.as_dataframe ):
para_crawl/enes
कॉन्फ़िग विवरण : अनुवाद डेटासेट अंग्रेज़ी से es.
डाउनलोड आकार :
1.82 GiBडेटासेट का आकार :
6.23 GiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 21,987,267 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| तों | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervisedदस्तावेज़ देखें):('en', 'es')उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/एनेट
कॉन्फिग विवरण : अंग्रेजी से एट में अनुवाद डेटासेट।
डाउनलोड आकार :
66.91 MiBडेटासेट का आकार :
209.16 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब
shuffle_files=False(ट्रेन)विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 853,422 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'et': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| एट | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervisedदस्तावेज़ देखें):('en', 'et')उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enfi
कॉन्फिग विवरण : अंग्रेजी से फाई में अनुवाद डेटासेट।
डाउनलोड आकार :
151.83 MiBडेटासेट का आकार :
543.85 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 2,156,069 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'fi': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| फाई | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervisedदस्तावेज़ देखें):('en', 'fi')उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enfr
कॉन्फ़िग विवरण : अनुवाद डेटासेट अंग्रेज़ी से fr.
डाउनलोड आकार :
2.63 GiBडेटासेट का आकार :
9.04 GiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 31,374,161 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| फादर | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervisedदस्तावेज़ देखें):('en', 'fr')उदाहरण ( tfds.as_dataframe ):
para_crawl/enga
कॉन्फिग विवरण : अंग्रेजी से ga में अनुवाद डेटासेट।
डाउनलोड आकार :
28.03 MiBडेटासेट का आकार :
107.09 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 357,399 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'ga': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| गा | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervisedदस्तावेज़ देखें):('en', 'ga')उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enhr
कॉन्फिग विवरण : अनुवाद डेटासेट अंग्रेजी से घंटा।
डाउनलोड आकार :
80.97 MiBडेटासेट का आकार :
256.37 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 1,002,053 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'hr': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| मानव संसाधन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervisedदस्तावेज़ देखें):('en', 'hr')उदाहरण ( tfds.as_dataframe ):
para_crawl/enhu
कॉन्फिग विवरण : अंग्रेजी से हू तक अनुवाद डेटासेट।
डाउनलोड का आकार :
114.24 MiBडेटासेट का आकार :
421.40 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 1,901,342 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'hu': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| हू | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervisedदस्तावेज़ देखें):('en', 'hu')उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enit
कॉन्फ़िग विवरण : डेटासेट का अंग्रेजी से अनुवाद।
डाउनलोड आकार :
1017.30 MiBडेटासेट का आकार :
3.36 GiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 12,162,239 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'it': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| यह | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_superviseddoc देखें):('en', 'it')उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enlt
विन्यास विवरण : अंग्रेजी से लेफ्टिनेंट तक अनुवाद डेटासेट।
डाउनलोड आकार :
63.28 MiBडेटासेट का आकार :
204.70 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब
shuffle_files=False(ट्रेन)विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 844,643 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'lt': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| लेफ्टिनेंट | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervisedदस्तावेज़ देखें):('en', 'lt')उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enlv
विन्यास विवरण : अंग्रेजी से lv में अनुवाद डेटासेट।
डाउनलोड आकार :
45.17 MiBडेटासेट का आकार :
147.09 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब
shuffle_files=False(ट्रेन)विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 553,060 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'lv': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| एल.वी | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervisedदस्तावेज़ देखें):('en', 'lv')उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enmt
कॉन्फिग विवरण : अंग्रेजी से एमटी में अनुवाद डेटासेट।
डाउनलोड आकार :
18.15 MiBडेटासेट का आकार :
54.36 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 195,502 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'mt': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| मीट्रिक टन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervisedदस्तावेज़ देखें):('en', 'mt')उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/ennl
कॉन्फ़िग विवरण : अंग्रेज़ी से nl में अनुवाद डेटासेट।
डाउनलोड आकार :
400.63 MiBडेटासेट का आकार :
1.40 GiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 5,659,268 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'nl': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| nl | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervisedदस्तावेज़ देखें):('en', 'nl')उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enpl
कॉन्फिग विवरण : अंग्रेजी से पीएल में अनुवाद डेटासेट।
डाउनलोड आकार :
257.90 MiBडेटासेट का आकार :
885.63 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 3,503,276 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'pl': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| पी एल | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervisedदस्तावेज़ देखें):('en', 'pl')उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enpt
विन्यास विवरण : अंग्रेजी से पीटी के लिए अनुवाद डेटासेट।
डाउनलोड आकार :
608.62 MiBडेटासेट का आकार :
2.05 GiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 8,141,940 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| पं | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervisedदस्तावेज़ देखें):('en', 'pt')उदाहरण ( tfds.as_dataframe ):
para_crawl/enro
कॉन्फिग विवरण : अंग्रेजी से आरओ में अनुवाद डेटासेट।
डाउनलोड आकार :
153.24 MiBडेटासेट का आकार :
534.34 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 1,952,043 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'ro': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| आरओ | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervisedदस्तावेज़ देखें):('en', 'ro')उदाहरण ( tfds.as_dataframe ):
para_crawl/ensk
कॉन्फ़िग विवरण : अनुवाद डेटासेट अंग्रेज़ी से sk.
डाउनलोड आकार :
96.61 MiBडेटासेट का आकार :
352.91 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 1,591,831 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'sk': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| एसके | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervisedदस्तावेज़ देखें):('en', 'sk')उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/ensl
विन्यास विवरण : अनुवाद डेटासेट अंग्रेजी से एसएल।
डाउनलोड आकार :
62.02 MiBडेटासेट का आकार :
187.66 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब
shuffle_files=False(ट्रेन)विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 660,161 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'sl': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| क्र | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervisedदस्तावेज़ देखें):('en', 'sl')उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/ensv
कॉन्फिग विवरण : अंग्रेजी से sv में अनुवाद डेटासेट।
डाउनलोड आकार :
262.76 MiBडेटासेट का आकार :
905.72 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 3,476,729 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'sv': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| अनुवाद | ||||
| एन | मूलपाठ | डोरी | ||
| एसवी | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervisedदस्तावेज़ देखें):('en', 'sv')उदाहरण ( tfds.as_dataframe ):