- Deskripsi :
Corpora Paralel Skala Web untuk Bahasa Eropa Resmi.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://paracrawl.eu/releases.html
Kode sumber :
tfds.datasets.para_crawl.BuilderVersi :
-
1.2.0(default): Tidak ada catatan rilis.
-
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl/enbg (konfigurasi default)
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke bg.
Ukuran unduhan :
98.94 MiBUkuran dataset :
362.46 MiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 1.039.885 |
- Struktur fitur :
Translation({
'bg': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| bg | Teks | rangkaian | ||
| en | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'bg')Contoh ( tfds.as_dataframe ):
para_crawl/encs
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke cs.
Ukuran unduhan :
187.31 MiBUkuran dataset :
666.34 MiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 2.981.949 |
- Struktur fitur :
Translation({
'cs': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| cs | Teks | rangkaian | ||
| en | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'cs')Contoh ( tfds.as_dataframe ):
para_crawl/akhir
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke da.
Ukuran unduhan :
174.34 MiBUkuran dataset :
619.77 MiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 2.414.895 |
- Struktur fitur :
Translation({
'da': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| da | Teks | rangkaian | ||
| en | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'da')Contoh ( tfds.as_dataframe ):
para_crawl/ende
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke de.
Ukuran unduhan :
1.22 GiBUkuran dataset :
4.04 GiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 16.264.448 |
- Struktur fitur :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| de | Teks | rangkaian | ||
| en | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'de')Contoh ( tfds.as_dataframe ):
para_crawl/enel
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke el.
Ukuran unduhan :
184.59 MiBUkuran dataset :
698.75 MiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 1.985.233 |
- Struktur fitur :
Translation({
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| el | Teks | rangkaian | ||
| en | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'el')Contoh ( tfds.as_dataframe ):
para_crawl/enes
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke es.
Ukuran unduhan :
1.82 GiBUkuran dataset :
6.23 GiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 21.987.267 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| es | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'es')Contoh ( tfds.as_dataframe ):
para_crawl/enet
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke et.
Ukuran unduhan :
66.91 MiBUkuran dataset :
209.16 MiBAuto-cached ( dokumentasi ): Hanya ketika
shuffle_files=False(train)Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 853.422 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'et': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| et | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'et')Contoh ( tfds.as_dataframe ):
para_crawl/enfi
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke fi.
Ukuran unduhan :
151.83 MiBUkuran dataset :
543.85 MiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 2.156.069 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'fi': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| fi | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'fi')Contoh ( tfds.as_dataframe ):
para_crawl/enfr
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke fr.
Ukuran unduhan :
2.63 GiBUkuran dataset :
9.04 GiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 31.374.161 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| fr | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'fr')Contoh ( tfds.as_dataframe ):
para_crawl/enga
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke ga.
Ukuran unduhan :
28.03 MiBUkuran dataset :
107.09 MiBDi-cache otomatis ( dokumentasi ): Ya
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 357.399 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'ga': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| ga | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'ga')Contoh ( tfds.as_dataframe ):
para_crawl/enhr
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke hr.
Ukuran unduhan :
80.97 MiBUkuran dataset :
256.37 MiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 1.002.053 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'hr': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| jam | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'hr')Contoh ( tfds.as_dataframe ):
para_crawl/enhu
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke hu.
Ukuran unduhan :
114.24 MiBUkuran dataset :
421.40 MiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 1.901.342 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'hu': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| hu | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'hu')Contoh ( tfds.as_dataframe ):
para_crawl/enit
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke bahasa Inggris.
Ukuran unduhan :
1017.30 MiBUkuran dataset :
3.36 GiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 12.162.239 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'it': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| dia | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'it')Contoh ( tfds.as_dataframe ):
para_crawl/enlt
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke lt.
Ukuran unduhan :
63.28 MiBUkuran dataset :
204.70 MiBAuto-cached ( dokumentasi ): Hanya ketika
shuffle_files=False(train)Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 844.643 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'lt': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| lt | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'lt')Contoh ( tfds.as_dataframe ):
para_crawl/enlv
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke lv.
Ukuran unduhan :
45.17 MiBUkuran dataset :
147.09 MiBAuto-cached ( dokumentasi ): Hanya ketika
shuffle_files=False(train)Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 553.060 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'lv': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| lv | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'lv')Contoh ( tfds.as_dataframe ):
para_crawl/enmt
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke mt.
Ukuran unduhan :
18.15 MiBUkuran dataset :
54.36 MiBDi-cache otomatis ( dokumentasi ): Ya
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 195.502 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'mt': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| mt | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'mt')Contoh ( tfds.as_dataframe ):
para_crawl/ennl
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke nl.
Ukuran unduhan :
400.63 MiBUkuran dataset :
1.40 GiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 5.659.268 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'nl': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| nl | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'nl')Contoh ( tfds.as_dataframe ):
para_crawl/enpl
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke pl.
Ukuran unduhan :
257.90 MiBUkuran dataset :
885.63 MiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 3.503.276 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'pl': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| pl | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'pl')Contoh ( tfds.as_dataframe ):
para_crawl/enpt
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke pt.
Ukuran unduhan :
608.62 MiBUkuran dataset :
2.05 GiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 8.141.940 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| pt | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'pt')Contoh ( tfds.as_dataframe ):
para_crawl/enro
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke ro.
Ukuran unduhan :
153.24 MiBUkuran dataset :
534.34 MiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 1.952.043 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'ro': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| ro | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'ro')Contoh ( tfds.as_dataframe ):
para_crawl/ensk
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke sk.
Ukuran unduhan :
96.61 MiBUkuran dataset :
352.91 MiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 1.591.831 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'sk': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| sk | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'sk')Contoh ( tfds.as_dataframe ):
para_crawl/ensl
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke sl.
Ukuran unduhan :
62.02 MiBUkuran dataset :
187.66 MiBAuto-cached ( dokumentasi ): Hanya ketika
shuffle_files=False(train)Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 660.161 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'sl': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| sl | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'sl')Contoh ( tfds.as_dataframe ):
para_crawl/ensv
Deskripsi konfigurasi : Terjemahan dataset dari bahasa Inggris ke sv.
Ukuran unduhan :
262.76 MiBUkuran dataset :
905.72 MiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'train' | 3.476.729 |
- Struktur fitur :
Translation({
'en': Text(shape=(), dtype=string),
'sv': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| Terjemahan | ||||
| en | Teks | rangkaian | ||
| sv | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('en', 'sv')Contoh ( tfds.as_dataframe ):