- Descripción :
Corpora Paralelo a Escala Web para las Lenguas Oficiales Europeas.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://paracrawl.eu/releases.html
Código fuente :
tfds.datasets.para_crawl.BuilderVersiones :
-
1.2.0(predeterminado): Sin notas de la versión.
-
Figura ( tfds.show_examples ): no compatible.
Cita :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl/enbg (configuración predeterminada)
Descripción de la configuración : conjunto de datos de traducción de inglés a bg.
Tamaño de la descarga :
98.94 MiBTamaño del conjunto de datos :
362.46 MiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 1,039,885 |
- Estructura de características :
Translation({
'bg': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| bg | Texto | cuerda | ||
| es | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'bg')Ejemplos ( tfds.as_dataframe ):
para_crawl/encs
Descripción de la configuración : conjunto de datos de traducción de inglés a cs.
Tamaño de la descarga :
187.31 MiBTamaño del conjunto de datos :
666.34 MiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 2,981,949 |
- Estructura de características :
Translation({
'cs': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| cs | Texto | cuerda | ||
| es | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'cs')Ejemplos ( tfds.as_dataframe ):
para_crawl/enda
Descripción de la configuración : conjunto de datos de traducción del inglés al da.
Tamaño de la descarga :
174.34 MiBTamaño del conjunto de datos :
619.77 MiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 2,414,895 |
- Estructura de características :
Translation({
'da': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| da | Texto | cuerda | ||
| es | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'da')Ejemplos ( tfds.as_dataframe ):
para_crawl/final
Descripción de la configuración : conjunto de datos de traducción del inglés al de.
Tamaño de descarga :
1.22 GiBTamaño del conjunto de datos :
4.04 GiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 16,264,448 |
- Estructura de características :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| Delaware | Texto | cuerda | ||
| es | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'de')Ejemplos ( tfds.as_dataframe ):
para_crawl/enel
Descripción de configuración : conjunto de datos de traducción de inglés a el.
Tamaño de la descarga :
184.59 MiBTamaño del conjunto de datos :
698.75 MiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 1,985,233 |
- Estructura de características :
Translation({
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| el | Texto | cuerda | ||
| es | Texto | cuerda |
Teclas supervisadas (Ver
as_superviseddoc ):('en', 'el')Ejemplos ( tfds.as_dataframe ):
para_crawl/enes
Descripción de configuración : conjunto de datos de traducción de inglés a es.
Tamaño de descarga :
1.82 GiBTamaño del conjunto de datos :
6.23 GiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 21,987,267 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| es | Texto | cuerda |
Teclas supervisadas (Ver
as_superviseddoc ):('en', 'es')Ejemplos ( tfds.as_dataframe ):
para_crawl/enet
Descripción de la configuración : conjunto de datos de traducción del inglés al et.
Tamaño de la descarga :
66.91 MiBTamaño del conjunto de datos :
209.16 MiBAuto-caché ( documentación ): Solo cuando
shuffle_files=False(tren)Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 853,422 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'et': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| et | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'et')Ejemplos ( tfds.as_dataframe ):
para_crawl/enfi
Descripción de la configuración : conjunto de datos de traducción del inglés al fi.
Tamaño de la descarga :
151.83 MiBTamaño del conjunto de datos :
543.85 MiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 2,156,069 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'fi': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| fi | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'fi')Ejemplos ( tfds.as_dataframe ):
para_crawl/enfr
Descripción de la configuración : conjunto de datos de traducción del inglés al fr.
Tamaño de descarga :
2.63 GiBTamaño del conjunto de datos :
9.04 GiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 31.374.161 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| es | Texto | cuerda |
Teclas supervisadas (Ver
as_superviseddoc ):('en', 'fr')Ejemplos ( tfds.as_dataframe ):
para_crawl/enga
Descripción de la configuración : conjunto de datos de traducción del inglés al ga.
Tamaño de la descarga :
28.03 MiBTamaño del conjunto de datos :
107.09 MiBAlmacenamiento automático en caché ( documentación ): Sí
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 357,399 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'ga': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| Georgia | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'ga')Ejemplos ( tfds.as_dataframe ):
para_crawl/enhr
Descripción de la configuración : Conjunto de datos de traducción de inglés a hr.
Tamaño de la descarga :
80.97 MiBTamaño del conjunto de datos :
256.37 MiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 1,002,053 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'hr': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| hora | Texto | cuerda |
Teclas supervisadas (Ver
as_superviseddoc ):('en', 'hr')Ejemplos ( tfds.as_dataframe ):
para_crawl/enhu
Descripción de la configuración : conjunto de datos de traducción del inglés al hu.
Tamaño de la descarga :
114.24 MiBTamaño del conjunto de datos :
421.40 MiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 1,901,342 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'hu': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| hu | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'hu')Ejemplos ( tfds.as_dataframe ):
para_crawl/enit
Descripción de la configuración : conjunto de datos de traducción del inglés al mismo.
Tamaño de descarga :
1017.30 MiBTamaño del conjunto de datos :
3.36 GiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 12,162,239 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'it': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| eso | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'it')Ejemplos ( tfds.as_dataframe ):
para_crawl/enlt
Descripción de configuración : conjunto de datos de traducción de inglés a lt.
Tamaño de la descarga :
63.28 MiBTamaño del conjunto de datos :
204.70 MiBAuto-caché ( documentación ): Solo cuando
shuffle_files=False(tren)Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 844,643 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'lt': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| es | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'lt')Ejemplos ( tfds.as_dataframe ):
para_crawl/enlv
Descripción de la configuración : conjunto de datos de traducción de inglés a lv.
Tamaño de la descarga :
45.17 MiBTamaño del conjunto de datos :
147.09 MiBAuto-caché ( documentación ): Solo cuando
shuffle_files=False(tren)Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 553,060 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'lv': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| lv | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'lv')Ejemplos ( tfds.as_dataframe ):
para_crawl/enmt
Descripción de la configuración : conjunto de datos de traducción de inglés a mt.
Tamaño de la descarga :
18.15 MiBTamaño del conjunto de datos :
54.36 MiBAlmacenamiento automático en caché ( documentación ): Sí
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 195,502 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'mt': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| monte | Texto | cuerda |
Teclas supervisadas (Ver
as_superviseddoc ):('en', 'mt')Ejemplos ( tfds.as_dataframe ):
para_crawl/ennl
Descripción de la configuración : conjunto de datos de traducción del inglés al nl.
Tamaño de la descarga :
400.63 MiBTamaño del conjunto de datos :
1.40 GiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 5,659,268 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'nl': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| nl | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'nl')Ejemplos ( tfds.as_dataframe ):
para_crawl/enpl
Descripción de la configuración : conjunto de datos de traducción del inglés al pl.
Tamaño de la descarga :
257.90 MiBTamaño del conjunto de datos :
885.63 MiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 3.503.276 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'pl': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| pl | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'pl')Ejemplos ( tfds.as_dataframe ):
para_crawl/enpt
Descripción de la configuración : conjunto de datos de traducción de inglés a pt.
Tamaño de la descarga :
608.62 MiBTamaño del conjunto de datos :
2.05 GiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 8,141,940 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| punto | Texto | cuerda |
Teclas supervisadas (Ver
as_superviseddoc ):('en', 'pt')Ejemplos ( tfds.as_dataframe ):
para_crawl/enro
Descripción de la configuración : conjunto de datos de traducción del inglés al ro.
Tamaño de la descarga :
153.24 MiBTamaño del conjunto de datos :
534.34 MiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 1,952,043 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'ro': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| Ro | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'ro')Ejemplos ( tfds.as_dataframe ):
para_crawl/ensk
Descripción de la configuración : conjunto de datos de traducción del inglés al sk.
Tamaño de la descarga :
96.61 MiBTamaño del conjunto de datos :
352.91 MiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 1,591,831 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'sk': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| sk | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'sk')Ejemplos ( tfds.as_dataframe ):
para_crawl/ensl
Descripción de la configuración : conjunto de datos de traducción del inglés al sl.
Tamaño de la descarga :
62.02 MiBTamaño del conjunto de datos :
187.66 MiBAuto-caché ( documentación ): Solo cuando
shuffle_files=False(tren)Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 660,161 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'sl': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| SL | Texto | cuerda |
Teclas supervisadas (Ver
as_superviseddoc ):('en', 'sl')Ejemplos ( tfds.as_dataframe ):
para_crawl/ensv
Descripción de la configuración : conjunto de datos de traducción del inglés al sv.
Tamaño de la descarga :
262.76 MiBTamaño del conjunto de datos :
905.72 MiBAlmacenamiento automático en caché ( documentación ): No
Divisiones :
| Separar | Ejemplos |
|---|---|
'train' | 3.476.729 |
- Estructura de características :
Translation({
'en': Text(shape=(), dtype=string),
'sv': Text(shape=(), dtype=string),
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| Traducción | ||||
| es | Texto | cuerda | ||
| sv | Texto | cuerda |
Teclas supervisadas (ver
as_superviseddoc ):('en', 'sv')Ejemplos ( tfds.as_dataframe ):