- Descrição :
Corpora Paralelos em Escala Web para Línguas Oficiais Europeias.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://paracrawl.eu/releases.html
Código -fonte:
tfds.datasets.para_crawl.BuilderVersões :
-
1.2.0(padrão): sem notas de versão.
-
Figura ( tfds.show_examples ): Não compatível.
Citação :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl/enbg (configuração padrão)
Descrição da configuração : conjunto de dados de tradução do inglês para bg.
Tamanho do download :
98.94 MiBTamanho do conjunto de dados :
362.46 MiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 1.039.885 |
- Estrutura de recursos :
Translation({
'bg': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| bg | Texto | corda | ||
| pt | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('en', 'bg')Exemplos ( tfds.as_dataframe ):
para_crawl/encs
Descrição da configuração : conjunto de dados de tradução de inglês para cs.
Tamanho do download :
187.31 MiBTamanho do conjunto de dados :
666.34 MiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 2.981.949 |
- Estrutura de recursos :
Translation({
'cs': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| cs | Texto | corda | ||
| pt | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('en', 'cs')Exemplos ( tfds.as_dataframe ):
para_crawl/enda
Descrição da configuração : conjunto de dados de tradução de inglês para da.
Tamanho do download :
174.34 MiBTamanho do conjunto de dados :
619.77 MiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 2.414.895 |
- Estrutura de recursos :
Translation({
'da': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| da | Texto | corda | ||
| pt | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('en', 'da')Exemplos ( tfds.as_dataframe ):
para_crawl/fim
Descrição da configuração : conjunto de dados de tradução de inglês para de.
Tamanho do download :
1.22 GiBTamanho do conjunto de dados :
4.04 GiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 16.264.448 |
- Estrutura de recursos :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| de | Texto | corda | ||
| pt | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('en', 'de')Exemplos ( tfds.as_dataframe ):
para_crawl/enel
Descrição da configuração : conjunto de dados de tradução do inglês para el.
Tamanho do download :
184.59 MiBTamanho do conjunto de dados :
698.75 MiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 1.985.233 |
- Estrutura de recursos :
Translation({
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| ele | Texto | corda | ||
| pt | Texto | corda |
Chaves supervisionadas (consulte
as_superviseddoc ):('en', 'el')Exemplos ( tfds.as_dataframe ):
para_crawl/enes
Descrição da configuração : conjunto de dados de tradução do inglês para o inglês.
Tamanho do download :
1.82 GiBTamanho do conjunto de dados :
6.23 GiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 21.987.267 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| es | Texto | corda |
Chaves supervisionadas (consulte o documento
as_supervised):('en', 'es')Exemplos ( tfds.as_dataframe ):
para_crawl/enet
Descrição da configuração : conjunto de dados de tradução do inglês para et.
Tamanho do download :
66.91 MiBTamanho do conjunto de dados :
209.16 MiBArmazenado em cache automaticamente ( documentação ): Somente quando
shuffle_files=False(train)Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 853.422 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'et': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| et | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('en', 'et')Exemplos ( tfds.as_dataframe ):
para_crawl/enfi
Descrição da configuração : Conjunto de dados de tradução de inglês para fi.
Tamanho do download :
151.83 MiBTamanho do conjunto de dados :
543.85 MiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 2.156.069 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'fi': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| fi | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('en', 'fi')Exemplos ( tfds.as_dataframe ):
para_crawl/enfr
Descrição da configuração : conjunto de dados de tradução do inglês para fr.
Tamanho do download :
2.63 GiBTamanho do conjunto de dados :
9.04 GiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 31.374.161 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| fr | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('en', 'fr')Exemplos ( tfds.as_dataframe ):
para_crawl/enga
Descrição da configuração : conjunto de dados de tradução de inglês para ga.
Tamanho do download :
28.03 MiBTamanho do conjunto de dados :
107.09 MiBCache automático ( documentação ): Sim
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 357.399 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'ga': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| ga | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('en', 'ga')Exemplos ( tfds.as_dataframe ):
para_crawl/enhr
Descrição da configuração : Conjunto de dados de tradução de inglês para hr.
Tamanho do download :
80.97 MiBTamanho do conjunto de dados :
256.37 MiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 1.002.053 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'hr': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| hora | Texto | corda |
Chaves supervisionadas (Veja
as_superviseddoc ):('en', 'hr')Exemplos ( tfds.as_dataframe ):
para_crawl/enhu
Descrição da configuração : conjunto de dados de tradução de inglês para hu.
Tamanho do download :
114.24 MiBTamanho do conjunto de dados :
421.40 MiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 1.901.342 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'hu': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| ei | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('en', 'hu')Exemplos ( tfds.as_dataframe ):
para_crawl/enit
Descrição da configuração : conjunto de dados de tradução do inglês para ele.
Tamanho do download :
1017.30 MiBTamanho do conjunto de dados :
3.36 GiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 12.162.239 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'it': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| isto | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('en', 'it')Exemplos ( tfds.as_dataframe ):
para_crawl/enlt
Descrição da configuração : conjunto de dados de tradução de inglês para lt.
Tamanho do download :
63.28 MiBTamanho do conjunto de dados :
204.70 MiBArmazenado em cache automaticamente ( documentação ): Somente quando
shuffle_files=False(train)Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 844.643 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'lt': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| lt | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('en', 'lt')Exemplos ( tfds.as_dataframe ):
para_crawl/enlv
Descrição da configuração : conjunto de dados de tradução de inglês para lv.
Tamanho do download :
45.17 MiBTamanho do conjunto de dados :
147.09 MiBArmazenado em cache automaticamente ( documentação ): Somente quando
shuffle_files=False(train)Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 553.060 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'lv': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| lv | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('en', 'lv')Exemplos ( tfds.as_dataframe ):
para_crawl/enmt
Descrição da configuração : conjunto de dados de tradução de inglês para mt.
Tamanho do download :
18.15 MiBTamanho do conjunto de dados :
54.36 MiBCache automático ( documentação ): Sim
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 195.502 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'mt': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| mt | Texto | corda |
Chaves supervisionadas (Veja
as_superviseddoc ):('en', 'mt')Exemplos ( tfds.as_dataframe ):
para_crawl/ennl
Descrição da configuração : conjunto de dados de tradução de inglês para nl.
Tamanho do download :
400.63 MiBTamanho do conjunto de dados :
1.40 GiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 5.659.268 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'nl': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| nl | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('en', 'nl')Exemplos ( tfds.as_dataframe ):
para_crawl/enpl
Descrição da configuração : Conjunto de dados de tradução do inglês para o pl.
Tamanho do download :
257.90 MiBTamanho do conjunto de dados :
885.63 MiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 3.503.276 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'pl': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| por favor | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('en', 'pl')Exemplos ( tfds.as_dataframe ):
para_crawl/enpt
Descrição da configuração : conjunto de dados de tradução de inglês para pt.
Tamanho do download :
608.62 MiBTamanho do conjunto de dados :
2.05 GiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 8.141.940 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| pt | Texto | corda |
Chaves supervisionadas (Veja
as_superviseddoc ):('en', 'pt')Exemplos ( tfds.as_dataframe ):
para_crawl/enro
Descrição da configuração : conjunto de dados de tradução de inglês para ro.
Tamanho do download :
153.24 MiBTamanho do conjunto de dados :
534.34 MiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 1.952.043 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'ro': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| ro | Texto | corda |
Chaves supervisionadas (Veja
as_superviseddoc ):('en', 'ro')Exemplos ( tfds.as_dataframe ):
para_crawl/ensk
Descrição da configuração : conjunto de dados de tradução de inglês para sk.
Tamanho do download :
96.61 MiBTamanho do conjunto de dados :
352.91 MiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 1.591.831 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'sk': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| sk | Texto | corda |
Chaves supervisionadas (consulte o documento
as_supervised):('en', 'sk')Exemplos ( tfds.as_dataframe ):
para_crawl/ensl
Descrição da configuração : conjunto de dados de tradução do inglês para o sl.
Tamanho do download :
62.02 MiBTamanho do conjunto de dados :
187.66 MiBArmazenado em cache automaticamente ( documentação ): Somente quando
shuffle_files=False(train)Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 660.161 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'sl': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| sl | Texto | corda |
Chaves supervisionadas (consulte o documento
as_supervised):('en', 'sl')Exemplos ( tfds.as_dataframe ):
para_crawl/ensv
Descrição da configuração : Conjunto de dados de tradução de inglês para SV.
Tamanho do download :
262.76 MiBTamanho do conjunto de dados :
905.72 MiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 3.476.729 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'sv': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| sv | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('en', 'sv')Exemplos ( tfds.as_dataframe ):