- Descrição :
Conjuntos de dados derivados de transcrições de palestras TED para comparar pares de idiomas semelhantes, onde um é de alto recurso e o outro é de baixo recurso.
Página inicial : https://github.com/neulab/word-embeddings-for-nmt
Código-fonte :
tfds.datasets.ted_hrlr_translate.BuilderVersões :
-
1.0.0(padrão): Nova API de divisão ( https://tensorflow.org/datasets/splits )
-
Tamanho do download :
124.94 MiBCache automático ( documentação ): Sim
Figura ( tfds.show_examples ): Não suportado.
Citação :
@inproceedings{Ye2018WordEmbeddings,
author = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
title = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
booktitle = {HLT-NAACL},
year = {2018},
}
ted_hrlr_translate/az_to_en (configuração padrão)
Descrição da configuração : Conjunto de dados de tradução de az para en em texto simples.
Tamanho do conjunto de dados :
1.61 MiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 903 |
'train' | 5.946 |
'validation' | 671 |
- Estrutura de recursos :
Translation({
'az': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentação do recurso :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| az | Texto | corda | ||
| pt | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('az', 'en')Exemplos ( tfds.as_dataframe ):
ted_hrlr_translate/aztr_to_en
Descrição da configuração : conjunto de dados de tradução de az_tr para en em texto simples.
Tamanho do conjunto de dados :
42.54 MiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 903 |
'train' | 188.396 |
'validation' | 671 |
- Estrutura de recursos :
Translation({
'az_tr': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentação do recurso :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| az_tr | Texto | corda | ||
| pt | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('az_tr', 'en')Exemplos ( tfds.as_dataframe ):
ted_hrlr_translate/be_to_en
Descrição da configuração : Conjunto de dados de tradução de be para en em texto simples.
Tamanho do conjunto de dados :
1.47 MiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 664 |
'train' | 4.509 |
'validation' | 248 |
- Estrutura de recursos :
Translation({
'be': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentação do recurso :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| ser | Texto | corda | ||
| pt | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('be', 'en')Exemplos ( tfds.as_dataframe ):
ted_hrlr_translate/beru_to_en
Descrição da configuração : Conjunto de dados de tradução de be_ru para en em texto simples.
Tamanho do conjunto de dados :
62.45 MiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 664 |
'train' | 212.614 |
'validation' | 248 |
- Estrutura de recursos :
Translation({
'be_ru': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentação do recurso :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| be_ru | Texto | corda | ||
| pt | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('be_ru', 'en')Exemplos ( tfds.as_dataframe ):
ted_hrlr_translate/es_to_pt
Descrição da configuração : Conjunto de dados de tradução de es para pt em texto simples.
Tamanho do conjunto de dados :
9.62 MiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 1.763 |
'train' | 44.938 |
'validation' | 1.016 |
- Estrutura de recursos :
Translation({
'es': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Documentação do recurso :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| es | Texto | corda | ||
| pt | Texto | corda |
Chaves supervisionadas (ver
as_superviseddoc ):('es', 'pt')Exemplos ( tfds.as_dataframe ):
ted_hrlr_translate/fr_to_pt
Descrição da configuração : conjunto de dados de tradução de fr para pt em texto simples.
Tamanho do conjunto de dados :
9.74 MiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 1.494 |
'train' | 43.873 |
'validation' | 1.131 |
- Estrutura de recursos :
Translation({
'fr': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Documentação do recurso :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| fr | Texto | corda | ||
| pt | Texto | corda |
Chaves supervisionadas (Veja
as_superviseddoc ):('fr', 'pt')Exemplos ( tfds.as_dataframe ):
ted_hrlr_translate/gl_to_en
Descrição da configuração : Conjunto de dados de tradução de gl para en em texto simples.
Tamanho do conjunto de dados :
2.41 MiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 1.007 |
'train' | 10.017 |
'validation' | 682 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'gl': Text(shape=(), dtype=string),
})
- Documentação do recurso :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| gl | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('gl', 'en')Exemplos ( tfds.as_dataframe ):
ted_hrlr_translate/glpt_to_en
Descrição da configuração : Conjunto de dados de tradução de gl_pt para en em texto simples.
Tamanho do conjunto de dados :
12.90 MiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 1.007 |
'train' | 61.802 |
'validation' | 682 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'gl_pt': Text(shape=(), dtype=string),
})
- Documentação do recurso :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| gl_pt | Texto | corda |
Chaves supervisionadas (Veja
as_superviseddoc ):('gl_pt', 'en')Exemplos ( tfds.as_dataframe ):
ted_hrlr_translate/he_to_pt
Descrição da configuração : Conjunto de dados de tradução de he para pt em texto simples.
Tamanho do conjunto de dados :
11.71 MiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 1.623 |
'train' | 48.511 |
'validation' | 1.145 |
- Estrutura de recursos :
Translation({
'he': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Documentação do recurso :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| ele | Texto | corda | ||
| pt | Texto | corda |
Chaves supervisionadas (Veja
as_superviseddoc ):('he', 'pt')Exemplos ( tfds.as_dataframe ):
ted_hrlr_translate/it_to_pt
Descrição da configuração : conjunto de dados de tradução dele para pt em texto simples.
Tamanho do conjunto de dados :
9.94 MiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 1.669 |
'train' | 46.259 |
'validation' | 1.162 |
- Estrutura de recursos :
Translation({
'it': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Documentação do recurso :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| isto | Texto | corda | ||
| pt | Texto | corda |
Chaves supervisionadas (Veja
as_superviseddoc ):('it', 'pt')Exemplos ( tfds.as_dataframe ):
ted_hrlr_translate/pt_to_en
Descrição da configuração : Conjunto de dados de tradução de pt para en em texto simples.
Tamanho do conjunto de dados :
10.89 MiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 1.803 |
'train' | 51.785 |
'validation' | 1.193 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Documentação do recurso :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| pt | Texto | corda |
Chaves supervisionadas (Veja
as_superviseddoc ):('pt', 'en')Exemplos ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_en
Descrição da configuração : Conjunto de dados de tradução de ru para en em texto simples.
Tamanho do conjunto de dados :
63.22 MiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 5.476 |
'train' | 208.106 |
'validation' | 4.805 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- Documentação do recurso :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| ru | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('ru', 'en')Exemplos ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_pt
Descrição da configuração : Conjunto de dados de tradução de ru para pt em texto simples.
Tamanho do conjunto de dados :
13.00 MiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 1.588 |
'train' | 47.278 |
'validation' | 1.184 |
- Estrutura de recursos :
Translation({
'pt': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- Documentação do recurso :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| ru | Texto | corda |
Chaves supervisionadas (Veja
as_superviseddoc ):('ru', 'pt')Exemplos ( tfds.as_dataframe ):
ted_hrlr_translate/tr_to_en
Descrição da configuração : Conjunto de dados de tradução de tr para en em texto simples.
Tamanho do conjunto de dados :
42.33 MiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 5.029 |
'train' | 182.450 |
'validation' | 4.045 |
- Estrutura de recursos :
Translation({
'en': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
})
- Documentação do recurso :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| Tradução | ||||
| pt | Texto | corda | ||
| tr | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):('tr', 'en')Exemplos ( tfds.as_dataframe ):