- opis :
Te dane pochodzą z korpusu Tatoeba z soboty 2018/11/17.
Dla każdego języka wybraliśmy 1000 angielskich zdań i ich tłumaczeń, jeśli są dostępne. Sprawdź ten artykuł, aby uzyskać opis języków, ich rodzin i skryptów, a także wyniki bazowe.
Należy pamiętać, że angielskie zdania nie są identyczne dla wszystkich par językowych. Oznacza to, że wyniki nie są bezpośrednio porównywalne w różnych językach.
Strona główna : http://opus.nlpl.eu/Tatoeba.php
Kod źródłowy :
tfds.datasets.tatoeba.BuilderWersje :
-
1.0.0(domyślnie): Wersja początkowa.
-
Automatyczne buforowanie ( dokumentacja ): Tak
Struktura funkcji :
FeaturesDict({
'source_language': Text(shape=(), dtype=string),
'source_sentence': Text(shape=(), dtype=string),
'target_language': Text(shape=(), dtype=string),
'target_sentence': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| język źródłowy | Tekst | strunowy | ||
| zdanie_źródłowe | Tekst | strunowy | ||
| język docelowy | Tekst | strunowy | ||
| zdanie_docelowe | Tekst | strunowy |
Klucze nadzorowane (Zobacz dokument
as_supervised):NoneRysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@article{tatoeba,
title={Massively Multilingual Sentence Embeddings for Zero-Shot
Cross-Lingual Transfer and Beyond},
author={Mikel, Artetxe and Holger, Schwenk,},
journal={arXiv:1812.10464v2},
year={2018}
}
@InProceedings{TIEDEMANN12.463,
author = {J{\"o}rg}rg Tiedemann},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
year = {2012},
month = {may},
date = {23-25},
address = {Istanbul, Turkey},
editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
publisher = {European Language Resources Association (ELRA)},
isbn = {978-2-9517408-7-7},
language = {english}
}
tatoeba/tatoeba_af (domyślna konfiguracja)
Rozmiar pliku do pobrania :
58.24 KiBRozmiar zbioru danych :
162.74 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ar
Rozmiar pliku do pobrania :
70.95 KiBRozmiar zbioru danych :
175.46 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_bg
Rozmiar pliku do pobrania :
99.88 KiBRozmiar zbioru danych :
204.64 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_bn
Rozmiar pliku do pobrania :
89.55 KiBRozmiar zbioru danych :
194.24 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_de
Rozmiar pliku do pobrania :
103.09 KiBRozmiar zbioru danych :
207.93 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_el
Rozmiar pliku do pobrania :
77.11 KiBRozmiar zbioru danych :
181.65 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_es
Rozmiar pliku do pobrania :
70.57 KiBRozmiar zbioru danych :
175.12 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_et
Rozmiar pliku do pobrania :
58.33 KiBRozmiar zbioru danych :
162.85 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_eu
Rozmiar pliku do pobrania :
64.52 KiBRozmiar zbioru danych :
169.02 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_fa
Rozmiar pliku do pobrania :
91.52 KiBRozmiar zbioru danych :
196.15 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_fi
Rozmiar pliku do pobrania :
73.90 KiBRozmiar zbioru danych :
178.47 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_fr
Rozmiar pliku do pobrania :
78.14 KiBRozmiar zbioru danych :
182.68 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_he
Rozmiar pliku do pobrania :
81.54 KiBRozmiar zbioru danych :
186.15 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_hi
Rozmiar pliku do pobrania :
119.69 KiBRozmiar zbioru danych :
224.89 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_hu
Rozmiar pliku do pobrania :
67.27 KiBRozmiar zbioru danych :
171.78 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_id
Rozmiar pliku do pobrania :
73.09 KiBRozmiar zbioru danych :
177.61 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_it
Rozmiar pliku do pobrania :
64.29 KiBRozmiar zbioru danych :
168.81 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ja
Rozmiar pliku do pobrania :
90.90 KiBRozmiar zbioru danych :
195.53 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_jv
Rozmiar pliku do pobrania :
13.59 KiBRozmiar zbioru danych :
35.01 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 205 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ka
Rozmiar pliku do pobrania :
70.47 KiBRozmiar zbioru danych :
148.67 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 746 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_kk
Rozmiar pliku do pobrania :
46.07 KiBRozmiar zbioru danych :
106.25 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 575 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ko
Rozmiar pliku do pobrania :
77.28 KiBRozmiar zbioru danych :
181.88 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ml
Rozmiar pliku do pobrania :
92.50 KiBRozmiar zbioru danych :
165.14 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 687 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_mr
Rozmiar pliku do pobrania :
98.19 KiBRozmiar zbioru danych :
202.96 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_nl
Rozmiar pliku do pobrania :
71.55 KiBRozmiar zbioru danych :
176.10 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_pt
Rozmiar pliku do pobrania :
73.42 KiBRozmiar zbioru danych :
177.95 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ru
Rozmiar pliku do pobrania :
90.30 KiBRozmiar zbioru danych :
194.92 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_sw
Rozmiar pliku do pobrania :
19.99 KiBRozmiar zestawu danych :
60.75 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 390 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ta
Rozmiar pliku do pobrania :
38.52 KiBRozmiar zbioru danych :
70.93 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 307 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_te
Rozmiar pliku do pobrania :
24.55 KiBRozmiar zbioru danych :
49.07 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 234 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_th
Rozmiar pliku do pobrania :
61.72 KiBRozmiar zbioru danych :
119.32 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 548 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_tl
Rozmiar pliku do pobrania :
66.54 KiBRozmiar zbioru danych :
171.04 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_tr
Rozmiar pliku do pobrania :
70.20 KiBRozmiar zbioru danych :
174.70 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_ur
Rozmiar pliku do pobrania :
86.63 KiBRozmiar zbioru danych :
191.20 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_vi
Rozmiar pliku do pobrania :
89.26 KiBRozmiar zbioru danych :
193.89 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):
tatoeba/tatoeba_zh
Rozmiar pliku do pobrania :
67.32 KiBRozmiar zbioru danych :
171.85 KiBPodziały :
| Podział | Przykłady |
|---|---|
'train' | 1000 |
- Przykłady ( tfds.as_dataframe ):