- Açıklama :
 
Veri kümesini statmt.org'daki verilere göre çevirin.
 Sürümler, birden çok veri kaynağının bir kombinasyonu kullanılarak farklı yıllar için mevcuttur. Temel wmt_translate , özel bir tfds.translate.wmt.WmtConfig oluşturarak kendi veri/dil çiftinizi seçmek için kendi yapılandırmanızı oluşturmanıza olanak tanır.
config = tfds.translate.wmt.WmtConfig(
    version="0.0.1",
    language_pair=("fr", "de"),
    subsets={
        tfds.Split.TRAIN: ["commoncrawl_frde"],
        tfds.Split.VALIDATION: ["euelections_dev2019"],
    },
)
builder = tfds.builder("wmt_translate", config=config)
Ek Belgeler : Belgeleri Keşfedin
Ana Sayfa : http://www.statmt.org/wmt18/translation-task.html
Kaynak kodu :
tfds.translate.Wmt18Translatesürümler :
-  
1.0.0(varsayılan): Sürüm notu yok. 
-  
 Manuel indirme talimatları : Bu veri kümesi, kaynak verileri manuel olarak download_config.manual_dir içine
download_config.manual_dirgerektirir (varsayılan olarak~/tensorflow_datasets/downloads/manual/):
Buradaki wmt yapılandırmalarından bazıları manuel indirme gerektirir. İndirilmesi gereken tam yolu (ve dosya adını) görmek için lütfen wmt.py'ye bakın.Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@InProceedings{bojar-EtAl:2018:WMT1,
  author    = {Bojar, Ond
{r}ej  and  Federmann, Christian  and  Fishel, Mark
    and Graham, Yvette  and  Haddow, Barry  and  Huck, Matthias  and
    Koehn, Philipp  and  Monz, Christof},
  title     = {Findings of the 2018 Conference on Machine Translation (WMT18)},
  booktitle = {Proceedings of the Third Conference on Machine Translation,
    Volume 2: Shared Task Papers},
  month     = {October},
  year      = {2018},
  address   = {Belgium, Brussels},
  publisher = {Association for Computational Linguistics},
  pages     = {272--307},
  url       = {http://www.aclweb.org/anthology/W18-6401}
}
wmt18_translate/cs-en (varsayılan yapılandırma)
Yapılandırma açıklaması : WMT 2018 cs-en çeviri görevi veri kümesi.
İndirme boyutu :
1.89 GiBVeri kümesi boyutu :
3.84 GiBOtomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 2.983 | 
 'train' | 24.021.877 | 
 'validation' | 3.005 | 
- Özellik yapısı :
 
Translation({
    'cs': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| cs | Metin | sicim | ||
| tr | Metin | sicim | 
Denetlenen anahtarlar (Bkz
as_superviseddoc ):('cs', 'en')Örnekler ( tfds.as_dataframe ):
wmt18_translate/de-en
Yapılandırma açıklaması : WMT 2018 de-en çeviri görevi veri kümesi.
İndirme boyutu :
3.55 GiBVeri kümesi boyutu :
8.44 GiBOtomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 2.998 | 
 'train' | 42.271.874 | 
 'validation' | 3.004 | 
- Özellik yapısı :
 
Translation({
    'de': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| de | Metin | sicim | ||
| tr | Metin | sicim | 
Denetlenen anahtarlar (Bkz
as_superviseddoc ):('de', 'en')Örnekler ( tfds.as_dataframe ):
wmt18_translate/et-tr
Yapılandırma açıklaması : WMT 2018 et-en çeviri görevi veri kümesi.
İndirme boyutu :
499.91 MiBVeri kümesi boyutu :
663.80 MiBOtomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 2.000 | 
 'train' | 2.175.873 | 
 'validation' | 2.000 | 
- Özellik yapısı :
 
Translation({
    'en': Text(shape=(), dtype=string),
    'et': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| tr | Metin | sicim | ||
| et | Metin | sicim | 
Denetlenen anahtarlar (Bkz
as_superviseddoc ):('et', 'en')Örnekler ( tfds.as_dataframe ):
wmt18_translate/fi-tr
Yapılandırma açıklaması : WMT 2018 fi-en çeviri görevi veri kümesi.
İndirme boyutu :
468.76 MiBVeri kümesi boyutu :
889.40 MiBOtomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 3.000 | 
 'train' | 3.280.600 | 
 'validation' | 6.004 | 
- Özellik yapısı :
 
Translation({
    'en': Text(shape=(), dtype=string),
    'fi': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| tr | Metin | sicim | ||
| fi | Metin | sicim | 
Denetlenen anahtarlar (Bkz
as_superviseddoc ):('fi', 'en')Örnekler ( tfds.as_dataframe ):
wmt18_translate/ru-tr
Yapılandırma açıklaması : WMT 2018 ru-en çeviri görevi veri kümesi.
İndirme boyutu :
1.63 GiBVeri kümesi boyutu :
13.89 GiBOtomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 3.000 | 
 'train' | 37.858.512 | 
 'validation' | 3.001 | 
- Özellik yapısı :
 
Translation({
    'en': Text(shape=(), dtype=string),
    'ru': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| tr | Metin | sicim | ||
| ru | Metin | sicim | 
Denetlenen anahtarlar (Bkz
as_superviseddoc ):('ru', 'en')Örnekler ( tfds.as_dataframe ):
wmt18_translate/tr-tr
Yapılandırma açıklaması : WMT 2018 tr-en çeviri görevi veri kümesi.
İndirme boyutu :
59.32 MiBVeri kümesi boyutu :
63.78 MiBOtomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 3.000 | 
 'train' | 205.756 | 
 'validation' | 3.007 | 
- Özellik yapısı :
 
Translation({
    'en': Text(shape=(), dtype=string),
    'tr': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| tr | Metin | sicim | ||
| tr | Metin | sicim | 
Denetlenen anahtarlar (Bkz
as_superviseddoc ):('tr', 'en')Örnekler ( tfds.as_dataframe ):
wmt18_translate/zh-tr
Yapılandırma açıklaması : WMT 2018 zh-en çeviri görevi veri kümesi.
İndirme boyutu :
831.45 MiBVeri kümesi boyutu :
6.43 GiBOtomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 3.981 | 
 'train' | 25.162.209 | 
 'validation' | 2.001 | 
- Özellik yapısı :
 
Translation({
    'en': Text(shape=(), dtype=string),
    'zh': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| Tercüme | ||||
| tr | Metin | sicim | ||
| zh | Metin | sicim | 
Denetlenen anahtarlar (Bkz
as_superviseddoc ):('zh', 'en')Örnekler ( tfds.as_dataframe ):