- คำอธิบาย :
ข้อมูลนี้ดึงมาจาก Tatoeba corpus ลงวันที่ 11/2018/11/17
สำหรับแต่ละภาษา เราได้เลือก 1,000 ประโยคภาษาอังกฤษและคำแปล ถ้ามี โปรดตรวจสอบเอกสารนี้เพื่อดูคำอธิบายของภาษา ตระกูลและสคริปต์ รวมทั้งผลลัพธ์พื้นฐาน
โปรดทราบว่าประโยคภาษาอังกฤษนั้นไม่เหมือนกันสำหรับทุกคู่ภาษา ซึ่งหมายความว่าผลลัพธ์จะไม่สามารถเปรียบเทียบได้โดยตรงในภาษาต่างๆ
โฮมเพจ : http://opus.nlpl.eu/Tatoeba.php
รหัสที่มา :
tfds.datasets.tatoeba.Builderรุ่น :
-
1.0.0(ค่าเริ่มต้น): การเปิดตัวครั้งแรก
-
แคชอัตโนมัติ ( เอกสาร ): ใช่
โครงสร้างคุณลักษณะ :
FeaturesDict({
'source_language': Text(shape=(), dtype=string),
'source_sentence': Text(shape=(), dtype=string),
'target_language': Text(shape=(), dtype=string),
'target_sentence': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| คุณสมบัติDict | ||||
| source_language | ข้อความ | สตริง | ||
| source_sentence | ข้อความ | สตริง | ||
| ภาษาเป้าหมาย | ข้อความ | สตริง | ||
| target_sentence | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):Noneรูปภาพ ( tfds.show_examples ): ไม่รองรับ
การอ้างอิง :
@article{tatoeba,
title={Massively Multilingual Sentence Embeddings for Zero-Shot
Cross-Lingual Transfer and Beyond},
author={Mikel, Artetxe and Holger, Schwenk,},
journal={arXiv:1812.10464v2},
year={2018}
}
@InProceedings{TIEDEMANN12.463,
author = {J{\"o}rg}rg Tiedemann},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
year = {2012},
month = {may},
date = {23-25},
address = {Istanbul, Turkey},
editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
publisher = {European Language Resources Association (ELRA)},
isbn = {978-2-9517408-7-7},
language = {english}
}
tatoeba/tatoeba_af (การกำหนดค่าเริ่มต้น)
ขนาดการดาวน์โหลด :
58.24 KiBขนาดชุดข้อมูล :
162.74 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ar
ขนาดการดาวน์โหลด :
70.95 KiBขนาดชุดข้อมูล :
175.46 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_bg
ขนาดการดาวน์โหลด :
99.88 KiBขนาดชุดข้อมูล :
204.64 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_bn
ขนาดการดาวน์โหลด :
89.55 KiBขนาดชุดข้อมูล :
194.24 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_de
ขนาดการดาวน์โหลด :
103.09 KiBขนาดชุดข้อมูล :
207.93 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_el
ขนาดการดาวน์โหลด :
77.11 KiBขนาดชุดข้อมูล :
181.65 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_es
ขนาดการดาวน์โหลด :
70.57 KiBขนาดชุดข้อมูล :
175.12 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_et
ขนาดการดาวน์โหลด :
58.33 KiBขนาดชุดข้อมูล :
162.85 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_eu
ขนาดการดาวน์โหลด :
64.52 KiBขนาดชุดข้อมูล :
169.02 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_fa
ขนาดการดาวน์โหลด :
91.52 KiBขนาดชุดข้อมูล :
196.15 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_fi
ขนาดการดาวน์โหลด :
73.90 KiBขนาดชุดข้อมูล :
178.47 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_fr
ขนาดการดาวน์โหลด :
78.14 KiBขนาดชุดข้อมูล :
182.68 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_he
ขนาดการดาวน์โหลด :
81.54 KiBขนาดชุดข้อมูล :
186.15 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_hi
ขนาดการดาวน์โหลด :
119.69 KiBขนาดชุดข้อมูล :
224.89 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_hu
ขนาดการดาวน์โหลด :
67.27 KiBขนาดชุดข้อมูล :
171.78 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_id
ขนาดการดาวน์โหลด :
73.09 KiBขนาดชุดข้อมูล :
177.61 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_it
ขนาดการดาวน์โหลด :
64.29 KiBขนาดชุดข้อมูล :
168.81 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ja
ขนาดการดาวน์โหลด :
90.90 KiBขนาดชุดข้อมูล :
195.53 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_jv
ขนาดการดาวน์โหลด :
13.59 KiBขนาดชุดข้อมูล :
35.01 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 205 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ka
ขนาดการดาวน์โหลด :
70.47 KiBขนาดชุดข้อมูล :
148.67 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 746 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_kk
ขนาดการดาวน์โหลด :
46.07 KiBขนาดชุดข้อมูล :
106.25 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 575 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ko
ขนาดการดาวน์โหลด :
77.28 KiBขนาดชุดข้อมูล :
181.88 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ml
ขนาดการดาวน์โหลด :
92.50 KiBขนาดชุดข้อมูล :
165.14 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 687 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_mr
ขนาดการดาวน์โหลด :
98.19 KiBขนาดชุดข้อมูล :
202.96 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_nl
ขนาดการดาวน์โหลด :
71.55 KiBขนาดชุดข้อมูล :
176.10 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_pt
ขนาดการดาวน์โหลด :
73.42 KiBขนาดชุดข้อมูล :
177.95 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ru
ขนาดการดาวน์โหลด :
90.30 KiBขนาดชุดข้อมูล :
194.92 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_sw
ขนาดการดาวน์โหลด :
19.99 KiBขนาดชุดข้อมูล :
60.75 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 390 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ta
ขนาดการดาวน์โหลด :
38.52 KiBขนาดชุดข้อมูล :
70.93 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 307 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_te
ขนาดการดาวน์โหลด :
24.55 KiBขนาดชุดข้อมูล :
49.07 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 234 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_th
ขนาดการดาวน์โหลด :
61.72 KiBขนาดชุดข้อมูล :
119.32 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 548 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_tl
ขนาดการดาวน์โหลด :
66.54 KiBขนาดชุดข้อมูล :
171.04 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_tr
ขนาดการดาวน์โหลด :
70.20 KiBขนาดชุดข้อมูล :
174.70 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_ur
ขนาดการดาวน์โหลด :
86.63 KiBขนาดชุดข้อมูล :
191.20 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_vi
ขนาดการดาวน์โหลด :
89.26 KiBขนาดชุดข้อมูล :
193.89 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
tatoeba/tatoeba_zh
ขนาดการดาวน์โหลด :
67.32 KiBขนาดชุดข้อมูล :
171.85 KiBแยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,000 |
- ตัวอย่าง ( tfds.as_dataframe ):