- คำอธิบาย :
Web-Scale Parallel Corpora สำหรับภาษาทางการของยุโรป
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
หน้าแรก : https://paracrawl.eu/releases.html
รหัสที่มา :
tfds.datasets.para_crawl.Builderรุ่น :
-
1.2.0(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
การอ้างอิง :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl/enbg (การกำหนดค่าเริ่มต้น)
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น bg
ขนาดการดาวน์โหลด :
98.94 MiBขนาดชุดข้อมูล :
362.46 MiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,039,885 |
- โครงสร้างคุณลักษณะ :
Translation({
'bg': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| บีจี | ข้อความ | สตริง | ||
| th | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'bg')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/encs
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น cs
ขนาดการดาวน์โหลด :
187.31 MiBขนาดชุดข้อมูล :
666.34 MiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 2,981,949 |
- โครงสร้างคุณลักษณะ :
Translation({
'cs': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| ค | ข้อความ | สตริง | ||
| th | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'cs')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enda
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นภาษาดา
ขนาดการดาวน์โหลด :
174.34 MiBขนาดชุดข้อมูล :
619.77 MiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 2,414,895 |
- โครงสร้างคุณลักษณะ :
Translation({
'da': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| ดา | ข้อความ | สตริง | ||
| th | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'da')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/สิ้นสุด
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นภาษาเด
ขนาดการดาวน์โหลด :
1.22 GiBขนาดชุดข้อมูล :
4.04 GiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 16,264,448 |
- โครงสร้างคุณลักษณะ :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| เดอ | ข้อความ | สตริง | ||
| th | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'de')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enel
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นเอล
ขนาดการดาวน์โหลด :
184.59 MiBขนาดชุดข้อมูล :
698.75 MiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,985,233 |
- โครงสร้างคุณลักษณะ :
Translation({
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| เอล | ข้อความ | สตริง | ||
| th | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'el')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enes
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น es
ขนาดการดาวน์โหลด :
1.82 GiBขนาดชุดข้อมูล :
6.23 GiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 21,987,267 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| อี | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'es')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enet
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น et
ขนาดการดาวน์โหลด :
66.91 MiBขนาดชุดข้อมูล :
209.16 MiBแคชอัตโนมัติ ( เอกสาร ): เฉพาะเมื่อ
shuffle_files=False(รถไฟ)แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 853,422 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'et': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| เป็นต้น | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'et')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enfi
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น fi
ขนาดการดาวน์โหลด :
151.83 MiBขนาดชุดข้อมูล :
543.85 MiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 2,156,069 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'fi': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| ไฟ | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'fi')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enfr
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นภาษาฝรั่งเศส
ขนาดการดาวน์โหลด :
2.63 GiBขนาดชุดข้อมูล :
9.04 GiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 31,374,161 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| fr | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'fr')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enga
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น ga
ขนาดการดาวน์โหลด :
28.03 MiBขนาดชุดข้อมูล :
107.09 MiBแคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 357,399 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'ga': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| กา | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'ga')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enhr
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นชั่วโมง
ขนาดการดาวน์โหลด :
80.97 MiBขนาดชุดข้อมูล :
256.37 MiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,002,053 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'hr': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| ชม | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'hr')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enhu
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น hu
ขนาดการดาวน์โหลด :
114.24 MiBขนาดชุดข้อมูล :
421.40 MiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,901,342 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'hu': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| ฮ | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'hu')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enit
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น
ขนาดการดาวน์โหลด :
1017.30 MiBขนาดชุดข้อมูล :
3.36 GiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 12,162,239 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'it': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| มัน | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'it')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enlt
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น lt
ขนาดการดาวน์โหลด :
63.28 MiBขนาดชุดข้อมูล :
204.70 MiBแคชอัตโนมัติ ( เอกสาร ): เฉพาะเมื่อ
shuffle_files=False(รถไฟ)แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 844,643 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'lt': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| ร.ท | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'lt')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enlv
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น lv
ขนาดการดาวน์โหลด :
45.17 MiBขนาดชุดข้อมูล :
147.09 MiBแคชอัตโนมัติ ( เอกสาร ): เฉพาะเมื่อ
shuffle_files=False(รถไฟ)แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 553,060 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'lv': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| เลเวล | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'lv')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enmt
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นภูเขา
ขนาดการดาวน์โหลด :
18.15 MiBขนาดชุดข้อมูล :
54.36 MiBแคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 195,502 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'mt': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| ภูเขา | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'mt')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/ennl
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น nl
ขนาดการดาวน์โหลด :
400.63 MiBขนาดชุดข้อมูล :
1.40 GiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 5,659,268 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'nl': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| nl | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'nl')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enpl
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น pl
ขนาดการดาวน์โหลด :
257.90 MiBขนาดชุดข้อมูล :
885.63 MiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 3,503,276 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'pl': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| กรุณา | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'pl')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enpt
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น pt
ขนาดการดาวน์โหลด :
608.62 MiBขนาดชุดข้อมูล :
2.05 GiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 8,141,940 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| พ | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'pt')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enro
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น ro
ขนาดการดาวน์โหลด :
153.24 MiBขนาดชุดข้อมูล :
534.34 MiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,952,043 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'ro': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| ro | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'ro')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/ensk
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นภาษา sk
ขนาดการดาวน์โหลด :
96.61 MiBขนาดชุดข้อมูล :
352.91 MiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 1,591,831 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'sk': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| สก | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'sk')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/ensl
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น sl
ขนาดการดาวน์โหลด :
62.02 MiBขนาดชุดข้อมูล :
187.66 MiBแคชอัตโนมัติ ( เอกสาร ): เฉพาะเมื่อ
shuffle_files=False(รถไฟ)แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 660,161 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'sl': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| ส | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'sl')ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/ensv
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น sv
ขนาดการดาวน์โหลด :
262.76 MiBขนาดชุดข้อมูล :
905.72 MiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'train' | 3,476,729 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'sv': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| แปล | ||||
| th | ข้อความ | สตริง | ||
| sv | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('en', 'sv')ตัวอย่าง ( tfds.as_dataframe ):