- বর্ণনা :
OPUS হল ওয়েব থেকে অনূদিত পাঠ্যের একটি সংগ্রহ৷
কোন ডেটা/ভাষা জোড়া লোড করতে হবে তা বেছে নিতে আপনার নিজস্ব কনফিগারেশন তৈরি করুন।
config = tfds.translate.opus.OpusConfig(
version=tfds.core.Version('0.1.0'),
language_pair=("de", "en"),
subsets=["GNOME", "EMEA"]
)
builder = tfds.builder("opus", config=config)
অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন
হোমপেজ : http://opus.nlpl.eu/
সোর্স কোড :
tfds.datasets.opus.Builderসংস্করণ :
-
0.1.0(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
বৈশিষ্ট্য গঠন :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| অনুবাদ | ||||
| ডি | পাঠ্য | স্ট্রিং | ||
| en | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):('de', 'en')চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@inproceedings{Tiedemann2012ParallelData,
author = {Tiedemann, J},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {LREC}
year = {2012} }
ওপাস/মেডিকেল (ডিফল্ট কনফিগারেশন)
কনফিগারেশনের বিবরণ : মেডিকেল নথি
ডাউনলোড আকার :
34.29 MiBডেটাসেটের আকার :
188.85 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন
shuffle_files=False(ট্রেন)বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 1,108,752 |
- উদাহরণ ( tfds.as_dataframe ):
রচনা/আইন
কনফিগার বিবরণ : আইন নথি
ডাউনলোডের আকার :
46.99 MiBডেটাসেটের আকার :
214.44 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন
shuffle_files=False(ট্রেন)বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 719,372 |
- উদাহরণ ( tfds.as_dataframe ):
রচনা/কোরান
কনফিগারেশনের বিবরণ : কোরান নথি
ডাউনলোড সাইজ :
35.42 MiBডেটাসেটের আকার :
117.54 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 537,128 |
- উদাহরণ ( tfds.as_dataframe ):
রচনা/আইটি
কনফিগারেশনের বিবরণ : আইটি নথি
ডাউনলোড সাইজ :
10.33 MiBডেটাসেটের আকার :
42.51 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 347,817 |
- উদাহরণ ( tfds.as_dataframe ):
রচনা/সাবটাইটেল
কনফিগারেশনের বিবরণ : সাবটাইটেল নথি
ডাউনলোড সাইজ :
677.64 MiBডেটাসেটের আকার :
2.01 GiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 22,512,639 |
- উদাহরণ ( tfds.as_dataframe ):