- বর্ণনা :
MC-TACO হল 13k প্রশ্ন-উত্তর জোড়ার একটি ডেটাসেট যার জন্য টেম্পোরাল কমনসেন্স বোধগম্যতা প্রয়োজন। ডেটাসেটে পাঁচটি অস্থায়ী বৈশিষ্ট্য রয়েছে:
- সময়কাল (একটি ঘটনা কতক্ষণ নেয়)
- সাময়িক আদেশ (ঘটনার সাধারণ ক্রম)
- সাধারণ সময় (যখন একটি ঘটনা ঘটে)
- ফ্রিকোয়েন্সি (কতবার একটি ঘটনা ঘটে)
- স্থিতিশীলতা (একটি রাষ্ট্র খুব দীর্ঘ সময়ের জন্য বা অনির্দিষ্টকালের জন্য বজায় রাখা হয়)
আমরা আশা করি যে এই ডেটাসেটটি এই বিশেষ শ্রেণীর যুক্তি সমস্যাগুলির ভবিষ্যতের অন্বেষণকে উন্নীত করতে পারে।
অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন
হোমপেজ : https://github.com/CogComp/MCTACO
সোর্স কোড :
tfds.datasets.mctaco.Builderসংস্করণ :
-
1.0.0(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড সাইজ :
2.27 MiBডেটাসেটের আকার :
3.18 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | ৯,৪৪২ |
'validation' | ৩,৭৮৩ |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'question': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| উত্তর | পাঠ্য | স্ট্রিং | ||
| বিভাগ | ক্লাসলেবেল | int64 | ||
| লেবেল | ক্লাসলেবেল | int64 | ||
| প্রশ্ন | পাঠ্য | স্ট্রিং | ||
| বাক্য | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):Noneচিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@inproceedings{ZKNR19,
author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
booktitle = {EMNLP},
year = {2019},
}