- বর্ণনা :
স্কিমা-গাইডেড ডায়ালগ (SGD) ডেটাসেটে 20k টীকাযুক্ত মাল্টি-ডোমেন, একজন মানুষ এবং একজন ভার্চুয়াল সহকারীর মধ্যে টাস্ক-ভিত্তিক কথোপকথন রয়েছে। এই কথোপকথনে ব্যাঙ্ক এবং ইভেন্ট থেকে শুরু করে মিডিয়া, ক্যালেন্ডার, ভ্রমণ এবং আবহাওয়া পর্যন্ত 20টি ডোমেন বিস্তৃত পরিষেবা এবং API-এর সাথে মিথস্ক্রিয়া জড়িত। এই ডোমেনগুলির বেশিরভাগের জন্য, ডেটাসেটে একাধিক ভিন্ন API রয়েছে, যার মধ্যে অনেকের ওভারল্যাপিং কার্যকারিতা রয়েছে কিন্তু ভিন্ন ইন্টারফেস রয়েছে, যা সাধারণ বাস্তব-বিশ্বের পরিস্থিতি প্রতিফলিত করে। উপলভ্য টীকাগুলির বিস্তৃত পরিসর উদ্দেশ্য ভবিষ্যদ্বাণী, স্লট ফিলিং, ডায়ালগ স্টেট ট্র্যাকিং, নীতি অনুকরণ শেখার, ভাষা তৈরি, ব্যবহারকারীর সিমুলেশন শেখার জন্য ব্যবহার করা যেতে পারে, বড় আকারের ভার্চুয়াল সহকারীর অন্যান্য কাজের মধ্যে। এগুলি ছাড়াও, শূন্য-শট বা কয়েকটি শট সেটিংসে কর্মক্ষমতা পরিমাপ করার জন্য মূল্যায়ন সেটে ডেটাসেটের অদেখা ডোমেন এবং পরিষেবা রয়েছে।
অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন
হোমপেজ : https://github.com/google-research-datasets/dstc8-schema-guided-dialogue
উত্স কোড :
tfds.datasets.schema_guided_dialogue.Builderসংস্করণ :
-
1.0.0(ডিফল্ট): প্রাথমিক প্রকাশ।
-
ডাউনলোড সাইজ :
35.12 MiBডেটাসেটের আকার :
25.36 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'dev' | 2,482 |
'test' | 4,201 |
'train' | 16,142 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
'metadata': FeaturesDict({
'services': Sequence({
'name': string,
}),
}),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| প্রথম_স্পীকার | ক্লাসলেবেল | int64 | ||
| মেটাডেটা | ফিচারসডিক্ট | |||
| মেটাডেটা/পরিষেবা | ক্রম | |||
| মেটাডেটা/পরিষেবা/নাম | টেনসর | স্ট্রিং | ||
| উচ্চারণ | ক্রম (পাঠ্য) | (কোনটিই নয়,) | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):Noneচিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@article{rastogi2019towards,
title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
journal={arXiv preprint arXiv:1909.05855},
year={2019}
}