- الوصف :
مجموعة بيانات حوار الخصومة الآلية.
تم تصنيف مجموعات بيانات الحوار على أنها هجومية من مهمة Bot Adversarial Dialogue. تم جمع الحوارات من خلال مطالبة البشر بالتحدث بشكل عدائي مع الروبوتات.
مزيد من التفاصيل في الورقة .
الصفحة الرئيسية : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
كود المصدر :
tfds.datasets.bot_adversarial_dialogue.Builderالإصدارات :
-
1.0.0(افتراضي): الإصدار الأولي.
-
التخزين المؤقت التلقائي ( الوثائق ): نعم
المفاتيح الخاضعة للإشراف (راجع
as_superviseddoc ):Noneالشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :
@misc{xu2021recipes,
title={Recipes for Safety in Open-domain Chatbots},
author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
year={2021},
eprint={2010.07079},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
bot_adversarial_dialogue/dialogue_datasets (التكوين الافتراضي)
وصف التكوين : مجموعات بيانات الحوار، مقسمة إلى أقسام التدريب والتحقق والاختبار.
حجم التحميل :
3.06 MiBحجم مجموعة البيانات :
23.38 MiBالإنشقاقات :
| ينقسم | أمثلة |
|---|---|
'test' | 2,598 |
'train' | 69,274 |
'valid' | 7,002 |
- هيكل الميزة :
FeaturesDict({
'bot_persona': Sequence(Text(shape=(), dtype=string)),
'dialogue_id': float32,
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'round_id': float32,
'speaker_to_eval': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع D | وصف |
|---|---|---|---|---|
| المميزاتDict | ||||
| bot_persona | التسلسل (النص) | (لا أحد،) | خيط | الشخصية التي ينتحلها الروبوت. |
| معرف الحوار | الموتر | float32 | ||
| الحلقة_تم | الموتر | منطقي | ||
| بطاقة تعريف | نص | خيط | معرف العينة | |
| تسميات | ClassLabel | int64 | ||
| round_id | الموتر | float32 | ||
| talk_to_eval | نص | خيط | المتكلم من الأقوال المسمى. | |
| نص | نص | خيط | الكلام للتصنيف. |
- أمثلة ( tfds.as_dataframe ):
bot_adversarial_dialogue/human_nonadv_safety_eval
وصف التكوين : تم تقييم مجموعة تقييم السلامة البشرية بواسطة العاملين في التعهيد الجماعي للتأكد من مدى الهجوم.
حجم التحميل :
10.57 KiBحجم مجموعة البيانات :
34.55 KiBالإنشقاقات :
| ينقسم | أمثلة |
|---|---|
'test' | 180 |
- هيكل الميزة :
FeaturesDict({
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'text': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع D | وصف |
|---|---|---|---|---|
| المميزاتDict | ||||
| الحلقة_تم | الموتر | منطقي | ||
| بطاقة تعريف | نص | خيط | معرف العينة | |
| تسميات | ClassLabel | int64 | ||
| نص | نص | خيط | الكلام للتصنيف. |
- أمثلة ( tfds.as_dataframe ):