- توضیحات :
مجموعه داده ای حاوی 14 هزار مکالمه با 81 هزار جفت پرسش و پاسخ. QReCC بر اساس سوالات TREC CAsT، QuAC و Google Natural Questions ساخته شده است.
صفحه اصلی : https://github.com/apple/ml-qrecc
کد منبع :
tfds.text.qrecc.QReCCنسخه ها :
-
1.0.0(پیش فرض): انتشار اولیه.
-
حجم دانلود :
7.60 MiBحجم مجموعه داده :
69.29 MiBذخیره خودکار ( اسناد ): بله
تقسیمات :
| تقسیم کنید | نمونه ها |
|---|---|
'test' | 16,451 |
'train' | 63,501 |
- ساختار ویژگی :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'answer_url': Text(shape=(), dtype=string),
'context': Sequence(Text(shape=(), dtype=string)),
'conversation_id': Scalar(shape=(), dtype=int32, description=The id of the conversation.),
'question': Text(shape=(), dtype=string),
'question_rewrite': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'turn_id': Scalar(shape=(), dtype=int32, description=The id of the conversation turn, within a conversation.),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | توضیحات |
|---|---|---|---|---|
| FeaturesDict | ||||
| پاسخ دهید | متن | رشته | ||
| answer_url | متن | رشته | ||
| زمینه | دنباله (متن) | (هیچ،) | رشته | |
| گفتگو_id | اسکالر | int32 | شناسه مکالمه | |
| سوال | متن | رشته | ||
| سوال_بازنویسی | متن | رشته | ||
| منبع | متن | رشته | منبع اصلی داده ها - QuAC، CAsT یا Natural Questions | |
| turn_id | اسکالر | int32 | شناسه مکالمه در یک مکالمه تبدیل می شود. |
کلیدهای نظارت شده (به
as_superviseddoc مراجعه کنید):Noneشکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@article{qrecc,
title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
year={2021}
}