- विवरण :
कॉन्टेक्स्ट में प्रश्न उत्तर मॉडलिंग, समझ और सूचना मांगने वाले संवाद में भाग लेने के लिए एक डेटासेट है। डेटा उदाहरणों में दो क्राउड वर्कर्स के बीच एक संवादात्मक संवाद शामिल होता है: (1) एक छात्र जो एक छिपे हुए विकिपीडिया पाठ के बारे में जितना संभव हो सके सीखने के लिए फ्रीफॉर्म प्रश्नों का एक क्रम प्रस्तुत करता है, और (2) एक शिक्षक जो छोटे अंश प्रदान करके प्रश्नों का उत्तर देता है। (विस्तार) पाठ से। QuAC मौजूदा मशीन कॉम्प्रिहेंशन डेटासेट में नहीं पाई जाने वाली चुनौतियों का परिचय देता है: इसके प्रश्न अक्सर अधिक ओपन-एंडेड, अनुत्तरदायी या केवल संवाद संदर्भ में सार्थक होते हैं।
अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें
होमपेज : https://quac.ai/
स्रोत कोड :
tfds.datasets.quac.Builderसंस्करण :
-
1.0.0(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
डाउनलोड आकार :
73.47 MiBडेटासेट का आकार :
298.04 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 83,568 |
'validation' | 7,354 |
- फ़ीचर संरचना :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'background': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'followup': Text(shape=(), dtype=string),
'orig_answer': FeaturesDict({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'question': Text(shape=(), dtype=string),
'section_title': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'yesno': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| जवाब | क्रम | |||
| उत्तर/जवाब_शुरू | टेन्सर | int32 | ||
| उत्तर/पाठ | मूलपाठ | डोरी | ||
| पार्श्वभूमि | मूलपाठ | डोरी | ||
| संदर्भ | मूलपाठ | डोरी | ||
| आगे की कार्रवाई करना | मूलपाठ | डोरी | ||
| मूल_उत्तर | विशेषताएं डिक्ट | |||
| orig_answer/answer_start | टेन्सर | int32 | ||
| मूल_उत्तर/पाठ | मूलपाठ | डोरी | ||
| प्रश्न | मूलपाठ | डोरी | ||
| अनुभाग शीर्षक | मूलपाठ | डोरी | ||
| शीर्षक | मूलपाठ | डोरी | ||
| हाँ नही | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_superviseddoc देखें):('context', 'answers')चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@article{choi2018quac,
title={Quac: Question answering in context},
author={Choi, Eunsol and He, He and Iyyer, Mohit and Yatskar, Mark and Yih, Wen-tau and Choi, Yejin and Liang, Percy and Zettlemoyer, Luke},
journal={arXiv preprint arXiv:1808.07036},
year={2018}
}