- विवरण :
उत्तर तुल्यता डेटासेट में SQuAD डेटासेट पर कई मॉडलों से मॉडल भविष्यवाणियों पर मानव रेटिंग शामिल हैं। रेटिंग यह स्थापित करती हैं कि अनुमानित उत्तर सोने के उत्तर के 'समतुल्य' है (प्रश्न और संदर्भ दोनों को ध्यान में रखते हुए)।
अधिक विशेष रूप से, 'समतुल्य' से हमारा मतलब है कि अनुमानित उत्तर में कम से कम वही जानकारी होती है जो सोने के उत्तर में होती है और इसमें अनावश्यक जानकारी नहीं होती है। डेटासेट में निम्नलिखित के लिए एनोटेशन शामिल हैं: * SQuAD देव पर BiDAF से भविष्यवाणियां * SQuAD देव पर XLNet से भविष्यवाणियां * SQuAD देव पर ल्यूक से भविष्यवाणियां * SQuAD प्रशिक्षण, देव और परीक्षण उदाहरणों पर अल्बर्ट से भविष्यवाणियां
मुखपृष्ठ : https://github.com/google-research-datasets/answer-equivalence-dataset
स्रोत कोड :
tfds.datasets.answer_equivalence.Builderसंस्करण :
-
1.0.0(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
डाउनलोड आकार :
45.86 MiBडेटासेट का आकार :
47.24 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'ae_dev' | 4,446 |
'ae_test' | 9,724 |
'dev_bidaf' | 7,522 |
'dev_luke' | 4,590 |
'dev_xlnet' | 7,932 |
'train' | 9,090 |
- फ़ीचर संरचना :
FeaturesDict({
'candidate': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'gold_index': int32,
'qid': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'question_1': ClassLabel(shape=(), dtype=int64, num_classes=3),
'question_2': ClassLabel(shape=(), dtype=int64, num_classes=3),
'question_3': ClassLabel(shape=(), dtype=int64, num_classes=3),
'question_4': ClassLabel(shape=(), dtype=int64, num_classes=3),
'reference': Text(shape=(), dtype=string),
'score': float32,
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| उम्मीदवार | मूलपाठ | डोरी | ||
| संदर्भ | मूलपाठ | डोरी | ||
| gold_index | टेन्सर | int32 | ||
| qid | मूलपाठ | डोरी | ||
| प्रश्न | मूलपाठ | डोरी | ||
| प्रश्न 1 | क्लासलेबल | int64 | ||
| प्रश्न 2 | क्लासलेबल | int64 | ||
| प्रश्न 3 | क्लासलेबल | int64 | ||
| प्रश्न_4 | क्लासलेबल | int64 | ||
| संदर्भ | मूलपाठ | डोरी | ||
| अंक | टेन्सर | फ्लोट32 |
पर्यवेक्षित कुंजियाँ (
as_superviseddoc देखें):Noneचित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@article{bulian-etal-2022-tomayto,
title={Tomayto, Tomahto. Beyond Token-level Answer Equivalence for Question Answering Evaluation},
author={Jannis Bulian and Christian Buck and Wojciech Gajewski and Benjamin Boerschinger and Tal Schuster},
year={2022},
eprint={2202.07654},
archivePrefix={arXiv},
primaryClass={cs.CL}
}