- विवरण :
GoEmotions डेटासेट में 58k सावधानी से क्यूरेट की गई Reddit टिप्पणियाँ शामिल हैं जिन्हें 27 भावना श्रेणियों या तटस्थ के लिए लेबल किया गया है। भावना श्रेणियां प्रशंसा, मनोरंजन, क्रोध, झुंझलाहट, अनुमोदन, देखभाल, भ्रम, जिज्ञासा, इच्छा, निराशा, अस्वीकृति, घृणा, शर्मिंदगी, उत्तेजना, भय, कृतज्ञता, शोक, आनंद, प्रेम, घबराहट, आशावाद, गर्व, अहसास हैं। राहत, पश्चाताप, उदासी, आश्चर्य।
अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें
होमपेज : https://github.com/google-research/google-research/tree/master/goemotions
स्रोत कोड :
tfds.text.Goemotionsसंस्करण :
-
0.1.0(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
4.19 MiBडेटासेट का आकार :
32.25 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'test' | 5,427 |
'train' | 43,410 |
'validation' | 5,426 |
- फ़ीचर संरचना :
FeaturesDict({
'admiration': bool,
'amusement': bool,
'anger': bool,
'annoyance': bool,
'approval': bool,
'caring': bool,
'comment_text': Text(shape=(), dtype=string),
'confusion': bool,
'curiosity': bool,
'desire': bool,
'disappointment': bool,
'disapproval': bool,
'disgust': bool,
'embarrassment': bool,
'excitement': bool,
'fear': bool,
'gratitude': bool,
'grief': bool,
'joy': bool,
'love': bool,
'nervousness': bool,
'neutral': bool,
'optimism': bool,
'pride': bool,
'realization': bool,
'relief': bool,
'remorse': bool,
'sadness': bool,
'surprise': bool,
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| प्रशंसा | टेन्सर | बूल | ||
| मनोरंजन | टेन्सर | बूल | ||
| क्रोध | टेन्सर | बूल | ||
| चिढ़ | टेन्सर | बूल | ||
| अनुमोदन | टेन्सर | बूल | ||
| देखभाल करने वाला | टेन्सर | बूल | ||
| comment_text | मूलपाठ | डोरी | ||
| उलझन | टेन्सर | बूल | ||
| जिज्ञासा | टेन्सर | बूल | ||
| इच्छा | टेन्सर | बूल | ||
| निराशा | टेन्सर | बूल | ||
| अस्वीकृति | टेन्सर | बूल | ||
| घृणा | टेन्सर | बूल | ||
| शर्मिंदगी | टेन्सर | बूल | ||
| उत्साह | टेन्सर | बूल | ||
| डर | टेन्सर | बूल | ||
| कृतज्ञता | टेन्सर | बूल | ||
| शोक | टेन्सर | बूल | ||
| हर्ष | टेन्सर | बूल | ||
| प्यार | टेन्सर | बूल | ||
| घबराहट | टेन्सर | बूल | ||
| तटस्थ | टेन्सर | बूल | ||
| आशावाद | टेन्सर | बूल | ||
| गौरव | टेन्सर | बूल | ||
| वसूली | टेन्सर | बूल | ||
| राहत | टेन्सर | बूल | ||
| आत्मा ग्लानि | टेन्सर | बूल | ||
| उदासी | टेन्सर | बूल | ||
| आश्चर्य | टेन्सर | बूल |
पर्यवेक्षित कुंजियाँ (
as_superviseddoc देखें):Noneचित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@inproceedings{demszky-2020-goemotions,
title = "{G}o{E}motions: A Dataset of Fine-Grained Emotions",
author = "Demszky, Dorottya and
Movshovitz-Attias, Dana and
Ko, Jeongwoo and
Cowen, Alan and
Nemade, Gaurav and
Ravi, Sujith",
booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
month = jul,
year = "2020",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.acl-main.372",
pages = "4040--4054",
}