- Descriptif :
L'ensemble de données GoEmotions contient 58 000 commentaires Reddit soigneusement sélectionnés, étiquetés pour 27 catégories d'émotions ou neutres. Les catégories d'émotions sont l'admiration, l'amusement, la colère, l'agacement, l'approbation, l'attention, la confusion, la curiosité, le désir, la déception, la désapprobation, le dégoût, l'embarras, l'excitation, la peur, la gratitude, le chagrin, la joie, l'amour, la nervosité, l'optimisme, la fierté, la réalisation, soulagement, remords, tristesse, surprise.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://github.com/google-research/google-research/tree/master/goemotions
Code source :
tfds.text.GoemotionsVersions :
-
0.1.0(par défaut) : aucune note de version.
-
Taille du téléchargement :
4.19 MiBTaille du jeu de données :
32.25 MiBMise en cache automatique ( documentation ): Oui
Fractionnements :
| Diviser | Exemples |
|---|---|
'test' | 5 427 |
'train' | 43 410 |
'validation' | 5 426 |
- Structure des fonctionnalités :
FeaturesDict({
'admiration': bool,
'amusement': bool,
'anger': bool,
'annoyance': bool,
'approval': bool,
'caring': bool,
'comment_text': Text(shape=(), dtype=string),
'confusion': bool,
'curiosity': bool,
'desire': bool,
'disappointment': bool,
'disapproval': bool,
'disgust': bool,
'embarrassment': bool,
'excitement': bool,
'fear': bool,
'gratitude': bool,
'grief': bool,
'joy': bool,
'love': bool,
'nervousness': bool,
'neutral': bool,
'optimism': bool,
'pride': bool,
'realization': bool,
'relief': bool,
'remorse': bool,
'sadness': bool,
'surprise': bool,
})
- Documentation des fonctionnalités :
| Caractéristique | Classer | Forme | Dtype | La description |
|---|---|---|---|---|
| FonctionnalitésDict | ||||
| admiration | Tenseur | bourdonner | ||
| amusement | Tenseur | bourdonner | ||
| colère | Tenseur | bourdonner | ||
| contrariété | Tenseur | bourdonner | ||
| approbation | Tenseur | bourdonner | ||
| soins | Tenseur | bourdonner | ||
| commentaire_texte | Texte | chaîne de caractères | ||
| confusion | Tenseur | bourdonner | ||
| curiosité | Tenseur | bourdonner | ||
| désir | Tenseur | bourdonner | ||
| déception | Tenseur | bourdonner | ||
| désapprobation | Tenseur | bourdonner | ||
| dégoûter | Tenseur | bourdonner | ||
| embarras | Tenseur | bourdonner | ||
| excitation | Tenseur | bourdonner | ||
| craindre | Tenseur | bourdonner | ||
| Reconnaissance | Tenseur | bourdonner | ||
| douleur | Tenseur | bourdonner | ||
| joie | Tenseur | bourdonner | ||
| aimer | Tenseur | bourdonner | ||
| nervosité | Tenseur | bourdonner | ||
| neutre | Tenseur | bourdonner | ||
| optimisme | Tenseur | bourdonner | ||
| Orgueil | Tenseur | bourdonner | ||
| la concrétisation | Tenseur | bourdonner | ||
| le soulagement | Tenseur | bourdonner | ||
| remords | Tenseur | bourdonner | ||
| tristesse | Tenseur | bourdonner | ||
| surprendre | Tenseur | bourdonner |
Clés supervisées (Voir
as_superviseddoc ):NoneFigure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{demszky-2020-goemotions,
title = "{G}o{E}motions: A Dataset of Fine-Grained Emotions",
author = "Demszky, Dorottya and
Movshovitz-Attias, Dana and
Ko, Jeongwoo and
Cowen, Alan and
Nemade, Gaurav and
Ravi, Sujith",
booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
month = jul,
year = "2020",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.acl-main.372",
pages = "4040--4054",
}