- Описание :
Набор данных GoEmotions содержит 58 000 тщательно отобранных комментариев Reddit, помеченных для 27 категорий эмоций или нейтральных. Категории эмоций: восхищение, веселье, гнев, раздражение, одобрение, забота, замешательство, любопытство, желание, разочарование, неодобрение, отвращение, смущение, волнение, страх, благодарность, горе, радость, любовь, нервозность, оптимизм, гордость, осознание, облегчение, раскаяние, печаль, удивление.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://github.com/google-research/google-research/tree/master/goemotions
Исходный код :
tfds.text.GoemotionsВерсии :
-
0.1.0(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
4.19 MiBРазмер набора данных :
32.25 MiB.Автоматическое кэширование ( документация ): Да
Сплиты :
| Расколоть | Примеры |
|---|---|
'test' | 5427 |
'train' | 43 410 |
'validation' | 5426 |
- Структура функции :
FeaturesDict({
'admiration': bool,
'amusement': bool,
'anger': bool,
'annoyance': bool,
'approval': bool,
'caring': bool,
'comment_text': Text(shape=(), dtype=string),
'confusion': bool,
'curiosity': bool,
'desire': bool,
'disappointment': bool,
'disapproval': bool,
'disgust': bool,
'embarrassment': bool,
'excitement': bool,
'fear': bool,
'gratitude': bool,
'grief': bool,
'joy': bool,
'love': bool,
'nervousness': bool,
'neutral': bool,
'optimism': bool,
'pride': bool,
'realization': bool,
'relief': bool,
'remorse': bool,
'sadness': bool,
'surprise': bool,
})
- Документация по функциям :
| Особенность | Учебный класс | Форма | Dтип | Описание |
|---|---|---|---|---|
| ОсобенностиDict | ||||
| восхищение | Тензор | логический | ||
| развлечение | Тензор | логический | ||
| злость | Тензор | логический | ||
| раздражение | Тензор | логический | ||
| одобрение | Тензор | логический | ||
| заботливый | Тензор | логический | ||
| комментарий_текст | Текст | нить | ||
| путаница | Тензор | логический | ||
| любопытство | Тензор | логический | ||
| желание | Тензор | логический | ||
| разочарование | Тензор | логический | ||
| неодобрение | Тензор | логический | ||
| отвращение | Тензор | логический | ||
| смущение | Тензор | логический | ||
| возбуждение | Тензор | логический | ||
| страх | Тензор | логический | ||
| благодарность | Тензор | логический | ||
| горе | Тензор | логический | ||
| радость | Тензор | логический | ||
| любовь | Тензор | логический | ||
| нервозность | Тензор | логический | ||
| нейтральный | Тензор | логический | ||
| оптимизм | Тензор | логический | ||
| гордость | Тензор | логический | ||
| реализация | Тензор | логический | ||
| рельеф | Тензор | логический | ||
| угрызение совести | Тензор | логический | ||
| грусть | Тензор | логический | ||
| сюрприз | Тензор | логический |
Ключи под наблюдением (см . документ
as_supervised):NoneРисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{demszky-2020-goemotions,
title = "{G}o{E}motions: A Dataset of Fine-Grained Emotions",
author = "Demszky, Dorottya and
Movshovitz-Attias, Dana and
Ko, Jeongwoo and
Cowen, Alan and
Nemade, Gaurav and
Ravi, Sujith",
booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
month = jul,
year = "2020",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.acl-main.372",
pages = "4040--4054",
}