- Описание :
MC-TACO — это набор данных из 13 000 пар вопросов и ответов, которые требуют временного понимания здравого смысла. Набор данных содержит пять временных свойств:
- продолжительность (сколько времени занимает событие)
- временной порядок (типичный порядок событий)
- типичное время (когда происходит событие)
- частота (как часто происходит событие)
- стационарность (поддерживается ли состояние в течение очень долгого времени или бесконечно)
Мы надеемся, что этот набор данных может способствовать будущему исследованию этого конкретного класса задач рассуждения.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://github.com/CogComp/MCTACO
Исходный код :
tfds.datasets.mctaco.BuilderВерсии :
-
1.0.0(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
2.27 MiBРазмер набора данных :
3.18 MiB.Автоматическое кэширование ( документация ): Да
Сплиты :
| Расколоть | Примеры |
|---|---|
'test' | 9442 |
'validation' | 3783 |
- Структура функции :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'category': ClassLabel(shape=(), dtype=int64, num_classes=5),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'question': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Сорт | Форма | Dтип | Описание |
|---|---|---|---|---|
| ОсобенностиDict | ||||
| отвечать | Текст | нить | ||
| категория | Метка класса | int64 | ||
| этикетка | Метка класса | int64 | ||
| вопрос | Текст | нить | ||
| предложение | Текст | нить |
Ключи под наблюдением (см . документ
as_supervised):NoneРисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{ZKNR19,
author = {Ben Zhou, Daniel Khashabi, Qiang Ning and Dan Roth},
title = {"Going on a vacation" takes longer than "Going for a walk": A Study of Temporal Commonsense Understanding },
booktitle = {EMNLP},
year = {2019},
}