- Описание :
Набор данных содержит 5957 вопросов с 4 вариантами ответов. Кроме того, они предоставляют 5 167 общеизвестных фактов из краудсорсинга и расширенную версию вопросов для обучения/разработки/тестирования, где каждый вопрос связан с исходным основным фактом, оценкой человеческой точности, оценкой ясности и анонимным краудсорсингом. Я БЫ.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://leaderboard.allenai.org/open_book_qa/submissions/get-started
Исходный код :
tfds.datasets.openbookqa.BuilderВерсии :
-
0.1.0(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
1.38 MiBРазмер набора данных :
2.40 MiB.Автоматическое кэширование ( документация ): Да
Сплиты :
| Расколоть | Примеры |
|---|---|
'test' | 500 |
'train' | 4957 |
'validation' | 500 |
- Структура функции :
FeaturesDict({
'answerKey': ClassLabel(shape=(), dtype=int64, num_classes=4),
'clarity': float32,
'fact1': Text(shape=(), dtype=string),
'humanScore': float32,
'question': FeaturesDict({
'choice_A': Text(shape=(), dtype=string),
'choice_B': Text(shape=(), dtype=string),
'choice_C': Text(shape=(), dtype=string),
'choice_D': Text(shape=(), dtype=string),
'stem': Text(shape=(), dtype=string),
}),
'turkIdAnonymized': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Учебный класс | Форма | Dтип | Описание |
|---|---|---|---|---|
| ОсобенностиDict | ||||
| ключ ответа | Метка класса | int64 | ||
| ясность | Тензор | поплавок32 | ||
| факт1 | Текст | нить | ||
| HumanScore | Тензор | поплавок32 | ||
| вопрос | ОсобенностиDict | |||
| вопрос/выбор_A | Текст | нить | ||
| вопрос/выбор_B | Текст | нить | ||
| вопрос/выбор_C | Текст | нить | ||
| вопрос/выбор_D | Текст | нить | ||
| вопрос/основа | Текст | нить | ||
| turkIdАнонимизированный | Текст | нить |
Контролируемые ключи (см . документ
as_supervised):('question', 'answerKey')Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@article{mihaylov2018can,
title={Can a suit of armor conduct electricity? a new dataset for open book question answering},
author={Mihaylov, Todor and Clark, Peter and Khot, Tushar and Sabharwal, Ashish},
journal={arXiv preprint arXiv:1809.02789},
year={2018}
}