- Описание :
BoolQ — это набор данных для ответов на вопросы «да/нет», содержащий 15942 примера. Эти вопросы возникают естественным образом, они генерируются в непринужденной и непринужденной обстановке.
Каждый пример представляет собой триплет (вопрос, отрывок, ответ) с заголовком страницы в качестве необязательного дополнительного контекста. Настройка классификации текстовых пар аналогична существующим задачам вывода на естественном языке.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://github.com/google-research-datasets/boolean-questions
Исходный код :
tfds.datasets.bool_q.BuilderВерсии :
-
1.0.0(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
8.36 MiBРазмер набора данных :
8.51 MiB.Автоматическое кэширование ( документация ): Да
Сплиты :
| Расколоть | Примеры |
|---|---|
'train' | 9427 |
'validation' | 3270 |
- Структура функции :
FeaturesDict({
'answer': bool,
'passage': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Документация по функциям :
| Особенность | Учебный класс | Форма | Dтип | Описание |
|---|---|---|---|---|
| ОсобенностиDict | ||||
| отвечать | Тензор | логический | ||
| проход | Текст | нить | ||
| вопрос | Текст | нить | ||
| заглавие | Текст | нить |
Ключи под наблюдением (см . документ
as_supervised):NoneРисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{clark2019boolq,
title = {BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions},
author = {Clark, Christopher and Lee, Kenton and Chang, Ming-Wei, and Kwiatkowski, Tom and Collins, Michael, and Toutanova, Kristina},
booktitle = {NAACL},
year = {2019},
}