- Descrição :
O QASC é um conjunto de dados de resposta a perguntas com foco na composição de frases. Ele consiste em 9.980 questões de múltipla escolha de 8 vias sobre ciências do ensino fundamental (8.134 train, 926 dev, 920 test) e vem com um corpus de 17 milhões de sentenças.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://allenai.org/data/qasc
Código -fonte:
tfds.datasets.qasc.BuilderVersões :
-
0.1.0(padrão): sem notas de versão.
-
Tamanho do download :
1.54 MiBTamanho do conjunto de dados :
6.61 MiBCache automático ( documentação ): Sim
Divisões :
| Dividir | Exemplos |
|---|---|
'test' | 920 |
'train' | 8.134 |
'validation' | 926 |
- Estrutura de recursos :
FeaturesDict({
'answerKey': Text(shape=(), dtype=string),
'choices': Sequence({
'label': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
}),
'combinedfact': Text(shape=(), dtype=string),
'fact1': Text(shape=(), dtype=string),
'fact2': Text(shape=(), dtype=string),
'formatted_question': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Funcionalidade | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| RecursosDict | ||||
| palavra chave | Texto | fragmento | ||
| escolhas | Seqüência | |||
| escolhas/rótulo | Texto | fragmento | ||
| escolhas/texto | Texto | fragmento | ||
| fato combinado | Texto | fragmento | ||
| fato1 | Texto | fragmento | ||
| fato2 | Texto | fragmento | ||
| pergunta_formatada | Texto | fragmento | ||
| Eu iria | Texto | fragmento | ||
| pergunta | Texto | fragmento |
Chaves supervisionadas (Consulte
as_superviseddoc ):NoneFigura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ):
- Citação :
@article{allenai:qasc,
author = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
title = {QASC: A Dataset for Question Answering via Sentence Composition},
journal = {arXiv:1910.11473v2},
year = {2020},
}