- Descrição :
QUALITY, um conjunto de dados de compreensão de leitura longa e de múltipla escolha.
Nós fornecemos apenas a versão bruta.
Página inicial : https://github.com/nyu-mll/quality
Código -fonte:
tfds.datasets.quality.BuilderVersões :
-
1.0.0(padrão): versão inicial.
-
Tamanho do download :
17.26 MiBCache automático ( documentação ): Sim
Divisões :
| Dividir | Exemplos |
|---|---|
'dev' | 230 |
'test' | 232 |
'train' | 300 |
- Estrutura de recursos :
FeaturesDict({
'article': Text(shape=(), dtype=string),
'article_id': Text(shape=(), dtype=string),
'difficults': Sequence(bool),
'gold_labels': Sequence(int32),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'question_ids': Sequence(Text(shape=(), dtype=string)),
'questions': Sequence(Text(shape=(), dtype=string)),
'set_unique_id': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'topic': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'writer_id': Text(shape=(), dtype=string),
'writer_labels': Sequence(int32),
})
- Documentação do recurso:
| Funcionalidade | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| RecursosDict | ||||
| artigo | Texto | fragmento | ||
| artigo_id | Texto | fragmento | ||
| dificuldades | Sequência(Tensor) | (Nenhum,) | bool | |
| gold_labels | Sequência(Tensor) | (Nenhum,) | int32 | |
| opções | Sequência(Sequência(Texto)) | (Nenhuma, Nenhuma) | fragmento | |
| question_ids | Sequência (Texto) | (Nenhum,) | fragmento | |
| questões | Sequência (Texto) | (Nenhum,) | fragmento | |
| set_unique_id | Texto | fragmento | ||
| fonte | Texto | fragmento | ||
| título | Texto | fragmento | ||
| tópico | Texto | fragmento | ||
| url | Texto | fragmento | ||
| escritor_id | Texto | fragmento | ||
| Writer_labels | Sequência(Tensor) | (Nenhum,) | int32 |
Chaves supervisionadas (Consulte
as_superviseddoc ):NoneFigura ( tfds.show_examples ): Não compatível.
Citação :
@article{pang2021quality,
title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
journal={arXiv preprint arXiv:2112.08608},
year={2021}
}
qualidade/raw (configuração padrão)
Descrição da configuração : Raw com HTML.
Tamanho do conjunto de dados :
22.18 MiBExemplos ( tfds.as_dataframe ):
qualidade/despojado
Descrição da configuração : Sem HTML.
Tamanho do conjunto de dados :
20.73 MiBExemplos ( tfds.as_dataframe ):