- Descrição :
Um conjunto de dados contendo 14 mil conversas com 81 mil pares de perguntas e respostas. QReCC é baseado em perguntas de TREC CAST, QuAC e Google Natural Questions.
Página inicial : https://github.com/apple/ml-qrecc
Código fonte :
tfds.text.qrecc.QReCCVersões :
-
1.0.0(padrão): versão inicial.
-
Tamanho do download :
7.60 MiBTamanho do conjunto de dados :
69.29 MiBArmazenado em cache automaticamente ( documentação ): Sim
Divisões :
| Dividir | Exemplos |
|---|---|
'test' | 16.451 |
'train' | 63.501 |
- Estrutura de recursos :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'answer_url': Text(shape=(), dtype=string),
'context': Sequence(Text(shape=(), dtype=string)),
'conversation_id': Scalar(shape=(), dtype=int32, description=The id of the conversation.),
'question': Text(shape=(), dtype=string),
'question_rewrite': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'turn_id': Scalar(shape=(), dtype=int32, description=The id of the conversation turn, within a conversation.),
})
- Documentação de recursos :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| RecursosDict | ||||
| responder | Texto | corda | ||
| URL_resposta | Texto | corda | ||
| contexto | Sequência (Texto) | (Nenhum,) | corda | |
| conversa_id | Escalar | int32 | O ID da conversa. | |
| pergunta | Texto | corda | ||
| question_rewrite | Texto | corda | ||
| fonte | Texto | corda | A fonte original dos dados – QuAC, CAST ou Natural Questions | |
| turn_id | Escalar | int32 | O id do turno da conversa, dentro de uma conversa. |
Chaves supervisionadas (consulte o documento
as_supervised):NoneFigura ( tfds.show_examples ): Não suportado.
Exemplos ( tfds.as_dataframe ):
- Citação :
@article{qrecc,
title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
year={2021}
}