- Descrição :
Conjunto de dados de diálogo adversário de bot.
Conjuntos de dados de diálogo rotulados com ofensiva da tarefa Bot Adversarial Dialogue. Os diálogos foram coletados pedindo aos humanos que conversassem de forma adversária com os bots.
Mais detalhes no artigo .
Página inicial : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
Código fonte :
tfds.datasets.bot_adversarial_dialogue.BuilderVersões :
-
1.0.0(padrão): versão inicial.
-
Armazenado em cache automaticamente ( documentação ): Sim
Chaves supervisionadas (consulte o documento
as_supervised):NoneFigura ( tfds.show_examples ): Não suportado.
Citação :
@misc{xu2021recipes,
title={Recipes for Safety in Open-domain Chatbots},
author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
year={2021},
eprint={2010.07079},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
bot_adversarial_dialogue/dialogue_datasets (configuração padrão)
Descrição da configuração : os conjuntos de dados de diálogo, divididos em divisões de treinamento, validação e teste.
Tamanho do download :
3.06 MiBTamanho do conjunto de dados :
23.38 MiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 2.598 |
'train' | 69.274 |
'valid' | 7.002 |
- Estrutura de recursos :
FeaturesDict({
'bot_persona': Sequence(Text(shape=(), dtype=string)),
'dialogue_id': float32,
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'round_id': float32,
'speaker_to_eval': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
})
- Documentação de recursos :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| RecursosDict | ||||
| bot_persona | Sequência (Texto) | (Nenhum,) | corda | A persona personificada pelo bot. |
| dialog_id | Tensor | float32 | ||
| episódio_feito | Tensor | bool | ||
| eu ia | Texto | corda | O ID da amostra. | |
| rótulos | ClassLabel | int64 | ||
| round_id | Tensor | float32 | ||
| alto-falante_para_eval | Texto | corda | O locutor dos enunciados rotulados. | |
| texto | Texto | corda | A expressão a ser classificada. |
- Exemplos ( tfds.as_dataframe ):
bot_adversarial_dialogue/human_nonadv_safety_eval
Descrição da configuração : um conjunto de avaliação de segurança humana avaliado por trabalhadores de crowdsourcing quanto à ofensiva.
Tamanho do download :
10.57 KiBTamanho do conjunto de dados :
34.55 KiBDivisões :
| Dividir | Exemplos |
|---|---|
'test' | 180 |
- Estrutura de recursos :
FeaturesDict({
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'text': Text(shape=(), dtype=string),
})
- Documentação de recursos :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| RecursosDict | ||||
| episódio_feito | Tensor | bool | ||
| eu ia | Texto | corda | O ID da amostra. | |
| rótulos | ClassLabel | int64 | ||
| texto | Texto | corda | A expressão a ser classificada. |
- Exemplos ( tfds.as_dataframe ):