- Descrição :
O conjunto de dados HellaSwag é uma referência para Commonsense NLI. Inclui um contexto e algumas terminações que completam o contexto.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://rowanzellers.com/hellaswag/
Código -fonte:
tfds.text.HellaswagVersões :
-
0.0.1: Sem notas de versão. -
1.0.0: Adicionando divisões separadas para conjuntos de teste/validação dentro e fora do domínio. -
1.1.0(padrão): Outra dimensão dividida para fonte (wikihow vs activitynet)
-
Tamanho do download :
68.18 MiBTamanho do conjunto de dados :
107.45 MiBCache automático ( documentação ): Sim
Divisões :
| Dividir | Exemplos |
|---|---|
'test' | 10.003 |
'test_ind_activitynet' | 1.870 |
'test_ind_wikihow' | 3.132 |
'test_ood_activitynet' | 1.651 |
'test_ood_wikihow' | 3.350 |
'train' | 39.905 |
'train_activitynet' | 14.740 |
'train_wikihow' | 25.165 |
'validation' | 10.042 |
'validation_ind_activitynet' | 1.809 |
'validation_ind_wikihow' | 3.192 |
'validation_ood_activitynet' | 1.434 |
'validation_ood_wikihow' | 3.607 |
- Estrutura de recursos :
FeaturesDict({
'activity_label': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'endings': Sequence(Text(shape=(), dtype=string)),
'label': int32,
'source_id': Text(shape=(), dtype=string),
'split_type': Text(shape=(), dtype=string),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| RecursosDict | ||||
| Activity_label | Texto | corda | ||
| contexto | Texto | corda | ||
| terminações | Sequência (Texto) | (Nenhum,) | corda | |
| etiqueta | tensor | int32 | ||
| source_id | Texto | corda | ||
| split_type | Texto | corda |
Chaves supervisionadas (Consulte
as_superviseddoc ):NoneFigura ( tfds.show_examples ): Não compatível.
Exemplos ( tfds.as_dataframe ):
- Citação :
@inproceedings{zellers2019hellaswag,
title={HellaSwag: Can a Machine Really Finish Your Sentence?},
author={Zellers, Rowan and Holtzman, Ari and Bisk, Yonatan and Farhadi, Ali and Choi, Yejin},
booktitle ={Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics},
year={2019}
}