- Descrição :
Conjunto de dados descrito no artigo: Instruções não naturais: ajustando modelos de linguagem com (quase) nenhum trabalho humano (2022). Contém conjuntos de instruções em linguagem natural, com restrições opcionais/reformulações geradas pelo LLM.
Página inicial : https://github.com/orhonovich/unnatural-instructions
Código -fonte:
tfds.text.unnatural_instructions.UnnaturalInstructionsVersões :
-
0.0.1(padrão): Versão inicial. Omita instruções/entradas, pois requerem processamento adicional para serem usadas. Instrução_com_entradas e reformulações contêm instruções e contextos.
-
Tamanho do download :
17.48 MiBTamanho do conjunto de dados :
154.71 MiBArmazenado em cache automaticamente ( documentação ): Somente quando
shuffle_files=False(train)Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 66.010 |
- Estrutura de recursos :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'instances': Sequence({
'constraints': Text(shape=(), dtype=string),
'input': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
'instruction': Text(shape=(), dtype=string),
'reformulations': Sequence({
'input': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| RecursosDict | ||||
| Eu iria | Texto | corda | Identificador exclusivo, por exemplo. | |
| instâncias | Seqüência | |||
| instâncias/restrições | Texto | corda | Restrições específicas da tarefa. | |
| instâncias/entrada | Texto | corda | Entrada a ser alimentada em espaços reservados para instruções fornecidas. | |
| instâncias/instrução_com_entrada | Texto | corda | Instruções com entradas fornecidas aos espaços reservados. | |
| instâncias/saída | Texto | corda | Saída de destino para determinada tarefa. | |
| instrução | Texto | corda | Instrução com espaço reservado para entradas. | |
| reformulações | Seqüência | |||
| reformulações/entradas | Texto | corda | Entrada a ser alimentada em espaços reservados para instruções fornecidas. | |
| reformulações/instrução | Texto | corda | Instrução com espaço reservado para entradas. | |
| reformulações/instrução_com_entrada | Texto | corda | Instruções com entradas fornecidas aos espaços reservados. | |
| reformulações/saída | Texto | corda | Saída de destino para determinada tarefa. |
Chaves supervisionadas (Consulte
as_superviseddoc ):NoneFigura ( tfds.show_examples ): Não compatível.
Exemplos ( tfds.as_dataframe ):
- Citação :
@misc{honovich2022unnatural,
title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
url = {https://arxiv.org/abs/2212.09689},
publisher = {arXiv},
year={2022}
}