- opis :
Zbiór danych opisany w artykule: Unnatural Instructions: Tuning Language Models with (prawie) bez pracy ludzkiej (2022). Zawiera zestawy instrukcji w języku naturalnym z opcjonalnymi ograniczeniami / przeformułowaniami generowanymi przez LLM.
Strona główna : https://github.com/orhonovich/unnatural-instructions
Kod źródłowy :
tfds.text.unnatural_instructions.UnnaturalInstructionsWersje :
-
0.0.1(domyślnie): Wersja początkowa. Pomiń instrukcje / dane wejściowe, ponieważ wymagają one dodatkowego przetwarzania. Instrukcja_z_wejściami i przeformułowania zawierają instrukcje i konteksty.
-
Rozmiar pliku do pobrania :
17.48 MiBRozmiar zestawu danych :
154.71 MiBAutomatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy
shuffle_files=False(pociąg)Podziały :
| Podział | Przykłady |
|---|---|
'train' | 66010 |
- Struktura funkcji :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'instances': Sequence({
'constraints': Text(shape=(), dtype=string),
'input': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
'instruction': Text(shape=(), dtype=string),
'reformulations': Sequence({
'input': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| ID | Tekst | strunowy | Unikalny identyfikator np. | |
| instancje | Sekwencja | |||
| instancje/ograniczenia | Tekst | strunowy | Ograniczenia specyficzne dla zadania. | |
| instancje/wejście | Tekst | strunowy | Dane wejściowe, które mają zostać wprowadzone do symboli zastępczych dla danej instrukcji. | |
| instancje/instrukcja_z_wejsciem | Tekst | strunowy | Instrukcje z danymi wejściowymi dostarczane do symboli zastępczych. | |
| instancje/wyjście | Tekst | strunowy | Docelowe wyjście dla danego zadania. | |
| instrukcja | Tekst | strunowy | Instrukcja z symbolem zastępczym dla danych wejściowych. | |
| przeformułowania | Sekwencja | |||
| przeformułowania/wkład | Tekst | strunowy | Dane wejściowe, które mają zostać wprowadzone do symboli zastępczych dla danej instrukcji. | |
| przeformułowania/instrukcje | Tekst | strunowy | Instrukcja z symbolem zastępczym dla danych wejściowych. | |
| przeformułowania/instrukcja_z_wprowadzeniem | Tekst | strunowy | Instrukcje z danymi wejściowymi dostarczane do symboli zastępczych. | |
| przeformułowania/wyjście | Tekst | strunowy | Docelowe wyjście dla danego zadania. |
Klucze nadzorowane (Zobacz dokument
as_supervised):NoneRysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@misc{honovich2022unnatural,
title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
url = {https://arxiv.org/abs/2212.09689},
publisher = {arXiv},
year={2022}
}