- Opis :
Zbiór danych dialogu kontradyktoryjnego botów.
Zestawy danych dialogu oznaczone jako obraźliwe z zadania dialogu kontradyktoryjnego z botami. Dialogi zebrano poprzez poproszenie ludzi o kontradyktoryjną rozmowę z botami.
Więcej szczegółów w artykule .
Strona główna : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
Kod źródłowy :
tfds.datasets.bot_adversarial_dialogue.BuilderWersje :
-
1.0.0(domyślnie): Wersja pierwsza.
-
Automatyczne buforowanie ( dokumentacja ): Tak
Klucze nadzorowane (zobacz dokument
as_supervised):NoneRysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@misc{xu2021recipes,
title={Recipes for Safety in Open-domain Chatbots},
author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
year={2021},
eprint={2010.07079},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
bot_adversarial_dialogue/dialogue_datasets (konfiguracja domyślna)
Opis konfiguracji : Zestawy danych dialogowych podzielone na części pociągowe, walidacyjne i testowe.
Rozmiar pliku do pobrania :
3.06 MiBRozmiar zbioru danych :
23.38 MiBPodziały :
| Podział | Przykłady |
|---|---|
'test' | 2598 |
'train' | 69274 |
'valid' | 7002 |
- Struktura funkcji :
FeaturesDict({
'bot_persona': Sequence(Text(shape=(), dtype=string)),
'dialogue_id': float32,
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'round_id': float32,
'speaker_to_eval': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDykt | ||||
| bot_persona | Sekwencja (tekst) | (Nic,) | strunowy | Osoba, pod którą podszywa się bot. |
| identyfikator_dialogu | Napinacz | pływak32 | ||
| odcinek_skończony | Napinacz | bool | ||
| ID | Tekst | strunowy | Identyfikator próbki. | |
| etykiety | Etykieta klasy | int64 | ||
| okrągły_id | Napinacz | pływak32 | ||
| głośnik_do_eval | Tekst | strunowy | Osoba mówiąca wypowiedzi oznaczone. | |
| tekst | Tekst | strunowy | Wyrażenie do sklasyfikowania. |
- Przykłady ( tfds.as_dataframe ):
bot_adversarial_dialogue/human_nonadv_safety_eval
Opis konfiguracji : zestaw oceny bezpieczeństwa ludzi oceniony przez pracowników korzystających z crowdsourcingu pod kątem obraźliwości.
Rozmiar pliku do pobrania :
10.57 KiBRozmiar zbioru danych :
34.55 KiBPodziały :
| Podział | Przykłady |
|---|---|
'test' | 180 |
- Struktura funkcji :
FeaturesDict({
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'text': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDykt | ||||
| odcinek_skończony | Napinacz | bool | ||
| ID | Tekst | strunowy | Identyfikator próbki. | |
| etykiety | Etykieta klasy | int64 | ||
| tekst | Tekst | strunowy | Wyrażenie do sklasyfikowania. |
- Przykłady ( tfds.as_dataframe ):