- Opis :
Zbiór danych zawierający 14 tys. rozmów z 81 tys. par pytanie-odpowiedź. QReCC opiera się na pytaniach z TREC CAST, QuAC i Google Natural Pytania.
Strona główna : https://github.com/apple/ml-qrecc
Kod źródłowy :
tfds.text.qrecc.QReCCWersje :
-
1.0.0(domyślnie): Wersja pierwsza.
-
Rozmiar pobierania :
7.60 MiBRozmiar zbioru danych :
69.29 MiBAutomatyczne buforowanie ( dokumentacja ): Tak
Podziały :
| Podział | Przykłady |
|---|---|
'test' | 16 451 |
'train' | 63501 |
- Struktura funkcji :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'answer_url': Text(shape=(), dtype=string),
'context': Sequence(Text(shape=(), dtype=string)),
'conversation_id': Scalar(shape=(), dtype=int32, description=The id of the conversation.),
'question': Text(shape=(), dtype=string),
'question_rewrite': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'turn_id': Scalar(shape=(), dtype=int32, description=The id of the conversation turn, within a conversation.),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDykt | ||||
| odpowiedź | Tekst | smyczkowy | ||
| adres_odpowiedzi | Tekst | smyczkowy | ||
| kontekst | Sekwencja (tekst) | (Nic,) | smyczkowy | |
| identyfikator_rozmowy | Skalarny | int32 | Identyfikator rozmowy. | |
| pytanie | Tekst | smyczkowy | ||
| pytanie_przepisz | Tekst | smyczkowy | ||
| źródło | Tekst | smyczkowy | Oryginalne źródło danych — QuAC, CAST lub Natural Pytania | |
| turn_id | Skalarny | int32 | Identyfikator konwersacji w trakcie rozmowy. |
Klucze nadzorowane (zobacz dokument
as_supervised):NoneRysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@article{qrecc,
title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
year={2021}
}