- Descriptif :
WikiDialog est un vaste ensemble de données de conversations de recherche d'informations générées de manière synthétique. Chaque conversation de l'ensemble de données contient deux locuteurs fondés sur un passage de Wikipédia en anglais : les énoncés d'un locuteur consistent en des phrases exactes du passage ; l'autre locuteur est généré par un grand modèle de langage.
Description de la config : WikiDialog généré à partir du dialog inpainter affiné sur OR-QuAC et QReCC.
OQsignifie OR-QuAC et QReCC.Page d' accueil : https://github.com/google-research/dialog-inpainting#wikidialog-oq
Code source :
tfds.text.wiki_dialog.WikiDialogVersions :
-
1.0.0(par défaut) : version initiale.
-
Taille du téléchargement :
7.04 GiBTaille du jeu de données :
36.58 GiBMise en cache automatique ( documentation ): Non
Fractionnements :
| Diviser | Exemples |
|---|---|
'train' | 11 264 129 |
'validation' | 113 822 |
- Structure des fonctionnalités :
FeaturesDict({
'author_num': Sequence(int32),
'passage': Text(shape=(), dtype=string),
'pid': Text(shape=(), dtype=string),
'sentences': Sequence(Text(shape=(), dtype=string)),
'title': Text(shape=(), dtype=string),
'utterances': Sequence(Text(shape=(), dtype=string)),
})
- Documentation des fonctionnalités :
| Caractéristique | Classer | Forme | Dtype | La description |
|---|---|---|---|---|
| FonctionnalitésDict | ||||
| num_auteur | Séquence (tenseur) | (Aucun,) | int32 | |
| passage | Texte | chaîne de caractères | ||
| pid | Texte | chaîne de caractères | ||
| Phrases | Séquence (texte) | (Aucun,) | chaîne de caractères | |
| Titre | Texte | chaîne de caractères | ||
| énoncés | Séquence (texte) | (Aucun,) | chaîne de caractères |
Clés supervisées (Voir
as_superviseddoc ):NoneFigure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{dai2022dialoginpainting,
title={Dialog Inpainting: Turning Documents to Dialogs},
author={Dai, Zhuyun and Chaganty, Arun Tejasvi and Zhao, Vincent and Amini, Aida and Green, Mike and Rashid, Qazi and Guu, Kelvin},
booktitle={International Conference on Machine Learning (ICML)},
year={2022},
organization={PMLR}
}