- Descriptif :
L'ensemble de données SciTail est un ensemble de données d'implication créé à partir d'examens scientifiques à choix multiples et de phrases Web. Chaque question et le choix de la bonne réponse sont convertis en une déclaration assertive pour former l'hypothèse. La recherche d'informations est utilisée pour obtenir un texte pertinent à partir d'un grand corpus de textes de phrases Web, et ces phrases sont utilisées comme prémisse P. L'annotation d'une telle paire prémisse-hypothèse est externalisée en tant que supports (implique) ou non (neutre), dans l'ordre pour créer le jeu de données SciTail. L'ensemble de données contient 27 026 exemples avec 10 101 exemples avec une étiquette implique et 16 925 exemples avec une étiquette neutre.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://allenai.org/data/scitail
Code source :
tfds.datasets.sci_tail.BuilderVersions :
-
1.0.0(par défaut) : version initiale.
-
Taille du téléchargement :
13.52 MiBTaille du jeu de données :
6.01 MiBMise en cache automatique ( documentation ): Oui
Fractionnements :
| Diviser | Exemples |
|---|---|
'test' | 2 126 |
'train' | 23 097 |
'validation' | 1 304 |
- Structure des fonctionnalités :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'premise': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
| Caractéristique | Classe | Façonner | Dtype | Description |
|---|---|---|---|---|
| FonctionnalitésDict | ||||
| hypothèse | Texte | chaîne de caractères | ||
| étiquette | Étiquette de classe | int64 | ||
| prémisse | Texte | chaîne de caractères |
Clés supervisées (Voir
as_superviseddoc ):NoneFigure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{khot2018scitail,
title={Scitail: A textual entailment dataset from science question answering},
author={Khot, Tushar and Sabharwal, Ashish and Clark, Peter},
booktitle={Proceedings of the 32th AAAI Conference on Artificial Intelligence (AAAI 2018)},
url = "http://ai2-website.s3.amazonaws.com/publications/scitail-aaai-2018_cameraready.pdf",
year={2018}
}