- Descriptif :
Le corpus SNLI (version 1.0) est une collection de 570 000 paires de phrases en anglais écrites par des humains, étiquetées manuellement pour une classification équilibrée avec les étiquettes implication, contradiction et neutre, prenant en charge la tâche d'inférence du langage naturel (NLI), également connue sous le nom de reconnaissance de l'implication textuelle. (RTE).
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://nlp.stanford.edu/projects/snli/
Code source :
tfds.datasets.snli.BuilderVersions :
-
1.1.0(par défaut) : aucune note de version.
-
Taille du téléchargement :
90.17 MiBTaille du jeu de données :
87.00 MiBMise en cache automatique ( documentation ): Oui
Fractionnements :
| Diviser | Exemples |
|---|---|
'test' | 10 000 |
'train' | 550 152 |
'validation' | 10 000 |
- Structure des fonctionnalités :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
| Caractéristique | Classer | Forme | Dtype | La description |
|---|---|---|---|---|
| FonctionnalitésDict | ||||
| hypothèse | Texte | chaîne | ||
| étiquette | Étiquette de classe | int64 | ||
| prémisse | Texte | chaîne |
Clés supervisées (Voir
as_superviseddoc ):NoneFigure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@inproceedings{snli:emnlp2015,
Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
Publisher = {Association for Computational Linguistics},
Title = {A large annotated corpus for learning natural language inference},
Year = {2015}
}