- Descriptif :
Une collection de messages électroniques d'employés d'Enron Corporation.
Il existe deux fonctionnalités :
- email_body : texte du corps de l'e-mail.
subject_line : texte de l'objet de l'e-mail.
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://github.com/ryanzhumich/AESLC
Code source :
tfds.datasets.aeslc.BuilderVersions :
-
1.0.0(par défaut) : aucune note de version.
-
Taille du téléchargement :
11.10 MiBTaille du jeu de données :
14.96 MiBMise en cache automatique ( documentation ): Oui
Fractionnements :
| Diviser | Exemples |
|---|---|
'test' | 1 906 |
'train' | 14 436 |
'validation' | 1 960 |
- Structure des fonctionnalités :
FeaturesDict({
'email_body': Text(shape=(), dtype=string),
'subject_line': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
| Caractéristique | Classer | Forme | Dtype | La description |
|---|---|---|---|---|
| FonctionnalitésDict | ||||
| corps de l'e-mail | Texte | chaîne de caractères | ||
| ligne_objet | Texte | chaîne de caractères |
Clés supervisées (Voir
as_superviseddoc ):('email_body', 'subject_line')Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@misc{zhang2019email,
title={This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation},
author={Rui Zhang and Joel Tetreault},
year={2019},
eprint={1906.03497},
archivePrefix={arXiv},
primaryClass={cs.CL}
}