- תיאור :
אוסף הודעות אימייל של עובדים בתאגיד אנרון.
ישנן שתי תכונות:
- email_body: טקסט גוף האימייל.
subject_line: טקסט נושא האימייל.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://github.com/ryanzhumich/AESLC
קוד מקור :
tfds.datasets.aeslc.Builderגרסאות :
-
1.0.0(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
11.10 MiBגודל ערכת נתונים:
14.96 MiBשמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 1,906 |
'train' | 14,436 |
'validation' | 1,960 |
- מבנה תכונה :
FeaturesDict({
'email_body': Text(shape=(), dtype=string),
'subject_line': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| FeaturesDict | ||||
| email_body | טֶקסט | חוּט | ||
| שורת נושא | טֶקסט | חוּט |
מפתחות בפיקוח (ראה כמסמך בפיקוח): ('
as_supervised('email_body', 'subject_line')איור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@misc{zhang2019email,
title={This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation},
author={Rui Zhang and Joel Tetreault},
year={2019},
eprint={1906.03497},
archivePrefix={arXiv},
primaryClass={cs.CL}
}