- توضیحات :
مجموعه ای از پیام های ایمیل کارکنان در شرکت انرون.
دو ویژگی وجود دارد:
- email_body: متن متن ایمیل.
subject_line: متن موضوع ایمیل.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://github.com/ryanzhumich/AESLC
کد منبع :
tfds.datasets.aeslc.Builderنسخه ها :
-
1.0.0(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
11.10 MiBحجم مجموعه داده :
14.96 MiBذخیره خودکار ( اسناد ): بله
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'test' | 1906 |
'train' | 14,436 |
'validation' | 1,960 |
- ساختار ویژگی :
FeaturesDict({
'email_body': Text(shape=(), dtype=string),
'subject_line': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| FeaturesDict | ||||
| email_body | متن | رشته | ||
| نوار عنوان | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_superviseddoc ):('email_body', 'subject_line')شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@misc{zhang2019email,
title={This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation},
author={Rui Zhang and Joel Tetreault},
year={2019},
eprint={1906.03497},
archivePrefix={arXiv},
primaryClass={cs.CL}
}