- الوصف :
مجموعة من رسائل البريد الإلكتروني للموظفين في شركة Enron.
هناك نوعان من الميزات:
- email_body: النص الأساسي للبريد الإلكتروني.
subject_line: نص موضوع البريد الإلكتروني.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://github.com/ryanzhumich/AESLC
كود المصدر :
tfds.datasets.aeslc.Builderإصدارات :
-
1.0.0(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
11.10 MiBحجم مجموعة البيانات :
14.96 MiBالتخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'test' | 1،906 |
'train' | 14،436 |
'validation' | 1960 |
- هيكل الميزة :
FeaturesDict({
'email_body': Text(shape=(), dtype=string),
'subject_line': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| الميزات | ||||
| هيئة البريد الإلكتروني | نص | سلسلة | ||
| سطر الموضوع | نص | سلسلة |
المفاتيح الخاضعة للإشراف (راجع المستند
as_supervised):('email_body', 'subject_line')الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@misc{zhang2019email,
title={This Email Could Save Your Life: Introducing the Task of Email Subject Line Generation},
author={Rui Zhang and Joel Tetreault},
year={2019},
eprint={1906.03497},
archivePrefix={arXiv},
primaryClass={cs.CL}
}