- الوصف :
يسمح لك Sentiment140 باكتشاف شعور العلامة التجارية أو المنتج أو الموضوع على Twitter.
البيانات عبارة عن ملف CSV مع إزالة الرموز. يحتوي تنسيق ملف البيانات على 6 حقول:
- قطبية التغريدة (0 = سلبي ، 2 = محايد ، 4 = إيجابي)
- معرف التغريدة (2087)
- تاريخ التغريدة (السبت 16 مايو 23:58:44 بالتوقيت العالمي المنسق 2009)
- الاستعلام (ليكس). إذا لم يكن هناك استعلام ، فهذه القيمة هي NO_QUERY.
- المستخدم الذي غرد (robotickilldozr)
- نص التغريدة (Lyx رائع)
لمزيد من المعلومات ، راجع مقالة تصنيف مشاعر Twitter مع الإشراف البعيد على https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : http://help.sentiment140.com/home
كود المصدر :
tfds.datasets.sentiment140.Builderإصدارات :
-
1.0.0(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
77.59 MiBحجم مجموعة البيانات :
305.13 MiBالتخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'test' | 498 |
'train' | 1،600،000 |
- هيكل الميزة :
FeaturesDict({
'date': Text(shape=(), dtype=string),
'polarity': int32,
'query': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'user': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| الميزات | ||||
| تاريخ | نص | سلسلة | ||
| قطبية | موتر | int32 | ||
| استفسار | نص | سلسلة | ||
| نص | نص | سلسلة | ||
| المستعمل | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised):('text', 'polarity')الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@ONLINE {Sentiment140,
author = "Go, Alec and Bhayani, Richa and Huang, Lei",
title = "Twitter Sentiment Classification using Distant Supervision",
year = "2009",
url = "http://help.sentiment140.com/home"
}