- คำอธิบาย :
Sentiment140 ช่วยให้คุณค้นพบความรู้สึกที่มีต่อแบรนด์ ผลิตภัณฑ์ หรือหัวข้อบน Twitter
ข้อมูลเป็น CSV ที่ลบอีโมติคอนออก รูปแบบไฟล์ข้อมูลมี 6 ฟิลด์:
- ขั้วของทวีต (0 = ลบ, 2 = เป็นกลาง, 4 = เป็นบวก)
- รหัสทวีต (2087)
- วันที่ทวีต (วันเสาร์ที่ 16 พฤษภาคม 23:58:44 UTC 2009)
- แบบสอบถาม (lyx) ถ้าไม่มีการสืบค้น ค่านี้จะเป็น NO_QUERY
- ผู้ใช้ที่ทวีต (robotickilldozr)
- ข้อความของทวีต (Lyx เจ๋งมาก)
สำหรับข้อมูลเพิ่มเติม โปรดดูบทความ Twitter Sentiment Classification with Distant Supervision ที่ https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
โฮมเพจ : http://help.sentiment140.com/home
ซอร์สโค้ด :
tfds.datasets.sentiment140.Builderรุ่น :
-
1.0.0(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดการดาวน์โหลด :
77.59 MiBขนาดชุดข้อมูล :
305.13 MiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'test' | 498 |
'train' | 1,600,000 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'date': Text(shape=(), dtype=string),
'polarity': int32,
'query': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'user': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| คุณสมบัติDict | ||||
| วันที่ | ข้อความ | สตริง | ||
| ขั้ว | เทนเซอร์ | int32 | ||
| สอบถาม | ข้อความ | สตริง | ||
| ข้อความ | ข้อความ | สตริง | ||
| ผู้ใช้ | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('text', 'polarity')รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@ONLINE {Sentiment140,
author = "Go, Alec and Bhayani, Richa and Huang, Lei",
title = "Twitter Sentiment Classification using Distant Supervision",
year = "2009",
url = "http://help.sentiment140.com/home"
}