- Deskripsi :
Sentimen140 memungkinkan Anda menemukan sentimen merek, produk, atau topik di Twitter.
Datanya adalah CSV dengan emotikon dihapus. Format file data memiliki 6 bidang:
- polaritas tweet (0 = negatif, 2 = netral, 4 = positif)
- id tweet (2087)
- tanggal tweet (Sabtu 16 Mei 23:58:44 UTC 2009)
- kueri (lyx). Jika tidak ada kueri, maka nilai ini adalah NO_QUERY.
- pengguna yang men-tweet (robotickilldozr)
- teks tweet (Lyx keren)
Untuk informasi selengkapnya, lihat makalah Klasifikasi Sentimen Twitter dengan Pengawasan Jauh di https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : http://help.sentiment140.com/home
Kode sumber :
tfds.datasets.sentiment140.BuilderVersi :
-
1.0.0(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
77.59 MiBUkuran dataset :
305.13 MiBDi-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
| Membelah | Contoh |
|---|---|
'test' | 498 |
'train' | 1.600.000 |
- Struktur fitur :
FeaturesDict({
'date': Text(shape=(), dtype=string),
'polarity': int32,
'query': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'user': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| tanggal | Teks | rangkaian | ||
| polaritas | Tensor | int32 | ||
| pertanyaan | Teks | rangkaian | ||
| teks | Teks | rangkaian | ||
| pengguna | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('text', 'polarity')Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@ONLINE {Sentiment140,
author = "Go, Alec and Bhayani, Richa and Huang, Lei",
title = "Twitter Sentiment Classification using Distant Supervision",
year = "2009",
url = "http://help.sentiment140.com/home"
}