- Deskripsi :
Ini adalah kumpulan data untuk mengklasifikasikan maksud kutipan dalam makalah akademis. Label maksud kutipan utama untuk setiap objek Json ditentukan dengan kunci label sedangkan konteks kutipan ditentukan dengan kunci konteks. Contoh:
{
'string': 'In chacma baboons, male-infant relationships can be linked to both
formation of friendships and paternity success [30,31].'
'sectionName': 'Introduction',
'label': 'background',
'citingPaperId': '7a6b2d4b405439',
'citedPaperId': '9d1abadc55b5e0',
...
}
Anda dapat memperoleh informasi lengkap tentang makalah menggunakan id kertas yang disediakan dengan Semantic Scholar API ( https://api.semanticscholar.org/ ).
Labelnya adalah: Metode, Latar Belakang, Hasil
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://github.com/allenai/scicite
Kode sumber :
tfds.datasets.scicite.BuilderVersi :
-
1.0.0(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
22.12 MiBUkuran dataset :
7.26 MiBDi-cache otomatis ( dokumentasi ): Ya
Perpecahan :
| Membelah | Contoh |
|---|---|
'test' | 1.859 |
'train' | 8.194 |
'validation' | 916 |
- Struktur fitur :
FeaturesDict({
'citeEnd': int64,
'citeStart': int64,
'citedPaperId': Text(shape=(), dtype=string),
'citingPaperId': Text(shape=(), dtype=string),
'excerpt_index': int32,
'id': Text(shape=(), dtype=string),
'isKeyCitation': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label2_confidence': float32,
'label_confidence': float32,
'sectionName': Text(shape=(), dtype=string),
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
'string': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
| Fitur | Kelas | Membentuk | Dtype | Keterangan |
|---|---|---|---|---|
| fiturDict | ||||
| mengutipEnd | Tensor | int64 | ||
| mengutipMulai | Tensor | int64 | ||
| dikutipPaperId | Teks | rangkaian | ||
| mengutipPaperId | Teks | rangkaian | ||
| kutipan_indeks | Tensor | int32 | ||
| Indo | Teks | rangkaian | ||
| isKeyCitation | Tensor | bool | ||
| label | LabelKelas | int64 | ||
| label2 | LabelKelas | int64 | ||
| label2_kepercayaan | Tensor | float32 | ||
| label_kepercayaan | Tensor | float32 | ||
| nama bagian | Teks | rangkaian | ||
| sumber | LabelKelas | int64 | ||
| rangkaian | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_superviseddoc ):('string', 'label')Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}