- توضیحات :
این مجموعه داده ای برای طبقه بندی اهداف استنادی در مقالات دانشگاهی است. برچسب اصلی استناد برای هر شی Json با کلید برچسب مشخص می شود در حالی که زمینه استناد با یک کلید زمینه مشخص می شود. مثال:
{
'string': 'In chacma baboons, male-infant relationships can be linked to both
formation of friendships and paternity success [30,31].'
'sectionName': 'Introduction',
'label': 'background',
'citingPaperId': '7a6b2d4b405439',
'citedPaperId': '9d1abadc55b5e0',
...
}
می توانید اطلاعات کامل مقاله را با استفاده از شناسه های مقاله ارائه شده با Semantic Scholar API ( https://api.semanticscholar.org/ ) به دست آورید.
برچسب ها عبارتند از: روش، پس زمینه، نتیجه
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://github.com/allenai/scicite
کد منبع :
tfds.datasets.scicite.Builderنسخه ها :
-
1.0.0(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
22.12 MiBحجم مجموعه داده :
7.26 MiBذخیره خودکار ( اسناد ): بله
تقسیم ها :
| شکاف | مثال ها |
|---|---|
'test' | 1,859 |
'train' | 8,194 |
'validation' | 916 |
- ساختار ویژگی :
FeaturesDict({
'citeEnd': int64,
'citeStart': int64,
'citedPaperId': Text(shape=(), dtype=string),
'citingPaperId': Text(shape=(), dtype=string),
'excerpt_index': int32,
'id': Text(shape=(), dtype=string),
'isKeyCitation': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label2_confidence': float32,
'label_confidence': float32,
'sectionName': Text(shape=(), dtype=string),
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
'string': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
| ویژگی | کلاس | شکل | نوع D | شرح |
|---|---|---|---|---|
| FeaturesDict | ||||
| citeEnd | تانسور | int64 | ||
| citeStart | تانسور | int64 | ||
| به نقل از PaperId | متن | رشته | ||
| با استناد به PaperId | متن | رشته | ||
| excerpt_index | تانسور | int32 | ||
| شناسه | متن | رشته | ||
| isKeyCitation | تانسور | بوول | ||
| برچسب | ClassLabel | int64 | ||
| label2 | ClassLabel | int64 | ||
| label2_اعتماد | تانسور | float32 | ||
| برچسب_اعتماد | تانسور | float32 | ||
| نام بخش | متن | رشته | ||
| منبع | ClassLabel | int64 | ||
| رشته | متن | رشته |
کلیدهای نظارت شده (مشاهده
as_superviseddoc ):('string', 'label')شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}