- الوصف :
هذه مجموعة بيانات لتصنيف نوايا الاقتباس في الأوراق الأكاديمية. يتم تحديد التسمية الرئيسية لهدف الاقتباس لكل كائن Json بمفتاح التسمية بينما يتم تحديد سياق الاقتباس بمفتاح سياق. مثال:
{
'string': 'In chacma baboons, male-infant relationships can be linked to both
formation of friendships and paternity success [30,31].'
'sectionName': 'Introduction',
'label': 'background',
'citingPaperId': '7a6b2d4b405439',
'citedPaperId': '9d1abadc55b5e0',
...
}
يمكنك الحصول على المعلومات الكاملة حول الورقة باستخدام معرفات الورق المتوفرة مع Semantic Scholar API ( https://api.semanticscholar.org/ ).
الملصقات هي: الطريقة ، الخلفية ، النتيجة
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://github.com/allenai/scicite
كود المصدر :
tfds.datasets.scicite.Builderإصدارات :
-
1.0.0(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
22.12 MiBحجم مجموعة البيانات :
7.26 MiBالتخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
| انشق، مزق | أمثلة |
|---|---|
'test' | 1،859 |
'train' | 8194 |
'validation' | 916 |
- هيكل الميزة :
FeaturesDict({
'citeEnd': int64,
'citeStart': int64,
'citedPaperId': Text(shape=(), dtype=string),
'citingPaperId': Text(shape=(), dtype=string),
'excerpt_index': int32,
'id': Text(shape=(), dtype=string),
'isKeyCitation': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label2_confidence': float32,
'label_confidence': float32,
'sectionName': Text(shape=(), dtype=string),
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
'string': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| الميزات | ||||
| استشهد | موتر | int64 | ||
| استشهد | موتر | int64 | ||
| تم الاستشهاد به | نص | سلسلة | ||
| نقلا عن PaperId | نص | سلسلة | ||
| مقتطفات_الفهرس | موتر | int32 | ||
| هوية شخصية | نص | سلسلة | ||
| هو المفتاح | موتر | منطقي | ||
| ضع الكلمة المناسبة | ClassLabel | int64 | ||
| التسمية 2 | ClassLabel | int64 | ||
| label2_confidence | موتر | تعويم 32 | ||
| الثقة التسمية | موتر | تعويم 32 | ||
| اسم القسم | نص | سلسلة | ||
| مصدر | ClassLabel | int64 | ||
| سلسلة | نص | سلسلة |
المفاتيح الخاضعة للإشراف (راجع المستند
as_supervised):('string', 'label')الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}