- الوصف :
CORD-19 هو مورد لأكثر من 45000 مقالة علمية ، بما في ذلك أكثر من 33000 مقالة بنص كامل ، حول COVID-19 و SARS-CoV-2 وفيروسات كورونا ذات الصلة.
للمساعدة في تنظيم المعلومات في الآداب العلمية لـ COVID-19 من خلال التلخيص التجريدي. تقوم مجموعة البيانات هذه بتحليل تلك المقالات إلى أزواج من المستندات وملخصات من full_text-abstract أو مقدمة-abstract.
تتضمن الميزات سلاسل: abstract ، full_text ، sha (تجزئة pdf) ، source_x (مصدر النشر) ، العنوان ، doi (معرف الكائن الرقمي) ، الترخيص ، المؤلفون ، وقت النشر ، المجلة ، url.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
كود المصدر :
tfds.summarization.Covid19sumإصدارات :
-
1.0.0(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التنزيل :
Unknown sizeحجم مجموعة البيانات :
Unknown sizeإرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى
download_config.manual_dir(الإعدادات الافتراضية على~/tensorflow_datasets/downloads/manual/):
يجب تنزيل مجموعة البيانات هذه يدويًا من خلال kaggle api:kaggle datasets download allen-institute-for-ai/CORD-19-research-challengeضع الملف المضغوط الذي تم تنزيله في المجلد اليدوي.التخزين المؤقت التلقائي ( الوثائق ): غير معروف
الانقسامات :
| انشق، مزق | أمثلة |
|---|
- هيكل الميزة :
FeaturesDict({
'abstract': string,
'authors': string,
'body_text': Sequence({
'section': string,
'text': string,
}),
'doi': string,
'journal': string,
'license': string,
'publish_time': string,
'sha': string,
'source_x': string,
'title': string,
'url': string,
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع | وصف |
|---|---|---|---|---|
| الميزات | ||||
| نبذة مختصرة | موتر | سلسلة | ||
| المؤلفون | موتر | سلسلة | ||
| body_text | تسلسل | |||
| body_text / قسم | موتر | سلسلة | ||
| body_text / text | موتر | سلسلة | ||
| دوى | موتر | سلسلة | ||
| مجلة | موتر | سلسلة | ||
| رخصة | موتر | سلسلة | ||
| وقت النشر | موتر | سلسلة | ||
| شا | موتر | سلسلة | ||
| المصدر_x | موتر | سلسلة | ||
| لقب | موتر | سلسلة | ||
| عنوان url | موتر | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_superviseddoc ):('body_text', 'abstract')الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ): مفقود.
الاقتباس :
@ONLINE {CORD-19-research-challenge,
author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
title = "COVID-19 Open Research Dataset Challenge (CORD-19)",
month = "april",
year = "2020",
url = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}