- وصف :
برمجة Python الأساسية عبارة عن مجموعة من 161 مشكلة برمجة مع اختبارات الوحدة المصاحبة. تم إنشاؤها بهدف أن تكون جديدة (غير مسربة في وقت الإنشاء) وأكثر صعوبة من مجموعات البيانات المماثلة (على سبيل المثال، HumanEval وMBPP). يمكن أن يكون بمثابة بديل مباشر أو إثراء لمجموعات البيانات هذه حيث تم تنظيمها بطريقة مماثلة.
الصفحة الرئيسية : https://aclanthology.org/2024.findings-emnlp.772/
كود المصدر :
tfds.datasets.lbpp.Builderالإصدارات :
-
2.0.0(افتراضي): لا توجد ملاحظات الإصدار.
-
التخزين المؤقت التلقائي ( الوثائق ): نعم
هيكل الميزة :
FeaturesDict({
'categories': Sequence(Text(shape=(), dtype=string)),
'completion': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'language': Text(shape=(), dtype=string),
'signature': Text(shape=(), dtype=string),
'task_id': Text(shape=(), dtype=string),
'test_file': Text(shape=(), dtype=string),
'test_list': Sequence(Text(shape=(), dtype=string)),
'test_setup': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- وثائق الميزة :
| ميزة | فصل | شكل | نوع D | وصف |
|---|---|---|---|---|
| المميزاتDict | ||||
| فئات | التسلسل (النص) | (لا أحد،) | خيط | |
| انتهاء | نص | خيط | ||
| تعليمات | نص | خيط | ||
| لغة | نص | خيط | ||
| إمضاء | نص | خيط | ||
| Task_id | نص | خيط | ||
| test_file | نص | خيط | ||
| test_list | التسلسل (النص) | (لا أحد،) | خيط | |
| test_setup | نص | خيط | ||
| عنوان | نص | خيط |
المفاتيح الخاضعة للإشراف (راجع
as_superviseddoc ):Noneالشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :
@inproceedings{matton-etal-2024-leakage,
title = "On Leakage of Code Generation Evaluation Datasets",
author = "Matton, Alexandre and
Sherborne, Tom and
Aumiller, Dennis and
Tommasone, Elena and
Alizadeh, Milad and
He, Jingyi and
Ma, Raymond and
Voisin, Maxime and
Gilsenan-McMahon, Ellen and
Gall{\'e}, Matthias",
editor = "Al-Onaizan, Yaser and
Bansal, Mohit and
Chen, Yun-Nung",
booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2024",
month = nov,
year = "2024",
address = "Miami, Florida, USA",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2024.findings-emnlp.772/",
doi = "10.18653/v1/2024.findings-emnlp.772",
pages = "13215--13223",
}
lbpp/الكل (التكوين الافتراضي)
وصف التكوين : LBPP متعدد اللغات
حجم التحميل :
1.78 MiBحجم مجموعة البيانات :
4.30 MiBالإنشقاقات :
| ينقسم | أمثلة |
|---|---|
'test' | 944 |
- أمثلة ( tfds.as_dataframe ):
lbpp/متعدد اللغات
وصف التكوين : LBPP متعدد اللغات
حجم التحميل :
1.78 MiBحجم مجموعة البيانات :
4.30 MiBالإنشقاقات :
| ينقسم | أمثلة |
|---|---|
'test' | 944 |
- أمثلة ( tfds.as_dataframe ):
lbpp/default
وصف التكوين : بيثون LBPP
حجم التحميل :
279.90 KiBحجم مجموعة البيانات :
627.04 KiBالإنشقاقات :
| ينقسم | أمثلة |
|---|---|
'test' | 162 |
- أمثلة ( tfds.as_dataframe ):
lbpp/بيثون
وصف التكوين : بيثون LBPP
حجم التحميل :
279.90 KiBحجم مجموعة البيانات :
627.04 KiBالإنشقاقات :
| ينقسم | أمثلة |
|---|---|
'test' | 162 |
- أمثلة ( tfds.as_dataframe ):
رطل/CPP
وصف التكوين : C++ LBPP
حجم التحميل :
314.45 KiBحجم مجموعة البيانات :
761.87 KiBالإنشقاقات :
| ينقسم | أمثلة |
|---|---|
'test' | 161 |
- أمثلة ( tfds.as_dataframe ):
lbpp/اذهب
وصف التكوين : انتقل إلى LBPP
حجم التحميل :
317.09 KiBحجم مجموعة البيانات :
687.23 KiBالإنشقاقات :
| ينقسم | أمثلة |
|---|---|
'test' | 161 |
- أمثلة ( tfds.as_dataframe ):
lbpp/java
وصف التكوين : Java LBPP
حجم التحميل :
337.90 KiBحجم مجموعة البيانات :
887.40 KiBالإنشقاقات :
| ينقسم | أمثلة |
|---|---|
'test' | 158 |
- أمثلة ( tfds.as_dataframe ):
lbpp/js
وصف التكوين : جافا سكريبت LBPP
حجم التحميل :
303.40 KiBحجم مجموعة البيانات :
756.69 KiBالإنشقاقات :
| ينقسم | أمثلة |
|---|---|
'test' | 153 |
- أمثلة ( tfds.as_dataframe ):
lbpp/javascript
وصف التكوين : جافا سكريبت LBPP
حجم التحميل :
303.40 KiBحجم مجموعة البيانات :
756.69 KiBالإنشقاقات :
| ينقسم | أمثلة |
|---|---|
'test' | 153 |
- أمثلة ( tfds.as_dataframe ):
lbpp/الصدأ
وصف التكوين : جافا سكريبت LBPP
حجم التحميل :
272.61 KiBحجم مجموعة البيانات :
684.31 KiBالإنشقاقات :
| ينقسم | أمثلة |
|---|---|
'test' | 149 |
- أمثلة ( tfds.as_dataframe ):