- وصف :
برمجة Python الأساسية عبارة عن مجموعة من 161 مشكلة برمجة مع اختبارات الوحدة المصاحبة. تم إنشاؤها بهدف أن تكون جديدة (غير مسربة في وقت الإنشاء) وأكثر صعوبة من مجموعات البيانات المماثلة (على سبيل المثال، HumanEval وMBPP). يمكن أن يكون بمثابة بديل مباشر أو إثراء لمجموعات البيانات هذه حيث تم تنظيمها بطريقة مماثلة.
الصفحة الرئيسية : https://aclanthology.org/2024.findings-emnlp.772/
كود المصدر :
tfds.datasets.lbpp.Builder
الإصدارات :
-
2.0.0
(افتراضي): لا توجد ملاحظات الإصدار.
-
التخزين المؤقت التلقائي ( الوثائق ): نعم
هيكل الميزة :
FeaturesDict({
'categories': Sequence(Text(shape=(), dtype=string)),
'completion': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'language': Text(shape=(), dtype=string),
'signature': Text(shape=(), dtype=string),
'task_id': Text(shape=(), dtype=string),
'test_file': Text(shape=(), dtype=string),
'test_list': Sequence(Text(shape=(), dtype=string)),
'test_setup': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
فئات | التسلسل (النص) | (لا أحد،) | خيط | |
انتهاء | نص | خيط | ||
تعليمات | نص | خيط | ||
لغة | نص | خيط | ||
إمضاء | نص | خيط | ||
Task_id | نص | خيط | ||
test_file | نص | خيط | ||
test_list | التسلسل (النص) | (لا أحد،) | خيط | |
test_setup | نص | خيط | ||
عنوان | نص | خيط |
المفاتيح الخاضعة للإشراف (راجع
as_supervised
doc ):None
الشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :
@inproceedings{matton-etal-2024-leakage,
title = "On Leakage of Code Generation Evaluation Datasets",
author = "Matton, Alexandre and
Sherborne, Tom and
Aumiller, Dennis and
Tommasone, Elena and
Alizadeh, Milad and
He, Jingyi and
Ma, Raymond and
Voisin, Maxime and
Gilsenan-McMahon, Ellen and
Gall{\'e}, Matthias",
editor = "Al-Onaizan, Yaser and
Bansal, Mohit and
Chen, Yun-Nung",
booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2024",
month = nov,
year = "2024",
address = "Miami, Florida, USA",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2024.findings-emnlp.772/",
doi = "10.18653/v1/2024.findings-emnlp.772",
pages = "13215--13223",
}
lbpp/الكل (التكوين الافتراضي)
وصف التكوين : LBPP متعدد اللغات
حجم التحميل :
1.78 MiB
حجم مجموعة البيانات :
4.30 MiB
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 944 |
- أمثلة ( tfds.as_dataframe ):
lbpp/متعدد اللغات
وصف التكوين : LBPP متعدد اللغات
حجم التحميل :
1.78 MiB
حجم مجموعة البيانات :
4.30 MiB
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 944 |
- أمثلة ( tfds.as_dataframe ):
lbpp/default
وصف التكوين : بيثون LBPP
حجم التحميل :
279.90 KiB
حجم مجموعة البيانات :
627.04 KiB
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 162 |
- أمثلة ( tfds.as_dataframe ):
lbpp/بيثون
وصف التكوين : بيثون LBPP
حجم التحميل :
279.90 KiB
حجم مجموعة البيانات :
627.04 KiB
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 162 |
- أمثلة ( tfds.as_dataframe ):
رطل/CPP
وصف التكوين : C++ LBPP
حجم التحميل :
314.45 KiB
حجم مجموعة البيانات :
761.87 KiB
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 161 |
- أمثلة ( tfds.as_dataframe ):
lbpp/اذهب
وصف التكوين : انتقل إلى LBPP
حجم التحميل :
317.09 KiB
حجم مجموعة البيانات :
687.23 KiB
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 161 |
- أمثلة ( tfds.as_dataframe ):
lbpp/java
وصف التكوين : Java LBPP
حجم التحميل :
337.90 KiB
حجم مجموعة البيانات :
887.40 KiB
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 158 |
- أمثلة ( tfds.as_dataframe ):
lbpp/js
وصف التكوين : جافا سكريبت LBPP
حجم التحميل :
303.40 KiB
حجم مجموعة البيانات :
756.69 KiB
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 153 |
- أمثلة ( tfds.as_dataframe ):
lbpp/javascript
وصف التكوين : جافا سكريبت LBPP
حجم التحميل :
303.40 KiB
حجم مجموعة البيانات :
756.69 KiB
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 153 |
- أمثلة ( tfds.as_dataframe ):
lbpp/الصدأ
وصف التكوين : جافا سكريبت LBPP
حجم التحميل :
272.61 KiB
حجم مجموعة البيانات :
684.31 KiB
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 149 |
- أمثلة ( tfds.as_dataframe ):