- Descripción :
La programación Python menos básica es una colección de 161 problemas de programación acompañados de pruebas unitarias. Fueron creados con el objetivo de ser nuevos (no filtrados en el momento de la creación) y más difíciles que conjuntos de datos similares (por ejemplo, HumanEval y MBPP). Puede servir como reemplazo o enriquecimiento directo de esos conjuntos de datos, ya que están estructurados de manera equivalente.
Página de inicio : https://aclanthology.org/2024.findings-emnlp.772/
Código fuente :
tfds.datasets.lbpp.BuilderVersiones :
-
2.0.0(predeterminado): sin notas de la versión.
-
Almacenamiento en caché automático ( documentación ): Sí
Estructura de características :
FeaturesDict({
'categories': Sequence(Text(shape=(), dtype=string)),
'completion': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'language': Text(shape=(), dtype=string),
'signature': Text(shape=(), dtype=string),
'task_id': Text(shape=(), dtype=string),
'test_file': Text(shape=(), dtype=string),
'test_list': Sequence(Text(shape=(), dtype=string)),
'test_setup': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentación de funciones :
| Característica | Clase | Forma | tipo D | Descripción |
|---|---|---|---|---|
| FuncionesDict | ||||
| categorias | Secuencia (Texto) | (Ninguno,) | cadena | |
| terminación | Texto | cadena | ||
| instrucción | Texto | cadena | ||
| idioma | Texto | cadena | ||
| firma | Texto | cadena | ||
| id_tarea | Texto | cadena | ||
| archivo_prueba | Texto | cadena | ||
| lista_prueba | Secuencia (Texto) | (Ninguno,) | cadena | |
| configuración_prueba | Texto | cadena | ||
| título | Texto | cadena |
Claves supervisadas (ver documento
as_supervised):NoneFigura ( tfds.show_examples ): no compatible.
Cita :
@inproceedings{matton-etal-2024-leakage,
title = "On Leakage of Code Generation Evaluation Datasets",
author = "Matton, Alexandre and
Sherborne, Tom and
Aumiller, Dennis and
Tommasone, Elena and
Alizadeh, Milad and
He, Jingyi and
Ma, Raymond and
Voisin, Maxime and
Gilsenan-McMahon, Ellen and
Gall{\'e}, Matthias",
editor = "Al-Onaizan, Yaser and
Bansal, Mohit and
Chen, Yun-Nung",
booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2024",
month = nov,
year = "2024",
address = "Miami, Florida, USA",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2024.findings-emnlp.772/",
doi = "10.18653/v1/2024.findings-emnlp.772",
pages = "13215--13223",
}
lbpp/all (configuración predeterminada)
Descripción de la configuración : LBPP multilingüe
Tamaño de descarga :
1.78 MiBTamaño del conjunto de datos :
4.30 MiBDivisiones :
| Dividir | Ejemplos |
|---|---|
'test' | 944 |
- Ejemplos ( tfds.as_dataframe ):
lbpp/multilingüe
Descripción de la configuración : LBPP multilingüe
Tamaño de descarga :
1.78 MiBTamaño del conjunto de datos :
4.30 MiBDivisiones :
| Dividir | Ejemplos |
|---|---|
'test' | 944 |
- Ejemplos ( tfds.as_dataframe ):
lbpp/predeterminado
Descripción de la configuración : Python LBPP
Tamaño de descarga :
279.90 KiBTamaño del conjunto de datos :
627.04 KiBDivisiones :
| Dividir | Ejemplos |
|---|---|
'test' | 162 |
- Ejemplos ( tfds.as_dataframe ):
lbpp/python
Descripción de la configuración : Python LBPP
Tamaño de descarga :
279.90 KiBTamaño del conjunto de datos :
627.04 KiBDivisiones :
| Dividir | Ejemplos |
|---|---|
'test' | 162 |
- Ejemplos ( tfds.as_dataframe ):
lbpp/cpp
Descripción de la configuración : C++ LBPP
Tamaño de descarga :
314.45 KiBTamaño del conjunto de datos :
761.87 KiBDivisiones :
| Dividir | Ejemplos |
|---|---|
'test' | 161 |
- Ejemplos ( tfds.as_dataframe ):
lbpp/ir
Descripción de la configuración : Ir LBPP
Tamaño de descarga :
317.09 KiBTamaño del conjunto de datos :
687.23 KiBDivisiones :
| Dividir | Ejemplos |
|---|---|
'test' | 161 |
- Ejemplos ( tfds.as_dataframe ):
lbpp/java
Descripción de la configuración : Java LBPP
Tamaño de descarga :
337.90 KiBTamaño del conjunto de datos :
887.40 KiBDivisiones :
| Dividir | Ejemplos |
|---|---|
'test' | 158 |
- Ejemplos ( tfds.as_dataframe ):
lbpp/js
Descripción de la configuración : JavaScript LBPP
Tamaño de descarga :
303.40 KiBTamaño del conjunto de datos :
756.69 KiBDivisiones :
| Dividir | Ejemplos |
|---|---|
'test' | 153 |
- Ejemplos ( tfds.as_dataframe ):
lbpp/javascript
Descripción de la configuración : JavaScript LBPP
Tamaño de descarga :
303.40 KiBTamaño del conjunto de datos :
756.69 KiBDivisiones :
| Dividir | Ejemplos |
|---|---|
'test' | 153 |
- Ejemplos ( tfds.as_dataframe ):
lbpp/óxido
Descripción de la configuración : JavaScript LBPP
Tamaño de descarga :
272.61 KiBTamaño del conjunto de datos :
684.31 KiBDivisiones :
| Dividir | Ejemplos |
|---|---|
'test' | 149 |
- Ejemplos ( tfds.as_dataframe ):