- Descripción :
Tablas de Wikipedia con al menos 3 filas y 2 columnas, se seleccionaron 3 filas aleatorias para cada tabla para su posterior anotación. Cada fila fue anotada por una persona diferente, por lo que el conjunto de datos está compuesto por pares (tabla de una fila, descripción de texto). Las anotaciones incluyen al menos 2 celdas de la fila, pero no es necesario incluirlas todas. El conjunto de datos sigue un formato de tabla estandarizado.
Página de inicio: https://github.com/msra-nlc/Table2Text
Código fuente :
tfds.structured.wiki_table_text.WikiTableTextVersiones :
-
1.0.0(predeterminado): Versión inicial.
-
Tamaño de descarga :
3.70 MiBTamaño del conjunto de datos :
4.64 MiBAlmacenamiento automático en caché ( documentación ): Sí
Divisiones :
| Separar | Ejemplos |
|---|---|
'test' | 2,000 |
'train' | 10,000 |
'validation' | 1,318 |
- Estructura de características :
FeaturesDict({
'input_text': FeaturesDict({
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Documentación de características :
| Rasgo | Clase | Forma | Tipo D | Descripción |
|---|---|---|---|---|
| CaracterísticasDict | ||||
| texto de entrada | CaracterísticasDict | |||
| entrada_texto/tabla | Secuencia | |||
| texto_de_entrada/tabla/encabezado_de_columna | Tensor | cuerda | ||
| entrada_texto/tabla/contenido | Tensor | cuerda | ||
| texto_de_entrada/tabla/número_de_fila | Tensor | int16 | ||
| texto_objetivo | Tensor | cuerda |
Teclas supervisadas (Ver
as_superviseddoc ):('input_text', 'target_text')Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@inproceedings{bao2018table,
title={Table-to-Text: Describing Table Region with Natural Language},
author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
booktitle={AAAI},
url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
year={2018}
}