multi_noticias

  • Descripción :

Conjunto de datos de múltiples noticias

Multi-News incluye artículos periodísticos y resúmenes de estos artículos, elaborados por profesionales, del sitio web newser.com . Cada resumen está redactado por editores profesionales e incluye enlaces a los artículos originales citados.

Este es el primer conjunto de datos a gran escala para el resumen de múltiples documentos sobre artículos de noticias.

Cada registro tiene dos características:

Dividir Ejemplos
'test' 5.622
'train' 44.972
'validation' 5.622
  • Estructura de características :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Documentación de características :
Característica Clase Forma Tipo D Descripción
CaracterísticasDict
documento Texto cadena
resumen Texto cadena
  • Cita :
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}