multi_notizie

  • Descrizione :

Set di dati multi-notizie

Multi-News è composto da articoli di notizie e riassunti scritti da persone provenienti dal sito di notizie newser.com . Ogni riassunto è redatto professionalmente dai redattori e include link agli articoli originali citati.

Si tratta del primo set di dati su larga scala per la sintesi multi-documento di articoli di notizie.

Ogni record ha due caratteristiche:

Diviso Esempi
'test' 5.622
'train' 44.972
'validation' 5.622
  • Struttura delle caratteristiche :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
documento Testo corda
riepilogo Testo corda
  • Citazione :
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}