multi_actualités

  • Description :

Ensemble de données multi-actualités

Multi-News propose des articles d'actualité et des résumés rédigés par des experts, issus du site d'information newser.com . Chaque résumé est rédigé par des rédacteurs professionnels et inclut des liens vers les articles originaux cités.

Il s’agit du premier ensemble de données à grande échelle pour la synthèse multi-documents d’articles de presse.

Chaque enregistrement a deux caractéristiques :

Diviser Exemples
'test' 5 622
'train' 44 972
'validation' 5 622
  • Structure des fonctionnalités :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Fonctionnalité Classe Forme Type D Description
FonctionnalitésDict
document Texte chaîne
résumé Texte chaîne
  • Citation :
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}