çoklu_haberler

  • Tanım :

Çoklu Haber Veri Seti

Multi-News, newser.com haber sitesindeki haber makalelerinden ve bu makalelerin insan eliyle yazılmış özetlerinden oluşur. Her özet, editörler tarafından profesyonelce yazılır ve atıfta bulunulan orijinal makalelere bağlantılar içerir.

Bu, haber makaleleri hakkında çoklu belge özetlemesi için ilk büyük ölçekli veri kümesidir.

Her kaydın iki özelliği vardır:

Bölmek Örnekler
'test' 5.622
'train' 44.972
'validation' 5.622
  • Özellik yapısı :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Özellik dokümantasyonu :
Özellik Sınıf Şekil Veri türü Tanım
ÖzelliklerDict
belge Metin sicim
özet Metin sicim
  • Alıntı :
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}