multi_berita

  • Keterangan :

Kumpulan Data Multi-Berita

Multi-News terdiri dari artikel berita dan ringkasan artikel yang ditulis tangan dari situs berita newser.com . Setiap ringkasan ditulis secara profesional oleh editor dan menyertakan tautan ke artikel asli yang dikutip.

Ini adalah kumpulan data berskala besar pertama untuk peringkasan multi-dokumen pada artikel berita.

Setiap rekaman memiliki dua fitur:

Membelah Contoh
'test' 5.622
'train' 44.972
'validation' 5.622
  • Struktur fitur :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Tipe D Keterangan
FiturDict
dokumen Teks rangkaian
ringkasan Teks rangkaian
  • Kutipan :
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}