multi_news

  • Opis :

Zestaw danych Multi-News

Multi-News składa się z artykułów prasowych i ich streszczeń napisanych przez ludzi, pochodzących z serwisu newser.com . Każde streszczenie jest profesjonalnie napisane przez redaktorów i zawiera linki do oryginalnych, cytowanych artykułów.

Jest to pierwszy zbiór danych na dużą skalę umożliwiający podsumowania wielu dokumentów dotyczących artykułów informacyjnych.

Każdy rekord ma dwie cechy:

Podział Przykłady
'test' 5622
'train' 44 972
'validation' 5622
  • Struktura funkcji :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ danych Opis
FunkcjeSłownik
dokument Tekst smyczkowy
streszczenie Tekst smyczkowy
  • Cytat :
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}