multi_news

  • 설명 :

다중 뉴스 데이터 세트

멀티 뉴스는 뉴스 사이트 newser.com 의 뉴스 기사와 직접 작성한 요약으로 구성되어 있습니다. 각 요약은 편집자들이 전문적으로 작성했으며, 인용된 원문 기사로 연결되는 링크가 포함되어 있습니다.

이는 뉴스 기사에 대한 다중 문서 요약을 위한 최초의 대규모 데이터 세트입니다.

각 레코드에는 두 가지 특징이 있습니다.

나뉘다 예시
'test' 5,622
'train' 44,972
'validation' 5,622
  • 기능 구조 :
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
  • 기능 설명서 :
특징 수업 모양 디타입 설명
특징 사전
문서 텍스트
요약 텍스트
  • 인용 :
@misc{alex2019multinews,
    title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
    author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
    year={2019},
    eprint={1906.01749},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}