- Açıklama :
 
Aşırı Özetleme (XSum) Veri Kümesi.
İki özellik vardır: - belge: Haber makalesi girin. - özet: Makalenin bir cümlelik özeti.
Bu verilerin https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md'de açıklandığı gibi manuel olarak indirilmesi ve çıkarılması gerekir. 'xsum-extracts-from-downloads' klasörü şu şekilde sıkıştırılmalıdır: 'xsum-extracts-from-downloads.tar.gz' ve manuel olarak indirilen klasöre koyun.
Ek Belgeler : Belgeleri Keşfedin
Ana sayfa : https://github.com/EdinburghNLP/XSum/tree/master/XSum-Dataset
Kaynak kodu :
tfds.summarization.Xsumsürümler :
-  
1.0.0: Temizlemeden veri seti. -  
1.1.0(varsayılan): Web içeriklerini kaldırır. 
-  
 İndirme boyutu :
2.59 MiBVeri kümesi boyutu :
512.03 MiBManuel indirme talimatları : Bu veri kümesi, kaynak verileri manuel olarak download_config.manual_dir içine
download_config.manual_dirgerektirir (varsayılan olarak~/tensorflow_datasets/downloads/manual/):
Ayrıntılı indirme talimatları (özel bir komut dosyası çalıştırmayı gerektirir) burada: https://github.com/EdinburghNLP/XSum/blob/master/XSum-Dataset/README.md#running-the-download-and-extraction-scripts Daha Sonra , lütfen xsum-extracts-from-downloads.tar.gz dosyasını manual_dir içine koyun.Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 11.301 | 
 'train' | 203.577 | 
 'validation' | 11.305 | 
- Özellik yapısı :
 
FeaturesDict({
    'document': Text(shape=(), dtype=string),
    'summary': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| belge | Metin | sicim | ||
| özet | Metin | sicim | 
Denetlenen anahtarlar (Bkz
as_superviseddoc ):('document', 'summary')Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
 
@article{Narayan2018DontGM,
  title={Don't Give Me the Details, Just the Summary! Topic-Aware Convolutional Neural Networks for Extreme Summarization},
  author={Shashi Narayan and Shay B. Cohen and Mirella Lapata},
  journal={ArXiv},
  year={2018},
  volume={abs/1808.08745}
}