- Açıklama :
 
SummScreen Özetleme veri kümesi, anonimleştirilmemiş, belirteçleştirilmemiş sürüm.
Train/val/test bölmeleri ve filtreleme, son belirteçleştirilmiş veri kümesini temel alır, ancak sağlanan transkriptler ve özetler, belirteçleştirilmemiş metni temel alır.
İki özellik vardır:
- transkript: Tam bölüm transkriptleri, her diyalog satırı yeni satırlarla ayrılmış
 recap: Bölümlerin özetleri veya özetleri
Ana Sayfa : https://github.com/mingdachen/SummScreen
Kaynak kodu :
tfds.datasets.summscreen.Buildersürümler :
-  
1.0.0(varsayılan): İlk sürüm. 
-  
 İndirme boyutu :
841.27 MiBDenetimli anahtarlar (Bkz
as_superviseddoc ):('transcript', 'recap')Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@article{DBLP:journals/corr/abs-2104-07091,
  author    = {Mingda Chen and
               Zewei Chu and
               Sam Wiseman and
               Kevin Gimpel},
  title     = {SummScreen: {A} Dataset for Abstractive Screenplay Summarization},
  journal   = {CoRR},
  volume    = {abs/2104.07091},
  year      = {2021},
  url       = {https://arxiv.org/abs/2104.07091},
  archivePrefix = {arXiv},
  eprint    = {2104.07091},
  timestamp = {Mon, 19 Apr 2021 16:45:47 +0200},
  biburl    = {https://dblp.org/rec/journals/corr/abs-2104-07091.bib},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}
summscreen/fd (varsayılan yapılandırma)
Yapılandırma açıklaması : ForeverDreaming
Veri kümesi boyutu :
132.99 MiBOtomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 337 | 
 'train' | 3.673 | 
 'validation' | 338 | 
- Özellik yapısı :
 
FeaturesDict({
    'episode_number': Text(shape=(), dtype=string),
    'episode_title': Text(shape=(), dtype=string),
    'recap': Text(shape=(), dtype=string),
    'show_title': Text(shape=(), dtype=string),
    'transcript': Text(shape=(), dtype=string),
    'transcript_author': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Açıklama | 
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| bölüm_numarası | Metin | sicim | ||
| bölüm_başlığı | Metin | sicim | ||
| özet | Metin | sicim | ||
| başlığı göster | Metin | sicim | ||
| Transcript | Metin | sicim | ||
| transkript_yazar | Metin | sicim | 
- Örnekler ( tfds.as_dataframe ):
 
özet ekranı/tms
Yapılandırma açıklaması : TVMegaSite
Veri kümesi boyutu :
592.53 MiBOtomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 1.793 | 
 'train' | 18.915 | 
 'validation' | 1.795 | 
- Özellik yapısı :
 
FeaturesDict({
    'episode_summary': Text(shape=(), dtype=string),
    'recap': Text(shape=(), dtype=string),
    'recap_author': Text(shape=(), dtype=string),
    'show_title': Text(shape=(), dtype=string),
    'transcript': Text(shape=(), dtype=string),
    'transcript_author': Tensor(shape=(None,), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Açıklama | 
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| bölüm_özeti | Metin | sicim | ||
| özet | Metin | sicim | ||
| özet_yazar | Metin | sicim | ||
| başlığı göster | Metin | sicim | ||
| Transcript | Metin | sicim | ||
| transkript_yazar | tensör | (Hiçbiri,) | sicim | 
- Örnekler ( tfds.as_dataframe ):