- Açıklama :
 
BillSum, ABD Kongre ve Kaliforniya eyalet yasa tasarılarının özeti.
Birkaç özellik vardır: - metin: fatura metni. - özet: faturaların özeti. - başlık: faturaların başlığı. ABD faturaları için özellikler. ca faturaları yok. - text_len: metindeki karakter sayısı. - sum_len: özetteki karakter sayısı.
Ek Belgeler : Belgeleri Keşfedin
Ana Sayfa : https://github.com/FiscalNote/BillSum
Kaynak kodu :
tfds.datasets.billsum.Buildersürümler :
-  
3.0.0(varsayılan): Sürüm notu yok. 
-  
 İndirme boyutu :
64.14 MiBVeri kümesi boyutu :
260.84 MiBOtomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
| Bölmek | örnekler | 
|---|---|
 'ca_test' | 1.237 | 
 'test' | 3.269 | 
 'train' | 18.949 | 
- Özellik yapısı :
 
FeaturesDict({
    'summary': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| özet | Metin | sicim | ||
| Metin | Metin | sicim | ||
| Başlık | Metin | sicim | 
Denetlenen anahtarlar (Bkz
as_superviseddoc ):('text', 'summary')Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
 
@misc{kornilova2019billsum,
    title={BillSum: A Corpus for Automatic Summarization of US Legislation},
    author={Anastassia Kornilova and Vlad Eidelman},
    year={2019},
    eprint={1910.00523},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}