- Açıklama :
 
WikiBio, Wikipedia biyografi sayfaları kullanılarak oluşturulmuştur, ilk paragrafı ve belirtilmiş bilgi kutusunu içerir. Veri kümesi, standartlaştırılmış bir tablo biçimini izler.
Ek Belgeler : Belgeleri Keşfedin
Ana Sayfa : https://github.com/DavidGrangier/wikipedia-biography-dataset
Kaynak kodu :
tfds.structured.WikiBiosürümler :
-  
0.1.0(varsayılan): Sürüm notu yok. 
-  
 İndirme boyutu :
318.53 MiBVeri kümesi boyutu :
795.98 MiBOtomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 72.831 | 
 'train' | 582.659 | 
 'validation' | 72.831 | 
- Özellik yapısı :
 
FeaturesDict({
    'input_text': FeaturesDict({
        'context': string,
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| giriş metni | ÖzelliklerDict | |||
| girdi_metni/bağlam | tensör | sicim | ||
| girdi_metni/tablo | Sekans | |||
| girdi_metni/tablo/sütun_başlığı | tensör | sicim | ||
| girdi_metni/tablo/içerik | tensör | sicim | ||
| girdi_metni/tablo/satır_numarası | tensör | int16 | ||
| hedef_metin | tensör | sicim | 
Denetlenen anahtarlar (Bkz
as_superviseddoc ):('input_text', 'target_text')Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
 
@inproceedings{lebret-etal-2016-neural,
    title = "Neural Text Generation from Structured Data with Application to the Biography Domain",
    author = "Lebret, R{'e}mi  and
      Grangier, David  and
      Auli, Michael",
    booktitle = "Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing",
    month = nov,
    year = "2016",
    address = "Austin, Texas",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/D16-1128",
    doi = "10.18653/v1/D16-1128",
    pages = "1203--1213",
}