- Açıklama :
 
DocNLI, belge düzeyinde doğal dil çıkarımı (NLI) için büyük ölçekli bir veri kümesidir. DocNLI, çok çeşitli NLP sorunlarından dönüştürülür ve birden çok metin türünü kapsar. Önermeler her zaman belge ayrıntı düzeyinde kalırken, hipotezlerin uzunluğu tek bir cümleden yüzlerce kelimelik pasajlara kadar değişir. Mevcut bazı cümle düzeyinde NLI veri kümelerinin aksine, DocNLI oldukça sınırlı eserlere sahiptir.
Ek Belgeler : Belgeleri Keşfedin
Ana Sayfa : https://github.com/salesforce/DocNLI/
Kaynak kodu :
tfds.text.docnli.DocNLIsürümler :
-  
1.0.0(varsayılan): İlk sürüm. 
-  
 İndirme boyutu :
313.89 MiBVeri kümesi boyutu :
3.07 GiBOtomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
| Bölmek | örnekler | 
|---|---|
 'test' | 267.086 | 
 'train' | 942.314 | 
 'validation' | 234.258 | 
- Özellik yapısı :
 
FeaturesDict({
    'hypothesis': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'premise': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
 
| Özellik | Sınıf | Şekil | Dtipi | Tanım | 
|---|---|---|---|---|
| ÖzelliklerDict | ||||
| hipotez | Metin | sicim | ||
| etiket | SınıfEtiketi | int64 | ||
| Öncül | Metin | sicim | 
Denetlenen anahtarlar (Bkz
as_superviseddoc ):NoneŞekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
 
@inproceedings{yin-etal-2021-docnli,
    title={DocNLI: A Large-scale Dataset for Document-level Natural Language Inference},
    author={Wenpeng Yin and Dragomir Radev and Caiming Xiong},
    booktitle = "Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021",
    month = aug,
    year = "2021",
    address = "Bangkok, Thailand",
    publisher = "Association for Computational Linguistics",
}