- विवरण :
बहु-शैली प्राकृतिक भाषा अनुमान (मल्टीएनएलआई) कॉर्पस 433k वाक्य जोड़े का भीड़-स्रोत संग्रह है जो पाठ्य संबंधी जानकारी के साथ टिप्पणी करता है। कॉर्पस को एसएनएलआई कॉर्पस पर तैयार किया गया है, लेकिन इसमें भिन्नता है जिसमें बोली जाने वाली और लिखित पाठ की शैलियों की एक श्रृंखला शामिल है, और एक विशिष्ट क्रॉस-शैली सामान्यीकरण मूल्यांकन का समर्थन करती है। कॉर्पस कोपेनहेगन में EMNLP में RepEval 2017 कार्यशाला के साझा कार्य के आधार के रूप में कार्य करता है।
स्रोत कोड :
tfds.text.MultiNLIMismatchसंस्करण :
-
0.1.0(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड का आकार :
216.34 MiBडेटासेट का आकार :
90.91 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'train' | 392,702 |
'validation' | 10,000 |
- फ़ीचर संरचना :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': Text(shape=(), dtype=string),
'premise': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| परिकल्पना | मूलपाठ | डोरी | ||
| लेबल | मूलपाठ | डोरी | ||
| आधार | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_superviseddoc देखें):Noneचित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@InProceedings{N18-1101,
author = "Williams, Adina
and Nangia, Nikita
and Bowman, Samuel",
title = "A Broad-Coverage Challenge Corpus for
Sentence Understanding through Inference",
booktitle = "Proceedings of the 2018 Conference of
the North American Chapter of the
Association for Computational Linguistics:
Human Language Technologies, Volume 1 (Long
Papers)",
year = "2018",
publisher = "Association for Computational Linguistics",
pages = "1112--1122",
location = "New Orleans, Louisiana",
url = "http://aclweb.org/anthology/N18-1101"
}