- বর্ণনা :
SNLI কর্পাস (সংস্করণ 1.0) হল 570k মানব-লিখিত ইংরেজি বাক্য জোড়ার একটি সংকলন যা লেবেল এনটেইলমেন্ট, দ্বন্দ্ব এবং নিরপেক্ষ সহ ভারসাম্য শ্রেণীবিভাগের জন্য ম্যানুয়ালি লেবেল করা হয়েছে, যা ন্যাচারাল ল্যাঙ্গুয়েজ ইনফারেন্স (NLI) এর কাজকে সমর্থন করে, যা পাঠ্য এনটেইলমেন্ট স্বীকৃতি হিসাবেও পরিচিত। (আরটিই)।
অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন
সোর্স কোড :
tfds.datasets.snli.Builderসংস্করণ :
-
1.1.0(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড সাইজ :
90.17 MiBডেটাসেটের আকার :
87.00 MiBস্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 10,000 |
'train' | 550,152 |
'validation' | 10,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| অনুমান | পাঠ্য | স্ট্রিং | ||
| লেবেল | ক্লাসলেবেল | int64 | ||
| ভিত্তি | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):Noneচিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@inproceedings{snli:emnlp2015,
Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
Publisher = {Association for Computational Linguistics},
Title = {A large annotated corpus for learning natural language inference},
Year = {2015}
}