- תיאור :
BoolQ הוא מערך תשובות לשאלות עבור שאלות כן/לא המכיל 15942 דוגמאות. שאלות אלו מתרחשות באופן טבעי, הן נוצרות בהגדרות לא מתבקשות ובלתי מוגבלות.
כל דוגמה היא שלישייה של (שאלה, קטע, תשובה), עם כותרת העמוד כהקשר נוסף אופציונלי. מערך הסיווג של צמד הטקסט דומה למשימות הסקת הסקת שפה טבעית קיימות.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://github.com/google-research-datasets/boolean-questions
קוד מקור :
tfds.datasets.bool_q.Builderגרסאות :
-
1.0.0(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
8.36 MiBגודל ערכת נתונים :
8.51 MiBשמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'train' | 9,427 |
'validation' | 3,270 |
- מבנה תכונה :
FeaturesDict({
'answer': bool,
'passage': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| FeaturesDict | ||||
| תשובה | מוֹתֵחַ | bool | ||
| מַעֲבָר | טֶקסט | חוּט | ||
| שְׁאֵלָה | טֶקסט | חוּט | ||
| כותרת | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):Noneאיור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@inproceedings{clark2019boolq,
title = {BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions},
author = {Clark, Christopher and Lee, Kenton and Chang, Ming-Wei, and Kwiatkowski, Tom and Collins, Michael, and Toutanova, Kristina},
booktitle = {NAACL},
year = {2019},
}