- תיאור :
QASC הוא מערך תשובות לשאלות עם התמקדות בהרכב משפטים. הוא מורכב מ-9,980 שאלות מרובות ברירות 8-כיווניות על מדעים של בית ספר תיכון (8,134 רכבת, 926 הפיתוח, מבחן 920), ומגיע עם קורפוס של 17 מיליון משפטים.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://allenai.org/data/qasc
קוד מקור :
tfds.datasets.qasc.Builderגרסאות :
-
0.1.0(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
1.54 MiBגודל ערכת נתונים :
6.61 MiBשמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
| לְפַצֵל | דוגמאות |
|---|---|
'test' | 920 |
'train' | 8,134 |
'validation' | 926 |
- מבנה תכונה :
FeaturesDict({
'answerKey': Text(shape=(), dtype=string),
'choices': Sequence({
'label': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
}),
'combinedfact': Text(shape=(), dtype=string),
'fact1': Text(shape=(), dtype=string),
'fact2': Text(shape=(), dtype=string),
'formatted_question': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
| תכונה | מעמד | צוּרָה | Dtype | תיאור |
|---|---|---|---|---|
| FeaturesDict | ||||
| מקש מענה | טֶקסט | חוּט | ||
| בחירות | סדר פעולות | |||
| בחירות/תווית | טֶקסט | חוּט | ||
| אפשרויות/טקסט | טֶקסט | חוּט | ||
| עובדה משולבת | טֶקסט | חוּט | ||
| עובדה 1 | טֶקסט | חוּט | ||
| עובדה 2 | טֶקסט | חוּט | ||
| formatted_question | טֶקסט | חוּט | ||
| תְעוּדַת זֶהוּת | טֶקסט | חוּט | ||
| שְׁאֵלָה | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_superviseddoc ):Noneאיור ( tfds.show_examples ): לא נתמך.
דוגמאות ( tfds.as_dataframe ):
- ציטוט :
@article{allenai:qasc,
author = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
title = {QASC: A Dataset for Question Answering via Sentence Composition},
journal = {arXiv:1910.11473v2},
year = {2020},
}