- Mô tả :
QASC là một bộ dữ liệu trả lời câu hỏi tập trung vào thành phần câu. Nó bao gồm 9.980 câu hỏi trắc nghiệm 8 chiều về khoa học ở trường phổ thông (8.134 bài luyện tập, 926 bài phát triển, 920 bài kiểm tra) và đi kèm với kho văn bản gồm 17 triệu câu.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://allenai.org/data/qasc
Mã nguồn :
tfds.datasets.qasc.BuilderPhiên bản :
-
0.1.0(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
1.54 MiBKích thước tập dữ liệu :
6.61 MiBTự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
| Tách ra | ví dụ |
|---|---|
'test' | 920 |
'train' | 8.134 |
'validation' | 926 |
- Cấu trúc tính năng :
FeaturesDict({
'answerKey': Text(shape=(), dtype=string),
'choices': Sequence({
'label': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
}),
'combinedfact': Text(shape=(), dtype=string),
'fact1': Text(shape=(), dtype=string),
'fact2': Text(shape=(), dtype=string),
'formatted_question': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
| Tính năng | Lớp | Hình dạng | Dtype | Sự miêu tả |
|---|---|---|---|---|
| Tính năngDict | ||||
| câu trả lờiKey | Chữ | chuỗi | ||
| lựa chọn | Sự nối tiếp | |||
| lựa chọn/nhãn | Chữ | chuỗi | ||
| lựa chọn/văn bản | Chữ | chuỗi | ||
| thực tế kết hợp | Chữ | chuỗi | ||
| sự thật1 | Chữ | chuỗi | ||
| sự thật2 | Chữ | chuỗi | ||
| định dạng_câu hỏi | Chữ | chuỗi | ||
| Tôi | Chữ | chuỗi | ||
| câu hỏi | Chữ | chuỗi |
Các khóa được giám sát (Xem
as_superviseddoc ):NoneHình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@article{allenai:qasc,
author = {Tushar Khot and Peter Clark and Michal Guerquin and Peter Jansen and Ashish Sabharwal},
title = {QASC: A Dataset for Question Answering via Sentence Composition},
journal = {arXiv:1910.11473v2},
year = {2020},
}