- คำอธิบาย :
BillSum การสรุปร่างกฎหมายของรัฐสภาสหรัฐฯ และรัฐแคลิฟอร์เนีย
มีคุณสมบัติหลายประการ: - ข้อความ: ข้อความบิล - สรุป: สรุปตั๋วเงิน - หัวเรื่อง: หัวเรื่องของตั๋วเงิน คุณสมบัติสำหรับเราค่า ใบเรียกเก็บเงิน ca ไม่มี - text_len: จำนวนตัวอักษรในข้อความ - sum_len: จำนวนตัวอักษรโดยสรุป
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
หน้าแรก : https://github.com/FiscalNote/BillSum
รหัสที่มา :
tfds.datasets.billsum.Builderรุ่น :
-
3.0.0(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดการดาวน์โหลด :
64.14 MiBขนาดชุดข้อมูล :
260.84 MiBแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
| แยก | ตัวอย่าง |
|---|---|
'ca_test' | 1,237 |
'test' | 3,269 |
'train' | 18,949 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'summary': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
| ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
|---|---|---|---|---|
| คุณสมบัติDict | ||||
| สรุป | ข้อความ | สตริง | ||
| ข้อความ | ข้อความ | สตริง | ||
| ชื่อ | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_superviseddoc ):('text', 'summary')รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@misc{kornilova2019billsum,
title={BillSum: A Corpus for Automatic Summarization of US Legislation},
author={Anastassia Kornilova and Vlad Eidelman},
year={2019},
eprint={1910.00523},
archivePrefix={arXiv},
primaryClass={cs.CL}
}