- Descrizione :
Il set di dati dei rapporti governativi è costituito da rapporti scritti da agenzie di ricerca governative, tra cui il Congressional Research Service e l'US Government Accountability Office.
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://gov-report-data.github.io/
Codice sorgente :
tfds.summarization.gov_report.GovReportVersioni :
-
1.0.0(impostazione predefinita): versione iniziale.
-
Dimensione del download :
320.59 MiBCache automatica ( documentazione ): No
Figura ( tfds.show_examples ): non supportato.
Citazione :
@inproceedings{
anonymous2022efficiently,
title={Efficiently Modeling Long Sequences with Structured State Spaces},
author={Anonymous},
booktitle={Submitted to The Tenth International Conference on Learning Representations },
year={2022},
url={https://openreview.net/forum?id=uYLFoz1vlAC},
note={under review}
}
gov_report/crs_whitespace (configurazione predefinita)
Descrizione della configurazione : rapporto CRS con riepilogo. Strutture appiattite e unite da spazi bianchi. Questo è il formato utilizzato dalla carta originale
Dimensione del set di dati:
349.76 MiBDivisioni :
| Diviso | Esempi |
|---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Struttura delle caratteristiche :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
| Caratteristica | Classe | Forma | Tipo D | Descrizione |
|---|---|---|---|---|
| CaratteristicheDict | ||||
| id | Testo | corda | ||
| data_rilascio | Testo | corda | ||
| rapporti | Testo | corda | ||
| riepilogo | Testo | corda | ||
| titolo | Testo | corda |
Chiavi supervisionate (Vedi
as_superviseddoc ):('reports', 'summary')Esempi ( tfds.as_dataframe ):
gov_report/gao_whitespace
Descrizione della configurazione : rapporto GAO con evidenziazione Strutture appiattite e unite da spazi bianchi. Questo è il formato utilizzato dalla carta originale
Dimensione del set di dati:
690.24 MiBDivisioni :
| Diviso | Esempi |
|---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Struttura delle caratteristiche :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
| Caratteristica | Classe | Forma | Tipo D | Descrizione |
|---|---|---|---|---|
| CaratteristicheDict | ||||
| fastfact | Testo | corda | ||
| evidenziare | Testo | corda | ||
| id | Testo | corda | ||
| data_pubblicata | Testo | corda | ||
| data_rilascio | Testo | corda | ||
| rapporto | Testo | corda | ||
| titolo | Testo | corda | ||
| URL | Testo | corda |
Chiavi supervisionate (Vedi
as_superviseddoc ):('report', 'highlight')Esempi ( tfds.as_dataframe ):
gov_report/crs_html
Descrizione della configurazione : rapporto CRS con riepilogo. Strutture appiattite e unite da newline durante l'aggiunta di tag html. I tag vengono aggiunti solo per secition_title in un formato come
<h2>xxx<h2>.Dimensione del set di dati:
351.25 MiBDivisioni :
| Diviso | Esempi |
|---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Struttura delle caratteristiche :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
| Caratteristica | Classe | Forma | Tipo D | Descrizione |
|---|---|---|---|---|
| CaratteristicheDict | ||||
| id | Testo | corda | ||
| data_rilascio | Testo | corda | ||
| rapporti | Testo | corda | ||
| riepilogo | Testo | corda | ||
| titolo | Testo | corda |
Chiavi supervisionate (Vedi
as_superviseddoc ):('reports', 'summary')Esempi ( tfds.as_dataframe ):
gov_report/gao_html
Descrizione della configurazione : rapporto GAO con evidenziazione Strutture appiattite e unite da una nuova riga durante l'aggiunta di tag html. I tag vengono aggiunti solo per secition_title in un formato come
<h2>xxx<h2>.Dimensione del set di dati:
692.72 MiBDivisioni :
| Diviso | Esempi |
|---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Struttura delle caratteristiche :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
| Caratteristica | Classe | Forma | Tipo D | Descrizione |
|---|---|---|---|---|
| CaratteristicheDict | ||||
| fastfact | Testo | corda | ||
| evidenziare | Testo | corda | ||
| id | Testo | corda | ||
| data_pubblicata | Testo | corda | ||
| data_rilascio | Testo | corda | ||
| rapporto | Testo | corda | ||
| titolo | Testo | corda | ||
| URL | Testo | corda |
Chiavi supervisionate (Vedi
as_superviseddoc ):('report', 'highlight')Esempi ( tfds.as_dataframe ):
gov_report/crs_json
Descrizione della configurazione : rapporto CRS con riepilogo. Strutture rappresentate come raw json.
Dimensione del set di dati:
361.92 MiBDivisioni :
| Diviso | Esempi |
|---|---|
'test' | 362 |
'train' | 6.514 |
'validation' | 362 |
- Struttura delle caratteristiche :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'reports': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
| Caratteristica | Classe | Forma | Tipo D | Descrizione |
|---|---|---|---|---|
| CaratteristicheDict | ||||
| id | Testo | corda | ||
| data_rilascio | Testo | corda | ||
| rapporti | Testo | corda | ||
| riepilogo | Testo | corda | ||
| titolo | Testo | corda |
Chiavi supervisionate (Vedi
as_superviseddoc ):('reports', 'summary')Esempi ( tfds.as_dataframe ):
gov_report/gao_json
Descrizione della configurazione : rapporto GAO con evidenziazione Strutture rappresentate come raw json.
Dimensione del set di dati:
712.82 MiBDivisioni :
| Diviso | Esempi |
|---|---|
'test' | 611 |
'train' | 11.005 |
'validation' | 612 |
- Struttura delle caratteristiche :
FeaturesDict({
'fastfact': Text(shape=(), dtype=string),
'highlight': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'published_date': Text(shape=(), dtype=string),
'released_date': Text(shape=(), dtype=string),
'report': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
| Caratteristica | Classe | Forma | Tipo D | Descrizione |
|---|---|---|---|---|
| CaratteristicheDict | ||||
| fastfact | Testo | corda | ||
| evidenziare | Testo | corda | ||
| id | Testo | corda | ||
| data_pubblicata | Testo | corda | ||
| data_rilascio | Testo | corda | ||
| rapporto | Testo | corda | ||
| titolo | Testo | corda | ||
| URL | Testo | corda |
Chiavi supervisionate (Vedi
as_superviseddoc ):('report', 'highlight')Esempi ( tfds.as_dataframe ):