- Descrizione :
CORD-19 è una risorsa di oltre 45.000 articoli accademici, di cui oltre 33.000 con testo completo, su COVID-19, SARS-CoV-2 e relativi coronavirus.
Aiutare a organizzare le informazioni nelle letterature scientifiche di COVID-19 attraverso il riepilogo astrattivo. Questo set di dati analizza quegli articoli in coppie di documenti e riepiloghi di testo completo-abstract o introduzione-abstract.
Le funzionalità includono stringhe di: abstract, full_text, sha (hash di pdf), source_x (fonte di pubblicazione), titolo, doi (identificatore di oggetto digitale), licenza, autori, ora di pubblicazione, rivista, url.
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
Codice sorgente :
tfds.summarization.Covid19sumVersioni :
-
1.0.0(impostazione predefinita): nessuna nota di rilascio.
-
Dimensioni del download :
Unknown sizeDimensioni del set di dati :
Unknown sizeIstruzioni per il download manuale : questo set di dati richiede di scaricare manualmente i dati di origine in
download_config.manual_dir(il valore predefinito~/tensorflow_datasets/downloads/manual/):
Questo set di dati deve essere scaricato manualmente tramite kaggle api:kaggle datasets download allen-institute-for-ai/CORD-19-research-challengePosiziona il file zip scaricato nella cartella manual.Cache automatica ( documentazione ): Sconosciuto
Divisioni :
| Diviso | Esempi |
|---|
- Struttura delle caratteristiche :
FeaturesDict({
'abstract': string,
'authors': string,
'body_text': Sequence({
'section': string,
'text': string,
}),
'doi': string,
'journal': string,
'license': string,
'publish_time': string,
'sha': string,
'source_x': string,
'title': string,
'url': string,
})
- Documentazione delle funzionalità :
| Caratteristica | Classe | Forma | Tipo D | Descrizione |
|---|---|---|---|---|
| CaratteristicheDict | ||||
| astratto | Tensore | corda | ||
| autori | Tensore | corda | ||
| corpo del testo | Sequenza | |||
| corpo_testo/sezione | Tensore | corda | ||
| corpo_testo/testo | Tensore | corda | ||
| doi | Tensore | corda | ||
| rivista | Tensore | corda | ||
| licenza | Tensore | corda | ||
| pubblicazione_ora | Tensore | corda | ||
| sha | Tensore | corda | ||
| fonte_x | Tensore | corda | ||
| titolo | Tensore | corda | ||
| URL | Tensore | corda |
Chiavi supervisionate (Vedi
as_superviseddoc ):('body_text', 'abstract')Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ): Mancante.
Citazione :
@ONLINE {CORD-19-research-challenge,
author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
title = "COVID-19 Open Research Dataset Challenge (CORD-19)",
month = "april",
year = "2020",
url = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}