- opis :
CORD-19 to zasób ponad 45 000 artykułów naukowych, w tym ponad 33 000 z pełnym tekstem, na temat COVID-19, SARS-CoV-2 i powiązanych koronawirusów.
Pomoc w organizowaniu informacji w literaturze naukowej na temat COVID-19 poprzez abstrakcyjne podsumowania. Ten zestaw danych przetwarza te artykuły na pary dokumentów i streszczeń pełny_tekst-abstrakt lub wstęp-abstrakt.
Funkcje obejmują ciągi znaków: streszczenie, pełny_tekst, sha (hash pdf), source_x (źródło publikacji), tytuł, doi (cyfrowy identyfikator obiektu), licencja, autorzy, czas publikacji, czasopismo, adres URL.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
Kod źródłowy :
tfds.summarization.Covid19sumWersje :
-
1.0.0(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
Unknown sizeRozmiar zbioru danych :
Unknown sizeInstrukcje ręcznego pobierania : ten zestaw danych wymaga ręcznego pobrania danych źródłowych do katalogu
download_config.manual_dir(domyślnie~/tensorflow_datasets/downloads/manual/):
Ten zestaw danych należy pobrać ręcznie za pomocą kaggle api:kaggle datasets download allen-institute-for-ai/CORD-19-research-challengeUmieść pobrany plik zip w folderze manual.Automatyczne buforowanie ( dokumentacja ): Nieznane
Podziały :
| Rozdzielać | Przykłady |
|---|
- Struktura funkcji :
FeaturesDict({
'abstract': string,
'authors': string,
'body_text': Sequence({
'section': string,
'text': string,
}),
'doi': string,
'journal': string,
'license': string,
'publish_time': string,
'sha': string,
'source_x': string,
'title': string,
'url': string,
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| abstrakcyjny | Napinacz | strunowy | ||
| autorski | Napinacz | strunowy | ||
| treść_tekstu | Sekwencja | |||
| treść_tekstu/sekcja | Napinacz | strunowy | ||
| treść_tekst/tekst | Napinacz | strunowy | ||
| doi | Napinacz | strunowy | ||
| dziennik | Napinacz | strunowy | ||
| licencja | Napinacz | strunowy | ||
| czas_opublikowania | Napinacz | strunowy | ||
| sza | Napinacz | strunowy | ||
| źródło_x | Napinacz | strunowy | ||
| tytuł | Napinacz | strunowy | ||
| adres URL | Napinacz | strunowy |
Nadzorowane klucze (zobacz
as_superviseddoc ):('body_text', 'abstract')Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ): Brak.
Cytat :
@ONLINE {CORD-19-research-challenge,
author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
title = "COVID-19 Open Research Dataset Challenge (CORD-19)",
month = "april",
year = "2020",
url = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}