- opis :
Jest to zbiór danych służący do klasyfikowania intencji cytowania w artykułach naukowych. Główna etykieta intencji cytowania dla każdego obiektu Json jest określana za pomocą klucza etykiety, podczas gdy kontekst cytowania jest określany za pomocą klucza kontekstu. Przykład:
{
'string': 'In chacma baboons, male-infant relationships can be linked to both
formation of friendships and paternity success [30,31].'
'sectionName': 'Introduction',
'label': 'background',
'citingPaperId': '7a6b2d4b405439',
'citedPaperId': '9d1abadc55b5e0',
...
}
Pełne informacje o artykule można uzyskać, korzystając z dostarczonych identyfikatorów papieru w interfejsie API Semantic Scholar ( https://api.semanticscholar.org/ ).
Etykiety to: Metoda, Tło, Wynik
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://github.com/allenai/scicite
Kod źródłowy :
tfds.datasets.scicite.BuilderWersje :
-
1.0.0(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
22.12 MiBRozmiar zestawu danych :
7.26 MiBAutomatyczne buforowanie ( dokumentacja ): Tak
Podziały :
| Podział | Przykłady |
|---|---|
'test' | 1859 |
'train' | 8194 |
'validation' | 916 |
- Struktura funkcji :
FeaturesDict({
'citeEnd': int64,
'citeStart': int64,
'citedPaperId': Text(shape=(), dtype=string),
'citingPaperId': Text(shape=(), dtype=string),
'excerpt_index': int32,
'id': Text(shape=(), dtype=string),
'isKeyCitation': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label2_confidence': float32,
'label_confidence': float32,
'sectionName': Text(shape=(), dtype=string),
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
'string': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształtować się | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| cytujKoniec | Napinacz | int64 | ||
| cytuj Start | Napinacz | int64 | ||
| cytowany identyfikator papieru | Tekst | strunowy | ||
| powołując się na identyfikator papieru | Tekst | strunowy | ||
| indeks_wyciągów | Napinacz | int32 | ||
| ID | Tekst | strunowy | ||
| isKeyCitation | Napinacz | bool | ||
| etykieta | Etykieta klasy | int64 | ||
| etykieta2 | Etykieta klasy | int64 | ||
| etykieta2_pewność | Napinacz | pływak32 | ||
| pewność_etykiety | Napinacz | pływak32 | ||
| nazwa sekcji | Tekst | strunowy | ||
| źródło | Etykieta klasy | int64 | ||
| strunowy | Tekst | strunowy |
Nadzorowane klucze (zobacz
as_superviseddoc ):('string', 'label')Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}