- Descrizione :
Questo è un set di dati per classificare gli intenti di citazione negli articoli accademici. L'etichetta dell'intento di citazione principale per ogni oggetto Json viene specificata con la chiave dell'etichetta mentre il contesto della citazione viene specificato con una chiave di contesto. Esempio:
{
'string': 'In chacma baboons, male-infant relationships can be linked to both
formation of friendships and paternity success [30,31].'
'sectionName': 'Introduction',
'label': 'background',
'citingPaperId': '7a6b2d4b405439',
'citedPaperId': '9d1abadc55b5e0',
...
}
È possibile ottenere le informazioni complete sull'articolo utilizzando gli ID carta forniti con l'API Semantic Scholar ( https://api.semanticscholar.org/ ).
Le etichette sono: Metodo, Sfondo, Risultato
Documentazione aggiuntiva : Esplora documenti con codice
Homepage : https://github.com/allenai/scicite
Codice sorgente :
tfds.datasets.scicite.BuilderVersioni :
-
1.0.0(impostazione predefinita): nessuna nota di rilascio.
-
Dimensione del download :
22.12 MiBDimensione del set di dati:
7.26 MiBAuto-cache ( documentazione ): Sì
Divisioni :
| Diviso | Esempi |
|---|---|
'test' | 1.859 |
'train' | 8.194 |
'validation' | 916 |
- Struttura delle caratteristiche :
FeaturesDict({
'citeEnd': int64,
'citeStart': int64,
'citedPaperId': Text(shape=(), dtype=string),
'citingPaperId': Text(shape=(), dtype=string),
'excerpt_index': int32,
'id': Text(shape=(), dtype=string),
'isKeyCitation': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label2_confidence': float32,
'label_confidence': float32,
'sectionName': Text(shape=(), dtype=string),
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
'string': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
| Caratteristica | Classe | Forma | Tipo D | Descrizione |
|---|---|---|---|---|
| CaratteristicheDict | ||||
| citeFine | Tensore | int64 | ||
| citeStart | Tensore | int64 | ||
| citatoPaperId | Testo | corda | ||
| citando PaperId | Testo | corda | ||
| estratto_indice | Tensore | int32 | ||
| id | Testo | corda | ||
| isKeyCitation | Tensore | bool | ||
| etichetta | ClassLabel | int64 | ||
| etichetta2 | ClassLabel | int64 | ||
| label2_confidence | Tensore | galleggiante32 | ||
| etichetta_confidenza | Tensore | galleggiante32 | ||
| sectionName | Testo | corda | ||
| fonte | ClassLabel | int64 | ||
| corda | Testo | corda |
Chiavi supervisionate (vedi
as_superviseddoc ):('string', 'label')Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}