squadra

Descrizione :

Stanford Question Answering Dataset (SQuAD) è un set di dati di comprensione della lettura, costituito da domande poste da crowdworker su una serie di articoli di Wikipedia, in cui la risposta a ogni domanda è un segmento di testo, o span, dal corrispondente passaggio di lettura, o la domanda potrebbe essere senza risposta.

Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://rajpurkar.github.io/SQuAD-explorer/
Codice sorgente : tfds.datasets.squad.Builder
Versioni :
- 3.0.0 (impostazione predefinita): risolve il problema con un numero ridotto di esempi (19) in cui gli intervalli di risposta sono disallineati a causa della rimozione degli spazi bianchi nel contesto.
Chiavi supervisionate (Vedi as_supervised doc ): None
Figura ( tfds.show_examples ): non supportato.
Citazione :

@article{2016arXiv160605250R,
       author = { {Rajpurkar}, Pranav and {Zhang}, Jian and {Lopyrev},
                 Konstantin and {Liang}, Percy},
        title = "{SQuAD: 100,000+ Questions for Machine Comprehension of Text}",
      journal = {arXiv e-prints},
         year = 2016,
          eid = {arXiv:1606.05250},
        pages = {arXiv:1606.05250},
archivePrefix = {arXiv},
       eprint = {1606.05250},
}

squadra/v1.1 (configurazione predefinita)

Descrizione della configurazione : Versione 1.1.0 di SQUAD
Dimensione del download : 33.51 MiB
Dimensione del set di dati: 94.06 MiB
Auto-cache ( documentazione ): Sì
Divisioni :

Diviso	Esempi
`'train'`	87.599
`'validation'`	10.570

Struttura delle caratteristiche :

FeaturesDict({
    'answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'context': Text(shape=(), dtype=string),
    'id': string,
    'question': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})

Documentazione delle funzionalità :

Caratteristica	Classe	Tipo D
	CaratteristicheDict
risposte	Sequenza
risposte/risposta_inizio	Tensore	int32
risposte/testo	Testo	corda
contesto	Testo	corda
id	Tensore	corda
domanda	Testo	corda
titolo	Testo	corda

Esempi ( tfds.as_dataframe ):

squadra/v2.0

Descrizione della configurazione : versione 2.0.0 di SQUAD
Dimensione del download : 44.34 MiB
Dimensione del set di dati: 148.54 MiB
Cache automatica ( documentazione ): Sì (convalida), solo quando shuffle_files=False (treno)
Divisioni :

Diviso	Esempi
`'train'`	130.319
`'validation'`	11.873

Struttura delle caratteristiche :

FeaturesDict({
    'answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'context': Text(shape=(), dtype=string),
    'id': string,
    'is_impossible': bool,
    'plausible_answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'question': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})

Documentazione delle funzionalità :

Caratteristica	Classe	Tipo D
	CaratteristicheDict
risposte	Sequenza
risposte/risposta_inizio	Tensore	int32
risposte/testo	Testo	corda
contesto	Testo	corda
id	Tensore	corda
è impossibile	Tensore	bool
risposte_plausibili	Sequenza
risposte_plausibili/risposte_start	Tensore	int32
risposte_plausibili/testo	Testo	corda
domanda	Testo	corda
titolo	Testo	corda

Esempi ( tfds.as_dataframe ):

squadra Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

squadra/v1.1 (configurazione predefinita)

squadra/v2.0

squadra