Drużyna

opis :

Stanford Question Answering Dataset (SQuAD) to zbiór danych dotyczących czytania ze zrozumieniem, składający się z pytań zadawanych przez pracowników społecznościowych w zbiorze artykułów Wikipedii, gdzie odpowiedzią na każde pytanie jest fragment tekstu lub zakres z odpowiedniego fragmentu do czytania lub pytanie może być bez odpowiedzi.

Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://rajpurkar.github.io/SQuAD-explorer/
Kod źródłowy : tfds.datasets.squad.Builder
Wersje :
- 3.0.0 (domyślnie): Naprawia problem z niewielką liczbą przykładów (19), w których zakresy odpowiedzi są źle wyrównane z powodu usunięcia białych znaków kontekstu.
Klucze nadzorowane (Zobacz dokument as_supervised ): None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :

@article{2016arXiv160605250R,
       author = { {Rajpurkar}, Pranav and {Zhang}, Jian and {Lopyrev},
                 Konstantin and {Liang}, Percy},
        title = "{SQuAD: 100,000+ Questions for Machine Comprehension of Text}",
      journal = {arXiv e-prints},
         year = 2016,
          eid = {arXiv:1606.05250},
        pages = {arXiv:1606.05250},
archivePrefix = {arXiv},
       eprint = {1606.05250},
}

oddział/v1.1 (domyślna konfiguracja)

Opis konfiguracji: Wersja 1.1.0 SQUAD
Rozmiar pliku do pobrania : 33.51 MiB
Rozmiar zestawu danych : 94.06 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Podział	Przykłady
`'train'`	87 599
`'validation'`	10570

Struktura funkcji :

FeaturesDict({
    'answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'context': Text(shape=(), dtype=string),
    'id': string,
    'question': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})

Dokumentacja funkcji :

Funkcja	Klasa	Typ D
	FunkcjeDict
odpowiedzi	Sekwencja
odpowiedzi/odpowiedź_start	Napinacz	int32
odpowiedzi/tekst	Tekst	strunowy
kontekst	Tekst	strunowy
ID	Napinacz	strunowy
pytanie	Tekst	strunowy
tytuł	Tekst	strunowy

Przykłady ( tfds.as_dataframe ):

skład/v2.0

Opis konfiguracji: Wersja 2.0.0 SQUAD
Rozmiar pliku do pobrania : 44.34 MiB
Rozmiar zestawu danych : 148.54 MiB
Automatyczne buforowanie ( dokumentacja ): Tak (walidacja), Tylko wtedy, gdy shuffle_files=False (pociąg)
Podziały :

Podział	Przykłady
`'train'`	130319
`'validation'`	11873

Struktura funkcji :

FeaturesDict({
    'answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'context': Text(shape=(), dtype=string),
    'id': string,
    'is_impossible': bool,
    'plausible_answers': Sequence({
        'answer_start': int32,
        'text': Text(shape=(), dtype=string),
    }),
    'question': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})

Dokumentacja funkcji :

Funkcja	Klasa	Typ D
	FunkcjeDict
odpowiedzi	Sekwencja
odpowiedzi/odpowiedź_start	Napinacz	int32
odpowiedzi/tekst	Tekst	strunowy
kontekst	Tekst	strunowy
ID	Napinacz	strunowy
jest niemożliwe	Napinacz	bool
wiarygodne_odpowiedzi	Sekwencja
wiarygodne_answers/answer_start	Napinacz	int32
wiarygodne_odpowiedzi/tekst	Tekst	strunowy
pytanie	Tekst	strunowy
tytuł	Tekst	strunowy

Przykłady ( tfds.as_dataframe ):

Drużyna Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

oddział/v1.1 (domyślna konfiguracja)

skład/v2.0

Drużyna