- opis :
Tabele Wikipedii z co najmniej 3 wierszami i 2 kolumnami, po 3 losowe wiersze dla każdej tabeli, zostały wybrane do dalszych adnotacji. Każdy wiersz został opatrzony adnotacją przez inną osobę, więc zbiór danych składa się z par (tabela z jednym wierszem, opis tekstowy). Adnotacje obejmują co najmniej 2 komórki wiersza, ale nie wymagają uwzględnienia ich wszystkich. Zestaw danych jest zgodny ze znormalizowanym formatem tabeli.
Strona główna : https://github.com/msra-nlc/Table2Text
Kod źródłowy :
tfds.structured.wiki_table_text.WikiTableTextWersje :
-
1.0.0(domyślnie): Wersja początkowa.
-
Rozmiar pliku do pobrania :
3.70 MiBRozmiar zestawu danych :
4.64 MiBAutomatyczne buforowanie ( dokumentacja ): Tak
Podziały :
| Rozdzielać | Przykłady |
|---|---|
'test' | 2000 |
'train' | 10 000 |
'validation' | 1318 |
- Struktura funkcji :
FeaturesDict({
'input_text': FeaturesDict({
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| Wprowadź tekst | FunkcjeDict | |||
| tekst_wejściowy/tabela | Sekwencja | |||
| tekst_wejściowy/tabela/nagłówek_kolumny | Napinacz | strunowy | ||
| tekst_wejściowy/tabela/treść | Napinacz | strunowy | ||
| tekst_wejściowy/tabela/numer_wiersza | Napinacz | int16 | ||
| tekst_docelowy | Napinacz | strunowy |
Nadzorowane klucze (zobacz dokument
as_supervised):('input_text', 'target_text')Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@inproceedings{bao2018table,
title={Table-to-Text: Describing Table Region with Natural Language},
author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
booktitle={AAAI},
url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
year={2018}
}