- opis :
Utworzono dwa zestawy danych, używając próbek czerwonego i białego wina. Dane wejściowe obejmują obiektywne testy (np. wartości PH), a dane wyjściowe są oparte na danych sensorycznych (mediana z co najmniej 3 ocen dokonanych przez ekspertów winiarskich). Każdy ekspert ocenił jakość wina od 0 (bardzo zła) do 10 (bardzo doskonała). Do modelowania tych zestawów danych w ramach podejścia regresyjnego zastosowano kilka metod eksploracji danych. Najlepsze wyniki osiągnął model maszyny wektora nośnego. Obliczono kilka metryk: MAD, macierz zamieszania dla ustalonej tolerancji błędu (T) itp. Wykreślamy również względne znaczenie zmiennych wejściowych (mierzone za pomocą procedury analizy wrażliwości).
Te dwa zestawy danych dotyczą czerwonych i białych odmian portugalskiego wina „Vinho Verde”. Więcej informacji można znaleźć na stronie: http://www.vinhoverde.pt/en/ lub w odnośniku [Cortez i in., 2009]. Ze względu na kwestie związane z prywatnością i logistyką dostępne są tylko zmienne fizykochemiczne (dane wejściowe) i sensoryczne (dane wyjściowe) (np. brak jest danych o rodzajach winogron, marce wina, cenie sprzedaży wina itp.).
Liczba instancji: czerwone wino - 1599; białe wino - 4898
Zmienne wejściowe (na podstawie badań fizykochemicznych):
- ustalona kwasowość
- lotna kwasowość
- kwas cytrynowy
- cukier resztkowy
- chlorki
- wolny dwutlenek siarki
- całkowity dwutlenek siarki
- gęstość
- pH
- siarczany
- alkohol
Zmienna wyjściowa (na podstawie danych sensorycznych):
- jakość (ocena od 0 do 10)
Strona główna : https://archive.ics.uci.edu/ml/datasets/wine+quality
Kod źródłowy :
tfds.structured.wine_quality.WineQualityWersje :
-
1.0.0(domyślnie): Brak informacji o wersji.
-
Automatyczne buforowanie ( dokumentacja ): Tak
Struktura funkcji :
FeaturesDict({
'features': FeaturesDict({
'alcohol': float32,
'chlorides': float32,
'citric acid': float32,
'density': float32,
'fixed acidity': float32,
'free sulfur dioxide': float32,
'pH': float32,
'residual sugar': float32,
'sulphates': float64,
'total sulfur dioxide': float32,
'volatile acidity': float32,
}),
'quality': int32,
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDict | ||||
| cechy | FunkcjeDict | |||
| cechy/alkohol | Napinacz | pływak32 | ||
| cechy/chlorki | Napinacz | pływak32 | ||
| właściwości/kwas cytrynowy | Napinacz | pływak32 | ||
| cechy/gęstość | Napinacz | pływak32 | ||
| cechy/kwasowość stała | Napinacz | pływak32 | ||
| cechy/wolny dwutlenek siarki | Napinacz | pływak32 | ||
| cechy/pH | Napinacz | pływak32 | ||
| właściwości/cukier resztkowy | Napinacz | pływak32 | ||
| właściwości/siarczany | Napinacz | pływak64 | ||
| cechy/całkowity dwutlenek siarki | Napinacz | pływak32 | ||
| cechy/kwasowość lotna | Napinacz | pływak32 | ||
| jakość | Napinacz | int32 |
Nadzorowane klucze (Zobacz
as_superviseddoc ):('features', 'quality')Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@ONLINE {cortezpaulo;cerdeiraantonio;almeidafernando;matostelmo;reisjose1999,
author = "Cortez, Paulo; Cerdeira, Antonio; Almeida,Fernando; Matos, Telmo; Reis, Jose",
title = "Modeling wine preferences by data mining from physicochemical properties.",
year = "2009",
url = "https://archive.ics.uci.edu/ml/datasets/wine+quality"
}
wine_quality/white (domyślna konfiguracja)
Opis konfiguracji : Białe wino
Rozmiar pliku do pobrania :
258.23 KiBRozmiar zestawu danych :
1.87 MiBPodziały :
| Rozdzielać | Przykłady |
|---|---|
'train' | 4898 |
- Przykłady ( tfds.as_dataframe ):
wino_jakość/czerwone
Opis konfiguracji : Czerwone wino
Rozmiar pliku do pobrania :
82.23 KiBRozmiar zbioru danych :
626.17 KiBPodziały :
| Rozdzielać | Przykłady |
|---|---|
'train' | 1599 |
- Przykłady ( tfds.as_dataframe ):