- Opis :
3dshapes to zbiór danych kształtów 3D wygenerowanych proceduralnie na podstawie 6 niezależnych od prawdy czynników ukrytych. Czynnikami tymi są kolor podłogi , kolor ścian , kolor obiektu , skala , kształt i orientacja .
Wszystkie możliwe kombinacje tych latencji występują dokładnie raz, tworząc łącznie N = 480000 obrazów.
Ukryte wartości czynników
- odcień podłogi: 10 wartości rozmieszczonych liniowo w [0, 1]
- odcień ściany: 10 wartości rozmieszczonych liniowo w [0, 1]
- odcień obiektu: 10 wartości rozmieszczonych liniowo w [0, 1]
- skala: 8 wartości rozmieszczonych liniowo w [0, 1]
- kształt: 4 wartości w [0, 1, 2, 3]
- orientacja: 15 wartości rozmieszczonych liniowo w [-30, 30]
Zmienialiśmy po jednym ukryciu na raz (zaczynając od orientacji, następnie kształtu itp.) i sekwencyjnie przechowywaliśmy obrazy w ustalonej kolejności w tablicy images . Odpowiednie wartości współczynników są przechowywane w tej samej kolejności w tablicy labels .
Dodatkowa dokumentacja : Eksploruj w dokumentach z kodem
Strona główna : https://github.com/deepmind/3d-shapes
Kod źródłowy :
tfds.datasets.shapes3d.BuilderWersje :
-
2.0.0(domyślnie): Nowe podzielone API ( https://tensorflow.org/datasets/splits )
-
Rozmiar pobierania :
255.18 MiBRozmiar zbioru danych :
1.68 GiBAutomatyczne buforowanie ( dokumentacja ): Nie
Podziały :
| Podział | Przykłady |
|---|---|
'train' | 480 000 |
- Struktura funkcji :
FeaturesDict({
'image': Image(shape=(64, 64, 3), dtype=uint8),
'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'value_floor_hue': float32,
'value_object_hue': float32,
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_wall_hue': float32,
})
- Dokumentacja funkcji :
| Funkcja | Klasa | Kształt | Typ D | Opis |
|---|---|---|---|---|
| FunkcjeDykt | ||||
| obraz | Obraz | (64, 64, 3) | uint8 | |
| label_floor_hue | Etykieta klasy | int64 | ||
| etykieta_obiekt_odcień | Etykieta klasy | int64 | ||
| orientacja_etykiety | Etykieta klasy | int64 | ||
| etykieta_skala | Etykieta klasy | int64 | ||
| etykieta_kształt | Etykieta klasy | int64 | ||
| label_wall_hue | Etykieta klasy | int64 | ||
| wartość_odcienia_podłogi | Napinacz | pływak32 | ||
| wartość_obiektu_barwa | Napinacz | pływak32 | ||
| orientacja_wartości | Napinacz | pływak32 | ||
| skala wartości | Napinacz | pływak32 | ||
| wartość_kształt | Napinacz | pływak32 | ||
| wartość_odcienia_ściany | Napinacz | pływak32 |
Klucze nadzorowane (zobacz dokument
as_supervised):NoneRysunek ( tfds.show_examples ):

- Przykłady ( tfds.as_dataframe ):
- Cytat :
@misc{3dshapes18,
title={3D Shapes Dataset},
author={Burgess, Chris and Kim, Hyunjik},
howpublished={https://github.com/deepmind/3dshapes-dataset/},
year={2018}
}