- Descrizione :
3dshapes è un set di dati di forme 3D generate proceduralmente da 6 fattori latenti indipendenti dalla verità reale. Questi fattori sono il colore del pavimento , il colore della parete , il colore dell'oggetto , la scala , la forma e l'orientamento .
Tutte le possibili combinazioni di questi latenti sono presenti esattamente una volta, generando N = 480000 immagini totali.
Valori dei fattori latenti
- tonalità del pavimento: 10 valori spaziati linearmente in [0, 1]
- tonalità della parete: 10 valori spaziati linearmente in [0, 1]
- tonalità oggetto: 10 valori spaziati linearmente in [0, 1]
- scala: 8 valori spaziati linearmente in [0, 1]
- forma: 4 valori in [0, 1, 2, 3]
- orientamento: 15 valori spaziati linearmente in [-30, 30]
Abbiamo variato un latente alla volta (iniziando dall'orientamento, poi dalla forma, ecc.) e memorizzato sequenzialmente le immagini in ordine fisso nell'array images . I valori corrispondenti dei fattori vengono memorizzati nello stesso ordine nell'array labels .
Documentazione aggiuntiva : esplora documenti con codice
Home page : https://github.com/deepmind/3d-shapes
Codice sorgente :
tfds.datasets.shapes3d.BuilderVersioni :
-
2.0.0(impostazione predefinita): nuova API divisa ( https://tensorflow.org/datasets/splits )
-
Dimensione download :
255.18 MiBDimensione del set di dati :
1.68 GiBMemorizzazione nella cache automatica ( documentazione ): No
Divide :
| Diviso | Esempi |
|---|---|
'train' | 480.000 |
- Struttura delle caratteristiche :
FeaturesDict({
'image': Image(shape=(64, 64, 3), dtype=uint8),
'label_floor_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_object_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=15),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=8),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label_wall_hue': ClassLabel(shape=(), dtype=int64, num_classes=10),
'value_floor_hue': float32,
'value_object_hue': float32,
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_wall_hue': float32,
})
- Documentazione delle funzionalità :
| Caratteristica | Classe | Forma | Tipo D | Descrizione |
|---|---|---|---|---|
| CaratteristicheDict | ||||
| Immagine | Immagine | (64, 64, 3) | uint8 | |
| label_floor_hue | ClassLabel | int64 | ||
| etichetta_oggetto_tonalità | ClassLabel | int64 | ||
| orientamento_etichetta | ClassLabel | int64 | ||
| etichetta_scala | ClassLabel | int64 | ||
| etichetta_forma | ClassLabel | int64 | ||
| label_wall_hue | ClassLabel | int64 | ||
| value_floor_hue | Tensore | float32 | ||
| valore_oggetto_tonalità | Tensore | float32 | ||
| orientamento_valore | Tensore | float32 | ||
| valore_scala | Tensore | float32 | ||
| valore_forma | Tensore | float32 | ||
| value_wall_hue | Tensore | float32 |
Chiavi supervisionate (vedi il documento
as_supervised):NoneFigura ( tfds.show_examples ):

- Esempi ( tfds.as_dataframe ):
- Citazione :
@misc{3dshapes18,
title={3D Shapes Dataset},
author={Burgess, Chris and Kim, Hyunjik},
howpublished={https://github.com/deepmind/3dshapes-dataset/},
year={2018}
}