- Descrição :
dSprites é um conjunto de dados de formas 2D geradas processualmente a partir de 6 fatores latentes independentes da verdade básica. Esses fatores são cor , forma , escala , rotação e posições x e y de um sprite.
Todas as combinações possíveis dessas latentes estão presentes exatamente uma vez, gerando N = 737.280 imagens no total.
Valores de fator latente
- Cor branca
- Forma: quadrado, elipse, coração
- Escala: 6 valores espaçados linearmente em [0,5, 1]
- Orientação: 40 valores em [0, 2 pi]
- Posição X: 32 valores em [0, 1]
- Posição Y: 32 valores em [0, 1]
Variamos uma latente de cada vez (começando na posição Y, depois na posição X, etc.) e armazenamos sequencialmente as imagens em ordem fixa. Conseqüentemente, a ordem ao longo da primeira dimensão é fixa e permite mapear de volta ao valor das latentes correspondentes a essa imagem.
Escolhemos os valores latentes deliberadamente para ter as menores alterações de passo e, ao mesmo tempo, garantir que todas as saídas de pixel fossem diferentes. Nenhum ruído foi adicionado.
Documentação adicional : Explore artigos com código
Página inicial : https://github.com/deepmind/dsprites-dataset
Código fonte :
tfds.datasets.dsprites.BuilderVersões :
-
2.0.0(padrão): Nova API dividida ( https://tensorflow.org/datasets/splits ) -
2.1.0: Sem notas de lançamento.
-
Tamanho do download :
26.73 MiBTamanho do conjunto de dados :
Unknown sizeArmazenado em cache automaticamente ( documentação ): Desconhecido
Divisões :
| Dividir | Exemplos |
|---|---|
'train' | 737.280 |
- Estrutura de recursos :
FeaturesDict({
'image': Image(shape=(64, 64, 1), dtype=uint8),
'label_orientation': ClassLabel(shape=(), dtype=int64, num_classes=40),
'label_scale': ClassLabel(shape=(), dtype=int64, num_classes=6),
'label_shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label_x_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'label_y_position': ClassLabel(shape=(), dtype=int64, num_classes=32),
'value_orientation': float32,
'value_scale': float32,
'value_shape': float32,
'value_x_position': float32,
'value_y_position': float32,
})
- Documentação de recursos :
| Recurso | Aula | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| RecursosDict | ||||
| imagem | Imagem | (64, 64, 1) | uint8 | |
| etiqueta_orientação | ClassLabel | int64 | ||
| etiqueta_escala | ClassLabel | int64 | ||
| forma_da_rótulo | ClassLabel | int64 | ||
| etiqueta_x_posição | ClassLabel | int64 | ||
| etiqueta_y_posição | ClassLabel | int64 | ||
| orientação_valor | Tensor | float32 | ||
| escala_valor | Tensor | float32 | ||
| valor_forma | Tensor | float32 | ||
| valor_x_posição | Tensor | float32 | ||
| valor_y_posição | Tensor | float32 |
Chaves supervisionadas (consulte o documento
as_supervised):NoneFigura ( tfds.show_examples ):
![]()
- Exemplos ( tfds.as_dataframe ):
- Citação :
@misc{dsprites17,
author = {Loic Matthey and Irina Higgins and Demis Hassabis and Alexander Lerchner},
title = {dSprites: Disentanglement testing Sprites dataset},
howpublished= {https://github.com/deepmind/dsprites-dataset/},
year = "2017",
}