- Descrição :
O conjunto de dados Stanford Dogs contém imagens de 120 raças de cães de todo o mundo. Este conjunto de dados foi construído usando imagens e anotações do ImageNet para a tarefa de categorização de imagem refinada. São 20.580 imagens, das quais 12.000 são utilizadas para treinamento e 8.580 para teste. Rótulos de classe e anotações de caixa delimitadora são fornecidos para todas as 12.000 imagens.
Documentação Adicional : Explore em Papers With Code
Página inicial : http://vision.stanford.edu/aditya86/ImageNetDogs/main.html
Código -fonte:
tfds.datasets.stanford_dogs.BuilderVersões :
-
0.2.0(padrão): sem notas de versão.
-
Tamanho do download :
778.12 MiBTamanho do conjunto de dados :
744.72 MiBArmazenado em cache automaticamente ( documentação ): Não
Divisões :
| Dividir | Exemplos |
|---|---|
'test' | 8.580 |
'train' | 12.000 |
- Estrutura de recursos :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=120),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
}),
})
- Documentação do recurso:
| Característica | Classe | Forma | Tipo D | Descrição |
|---|---|---|---|---|
| RecursosDict | ||||
| imagem | Imagem | (Nenhuma, Nenhuma, 3) | uint8 | |
| imagem/nome do arquivo | Texto | corda | ||
| rótulo | ClassLabel | int64 | ||
| objetos | Seqüência | |||
| objetos/bbox | Recurso BBox | (4,) | float32 |
Chaves supervisionadas (Consulte
as_superviseddoc ):('image', 'label')Figura ( tfds.show_examples ):

- Exemplos ( tfds.as_dataframe ):
- Citação :
@inproceedings{KhoslaYaoJayadevaprakashFeiFei_FGVC2011,
author = "Aditya Khosla and Nityananda Jayadevaprakash and Bangpeng Yao and
Li Fei-Fei",
title = "Novel Dataset for Fine-Grained Image Categorization",
booktitle = "First Workshop on Fine-Grained Visual Categorization,
IEEE Conference on Computer Vision and Pattern Recognition",
year = "2011",
month = "June",
address = "Colorado Springs, CO",
}
@inproceedings{imagenet_cvpr09,
AUTHOR = {Deng, J. and Dong, W. and Socher, R. and Li, L.-J. and
Li, K. and Fei-Fei, L.},
TITLE = { {ImageNet: A Large-Scale Hierarchical Image Database} },
BOOKTITLE = {CVPR09},
YEAR = {2009},
BIBSOURCE = "http://www.image-net.org/papers/imagenet_cvpr09.bib"}