- Descrição :
Este conjunto de dados contém os dados do Desafio de Classes de Objetos Visuais PASCAL, correspondentes às competições de Classificação e Detecção.
Na competição de Classificação, o objetivo é prever o conjunto de rótulos contidos na imagem, enquanto na competição de Detecção o objetivo é prever a caixa delimitadora e o rótulo de cada objeto individual. AVISO: De acordo com o conjunto de dados oficial, o conjunto de testes do VOC2012 não contém anotações.
Documentação adicional : Explore artigos com código
Código fonte :
tfds.object_detection.Voc
Versões :
-
5.0.0
(padrão) : Sem notas de versão.
-
Armazenado em cache automaticamente ( documentação ): Não
Estrutura de recursos :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
'labels': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'labels_no_difficult': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=20)),
'objects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_difficult': bool,
'is_truncated': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=20),
'pose': ClassLabel(shape=(), dtype=int64, num_classes=5),
}),
})
- Documentação de recursos :
Recurso | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
imagem | Imagem | (Nenhum, Nenhum, 3) | uint8 | |
imagem/nome do arquivo | Texto | corda | ||
rótulos | Sequência (ClassLabel) | (Nenhum,) | int64 | |
rótulos_no_difícil | Sequência (ClassLabel) | (Nenhum,) | int64 | |
objetos | Sequência | |||
objetos/bbox | BBoxFeature | (4,) | float32 | |
objetos/é_difícil | Tensor | bool | ||
objetos/está_truncado | Tensor | bool | ||
objetos/rótulo | ClassLabel | int64 | ||
objetos/pose | ClassLabel | int64 |
- Chaves supervisionadas (consulte o documento
as_supervised
):None
voc/2007 (configuração padrão)
- Descrição da configuração : este conjunto de dados contém os dados do PASCAL Visual Object Classes Challenge 2007, também conhecido como VOC2007.
Um total de 9.963 imagens estão incluídas neste conjunto de dados, onde cada imagem contém um conjunto de objetos, de 20 classes diferentes, perfazendo um total de 24.640 objetos anotados.
Página inicial : http://host.robots.ox.ac.uk/pascal/VOC/voc2007/
Tamanho do download :
868.85 MiB
Tamanho do conjunto de dados :
837.73 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 4.952 |
'train' | 2.501 |
'validation' | 2.510 |
- Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):
- Citação :
@misc{pascal-voc-2007,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2007 {(VOC2007)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2007/workshop/index.html"}
você/2012
- Descrição da configuração : este conjunto de dados contém os dados do PASCAL Visual Object Classes Challenge 2012, também conhecido como VOC2012.
Um total de 11.540 imagens estão incluídas neste conjunto de dados, onde cada imagem contém um conjunto de objetos, de 20 classes diferentes, perfazendo um total de 27.450 objetos anotados.
Página inicial : http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
Tamanho do download :
3.59 GiB
Tamanho do conjunto de dados :
2.44 GiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 10.991 |
'train' | 5.717 |
'validation' | 5.823 |
- Figura ( tfds.show_examples ):
- Exemplos ( tfds.as_dataframe ):
- Citação :
@misc{pascal-voc-2012,
author = "Everingham, M. and Van~Gool, L. and Williams, C. K. I. and Winn, J. and Zisserman, A.",
title = "The {PASCAL} {V}isual {O}bject {C}lasses {C}hallenge 2012 {(VOC2012)} {R}esults",
howpublished = "http://www.pascal-network.org/challenges/VOC/voc2012/workshop/index.html"}