oxford_iiit_pet

  • Descrição :

O conjunto de dados de animais de estimação Oxford-IIIT é um conjunto de dados de imagens de animais de estimação de 37 categorias com cerca de 200 imagens para cada classe. As imagens apresentam grandes variações de escala, pose e iluminação. Todas as imagens têm uma anotação de verdade associada de raça e espécie. Além disso, caixas delimitadoras de cabeçalho são fornecidas para a divisão de treinamento, permitindo o uso deste conjunto de dados para tarefas simples de detecção de objetos. Na divisão de teste, as caixas delimitadoras estão vazias.

Dividir Exemplos
'test' 3.669
'train' 3.680
  • Estrutura de recursos :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'head_bbox': BBoxFeature(shape=(4,), dtype=float32),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
    'segmentation_mask': Image(shape=(None, None, 1), dtype=uint8),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentação de recursos :
Recurso Aula Forma Tipo D Descrição
RecursosDict
nome_do_arquivo Texto corda
head_bbox BBoxFeature (4,) float32
imagem Imagem (Nenhum, Nenhum, 3) uint8
rótulo ClassLabel int64
máscara_de_segmentação Imagem (Nenhum, Nenhum, 1) uint8
espécies ClassLabel int64
  • Citação :
@InProceedings{parkhi12a,
  author       = "Parkhi, O. M. and Vedaldi, A. and Zisserman, A. and Jawahar, C.~V.",
  title        = "Cats and Dogs",
  booktitle    = "IEEE Conference on Computer Vision and Pattern Recognition",
  year         = "2012",
}