Oxford_iiit_pet

  • Descripción :

El conjunto de datos de mascotas Oxford-IIIT es un conjunto de datos de imágenes de mascotas de 37 categorías con aproximadamente 200 imágenes para cada clase. Las imágenes tienen grandes variaciones en escala, pose e iluminación. Todas las imágenes tienen una anotación de verdad sobre el terreno asociada de raza y especie. Además, se proporcionan cuadros delimitadores principales para la división de entrenamiento, lo que permite utilizar este conjunto de datos para tareas simples de detección de objetos. En la división de prueba, los cuadros delimitadores están vacíos.

Dividir Ejemplos
'test' 3.669
'train' 3.680
  • Estructura de características :
FeaturesDict({
    'file_name': Text(shape=(), dtype=string),
    'head_bbox': BBoxFeature(shape=(4,), dtype=float32),
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=37),
    'segmentation_mask': Image(shape=(None, None, 1), dtype=uint8),
    'species': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
  • Documentación de funciones :
Característica Clase Forma tipo D Descripción
FuncionesDict
Nombre del archivo Texto cadena
cabeza_bbox Característica BBox (4,) flotador32
imagen Imagen (Ninguno, Ninguno, 3) uint8
etiqueta Etiqueta de clase int64
máscara_segmentación Imagen (Ninguno, Ninguno, 1) uint8
especies Etiqueta de clase int64
  • Cita :
@InProceedings{parkhi12a,
  author       = "Parkhi, O. M. and Vedaldi, A. and Zisserman, A. and Jawahar, C.~V.",
  title        = "Cats and Dogs",
  booktitle    = "IEEE Conference on Computer Vision and Pattern Recognition",
  year         = "2012",
}