- Descripción :
PASS es un conjunto de datos de imágenes a gran escala que no incluye humanos, partes humanas ni otra información de identificación personal. Se puede utilizar para una formación previa autosupervisada de alta calidad y al mismo tiempo reducir significativamente los problemas de privacidad.
PASS contiene 1.439.589 imágenes sin etiquetas procedentes de YFCC-100M.
Todas las imágenes de este conjunto de datos tienen la licencia CC-BY, al igual que el propio conjunto de datos. Para YFCC-100M, consulte http://www.multimediacommons.org/
Documentación adicional : Explorar en artículos con código
Página de inicio : https://www.robots.ox.ac.uk/~vgg/data/pass/
Código fuente :
tfds.datasets.pass.BuilderVersiones :
-
1.0.0: versión inicial. -
2.0.0: v2: Se eliminaron 472 imágenes de v1 porque contenían humanos. También se agregaron metadatos: fecha de toma y GPS. -
3.0.0(predeterminado): v3: Se eliminaron 131 imágenes de v2 porque contenían humanos/tatuajes.
-
Tamaño de descarga :
167.30 GiBTamaño del conjunto de datos :
166.43 GiBAlmacenamiento en caché automático ( documentación ): No
Divisiones :
| Dividir | Ejemplos |
|---|---|
'train' | 1.439.588 |
- Estructura de características :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- Documentación de funciones :
| Característica | Clase | Forma | tipo D | Descripción |
|---|---|---|---|---|
| FuncionesDict | ||||
| imagen | Imagen | (Ninguno, Ninguno, 3) | uint8 | |
| imagen/creador_uname | Texto | cadena | ||
| imagen/fecha_tomada | Texto | cadena | ||
| imagen/gps_lat | Tensor | flotador32 | ||
| imagen/gps_lon | Tensor | flotador32 | ||
| imagen/hash | Texto | cadena |
Claves supervisadas (ver documento
as_supervised):NoneFigura ( tfds.show_examples ):

- Ejemplos ( tfds.as_dataframe ):
- Citación :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}