- Descrizione :
Incorporamenti pre-addestrati per la ricerca approssimativa del vicino più vicino utilizzando la distanza euclidea. Questo set di dati è costituito da due suddivisioni:
- 'database': è composto da 1.000.000 di punti dati, ciascuno ha caratteristiche: 'incorporamento' (128 float), 'indice' (int64), 'vicini' (elenco vuoto).
- 'test': consiste di 10.000 punti dati, ciascuno ha caratteristiche: 'incorporamento' (128 float), 'indice' (int64), 'vicini' (elenco di 'indice' e 'distanza' dei vicini più vicini nel database. )
Pagina iniziale : http://corpus-texmex.irisa.fr/
Codice sorgente :
tfds.datasets.sift1m.BuilderVersioni :
-
1.0.0(impostazione predefinita): versione iniziale.
-
Dimensione download :
500.80 MiBDimensione del set di dati :
589.49 MiBMemorizzazione nella cache automatica ( documentazione ): No
Divide :
| Diviso | Esempi |
|---|---|
'database' | 1.000.000 |
'test' | 10.000 |
- Struttura delle caratteristiche :
FeaturesDict({
'embedding': Tensor(shape=(128,), dtype=float32),
'index': Scalar(shape=(), dtype=int64, description=Index within the split.),
'neighbors': Sequence({
'distance': Scalar(shape=(), dtype=float32, description=Neighbor distance.),
'index': Scalar(shape=(), dtype=int64, description=Neighbor index.),
}),
})
- Documentazione delle funzionalità :
| Caratteristica | Classe | Forma | Tipo D | Descrizione |
|---|---|---|---|---|
| CaratteristicheDict | ||||
| incorporamento | Tensore | (128,) | float32 | |
| indice | Scalare | int64 | Indice all'interno della divisione. | |
| vicinato | Sequenza | I vicini calcolati, disponibili solo per la suddivisione del test. | ||
| vicini/distanza | Scalare | float32 | Distanza dal vicino. | |
| vicini/indice | Scalare | int64 | Indice dei vicini. |
Chiavi supervisionate (vedi il documento
as_supervised):NoneFigura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@article{jegou2010product,
title={Product quantization for nearest neighbor search},
author={Jegou, Herve and Douze, Matthijs and Schmid, Cordelia},
journal={IEEE transactions on pattern analysis and machine intelligence},
volume={33},
number={1},
pages={117--128},
year={2010},
publisher={IEEE}
}