- Описание :
Предварительно обученные представления для приблизительного поиска ближайшего соседа с использованием евклидова расстояния. Этот набор данных состоит из двух частей:
- «база данных»: состоит из 1 000 000 точек данных, каждая из которых имеет функции: «встраивание» (128 чисел с плавающей запятой), «индекс» (int64), «соседи» (пустой список).
- «тест»: состоит из 10 000 точек данных, каждая из которых имеет функции: «встраивание» (128 чисел с плавающей запятой), «индекс» (int64), «соседи» (список «индексов» и «расстояний» ближайших соседей в базе данных. )
Домашняя страница : http://corpus-texmex.irisa.fr/
Исходный код :
tfds.datasets.sift1m.BuilderВерсии :
-
1.0.0(по умолчанию): первоначальный выпуск.
-
Размер загрузки :
500.80 MiBРазмер набора данных :
589.49 MiBАвтокэширование ( документация ): Нет
Расколы :
| Расколоть | Примеры |
|---|---|
'database' | 1 000 000 |
'test' | 10 000 |
- Структура функции :
FeaturesDict({
'embedding': Tensor(shape=(128,), dtype=float32),
'index': Scalar(shape=(), dtype=int64, description=Index within the split.),
'neighbors': Sequence({
'distance': Scalar(shape=(), dtype=float32, description=Neighbor distance.),
'index': Scalar(shape=(), dtype=int64, description=Neighbor index.),
}),
})
- Функциональная документация :
| Особенность | Сорт | Форма | Дтип | Описание |
|---|---|---|---|---|
| ВозможностиDict | ||||
| встраивание | Тензор | (128,) | поплавок32 | |
| индекс | Скаляр | int64 | Индекс внутри разделения. | |
| соседи | Последовательность | Вычисленные соседи, доступные только для тестового разделения. | ||
| соседи/расстояние | Скаляр | поплавок32 | Расстояние до соседа. | |
| соседи/индекс | Скаляр | int64 | Индекс соседства. |
Контролируемые ключи (см. документ
as_supervised):NoneРисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@article{jegou2010product,
title={Product quantization for nearest neighbor search},
author={Jegou, Herve and Douze, Matthijs and Schmid, Cordelia},
journal={IEEE transactions on pattern analysis and machine intelligence},
volume={33},
number={1},
pages={117--128},
year={2010},
publisher={IEEE}
}