- 説明:
LVIS: 大規模語彙インスタンスセグメンテーション用のデータセット。
追加ドキュメント: Papers With Code で探索
ホームページ: https://www.lvisdataset.org/
ソースコード:
tfds.datasets.lvis.Builderバージョン:
-
1.1.0: フィールドneg_category_idsとnot_exhaustive_category_idsが追加されました。 -
1.2.0: クラス名を追加しました。 -
1.3.0: ミニバル分割を追加しました。 -
1.4.0(デフォルト) : ミニバル分割にセグメンテーション マスクを追加しました。
-
ダウンロードサイズ:
25.38 GiBデータセットサイズ:
23.06 GiB自動キャッシュ(ドキュメント): いいえ
分割:
| スプリット | 例 |
|---|---|
'minival' | 4,809 |
'test' | 19,822 |
'train' | 100,170 |
'validation' | 19,809 |
- 機能構造:
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/id': int64,
'neg_category_ids': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1203)),
'not_exhaustive_category_ids': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1203)),
'objects': Sequence({
'area': int64,
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'id': int64,
'label': ClassLabel(shape=(), dtype=int64, num_classes=1203),
'segmentation': Image(shape=(None, None, 1), dtype=uint8),
}),
})
- 機能ドキュメント:
| 特徴 | クラス | 形 | Dタイプ | 説明 |
|---|---|---|---|---|
| 機能辞書 | ||||
| 画像 | 画像 | (なし、なし、3) | uint8 | |
| 画像/ID | テンソル | int64 | ||
| 否定カテゴリID | シーケンス(クラスラベル) | (なし、) | int64 | |
| 網羅的ではないカテゴリID | シーケンス(クラスラベル) | (なし、) | int64 | |
| オブジェクト | 順序 | |||
| オブジェクト/エリア | テンソル | int64 | ||
| オブジェクト/bbox | BBox機能 | (4) | float32 | |
| オブジェクト/ID | テンソル | int64 | ||
| オブジェクト/ラベル | クラスラベル | int64 | ||
| オブジェクト/セグメンテーション | 画像 | (なし、なし、1) | uint8 |
監視対象キー(
as_supervisedドキュメントを参照):None図( tfds.show_examples ):

- 例( tfds.as_dataframe ):
- 引用:
@inproceedings{gupta2019lvis,
title={ {LVIS}: A Dataset for Large Vocabulary Instance Segmentation},
author={Gupta, Agrim and Dollar, Piotr and Girshick, Ross},
booktitle={Proceedings of the {IEEE} Conference on Computer Vision and Pattern Recognition},
year={2019}
}