- 説明:
WIDER FACE データセットは、公開されている WIDER データセットから画像を選択した顔検出ベンチマーク データセットです。サンプル画像に示されているように、32,203 枚の画像を選択し、393,703 枚の顔にラベルを付けます。 WIDER FACE データセットは、61 のイベント クラスに基づいて編成されています。イベント クラスごとに、40%/10%/50% のデータをトレーニング、検証、およびテスト セットとしてランダムに選択します。 PASCAL VOC データセットで採用されているものと同じ評価指標を採用しています。 MALF および Caltech データセットと同様に、テスト画像のバウンディング ボックスのグラウンド トゥルースは公開しません。ユーザーは、最終的な予測ファイルを提出する必要があり、評価を進めます。
ソース コード:
tfds.object_detection.WiderFaceバージョン:
-
0.1.0(デフォルト): リリース ノートはありません。
-
ダウンロードサイズ:
3.42 GiBデータセットサイズ:
3.45 GiB自動キャッシュ(ドキュメント): いいえ
スプリット:
| スプリット | 例 |
|---|---|
'test' | 16,097 |
'train' | 12,880 |
'validation' | 3,226 |
- 機能構造:
FeaturesDict({
'faces': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'blur': uint8,
'expression': bool,
'illumination': bool,
'invalid': bool,
'occlusion': uint8,
'pose': bool,
}),
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
| 特徴 | クラス | 形 | Dtype | 説明 |
|---|---|---|---|---|
| 特徴辞書 | ||||
| 顔 | 順序 | |||
| 顔/bbox | BBoxFeature | (4) | float32 | |
| 顔/ぼかし | テンソル | uint8 | ||
| 顔・表情 | テンソル | ブール | ||
| 顔/イルミネーション | テンソル | ブール | ||
| 顔/無効 | テンソル | ブール | ||
| フェース/オクルージョン | テンソル | uint8 | ||
| 顔・ポーズ | テンソル | ブール | ||
| 画像 | 画像 | (なし、なし、3) | uint8 | |
| 画像/ファイル名 | 文章 | ストリング |
監視されたキー(
as_superviseddocを参照):None図( tfds.show_examples ):

- 例( tfds.as_dataframe ):
- 引用:
@inproceedings{yang2016wider,
Author = {Yang, Shuo and Luo, Ping and Loy, Chen Change and Tang, Xiaoou},
Booktitle = {IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
Title = {WIDER FACE: A Face Detection Benchmark},
Year = {2016} }