3月24日
ディープラーニングの物体認識(SSD: Single Shot MultiBox Detector)について
PyTorchのハンズオンで学ぶ物体検出(Object Detection) #1
https://ml-for-experts.connpass.com/event/123469/
で聞いてきた!ので内容メモメモ
・物体検出の特徴
バウンディングボックスとクラス確信度を同時に推論
→複数の物体を同時に
回帰と分類同時にやっている
物体検出
X画像 Y政界の座標、正解のクラス
データセットVOCの訓練データ
画像
クラスと位置
物体検出の歴史
YOLO→リアルタイム処理ができるようになって、世の中変わった
直接バウンディングボックス
YOLOV2のデモ
・物体検出のパフォーマンス
速度と精度:速度と精度mAP,FSP
SSD300
・SSDの仕組み
ひな形のバウンディングボックスをばらまく→オフセットを推論
バウンディングボックスの差票=デフォルトボックスの座標+オフセット
→オフセットを推論
(CX,CY,w、h)を推論(Cセンター、中心点のXY)
SSD→6層のマルチスケール特徴マップ
特徴マップは6層、8732個のデフォルトボックス作成
VGG16から2層、追加ネットワークから4層使う
セルがデフォルトボックスを作る:比率を変える 形状変わっても捉えられる
もうひとひねり、出力層
デフォルトボックスの推論にK(形状を変えたはこ)*4チャンネル、クラスにP
→それはデフォルトボックス分必要
MNISTの場合10個だった
つまり、位置推定とコンフィデンスをやっている
計算一覧
・横の流れと縦の流れ
・バウンディングボックス
クラスに1つ追加:C0何も入っていない
クラスにC1~C20が0.6以上なら、バウンディングボックス+オフセット
一番近い確信度のボックスをのこす
Colaboratory
クラウド環境のJupyter Notebook
PyTorch1.0がインストール済み
2時間までGPU使える
Colab Notebookの中に格納
PyTorch
TensorはPyTorchの多次元配列
Numpyとほぼ同じ
viewで形状変えられる
データ型がある
→GPUとCPUの違い:GPUTentor,CPUTensor
(GPUは.cudaが入る)
ノートブックの設定で、CPU,GPU選べる
・SSDのプログラム
確信度のたかい200件の確信度+座標を持っている
→確信度を下げてしまうと、おかしなものが出る
VGG,追加ネットワーク、オフセット、コンフィデンスの畳み込みグループがある
【論文】
https://arxiv.org/abs/1512.02325
ディープラーニングの物体認識(SSD: Single Shot MultiBox Detector)について
PyTorchのハンズオンで学ぶ物体検出(Object Detection) #1
https://ml-for-experts.connpass.com/event/123469/
で聞いてきた!ので内容メモメモ
・物体検出の特徴
バウンディングボックスとクラス確信度を同時に推論
→複数の物体を同時に
回帰と分類同時にやっている
物体検出
X画像 Y政界の座標、正解のクラス
データセットVOCの訓練データ
画像
クラスと位置
物体検出の歴史
YOLO→リアルタイム処理ができるようになって、世の中変わった
直接バウンディングボックス
YOLOV2のデモ
・物体検出のパフォーマンス
速度と精度:速度と精度mAP,FSP
SSD300
・SSDの仕組み
ひな形のバウンディングボックスをばらまく→オフセットを推論
バウンディングボックスの差票=デフォルトボックスの座標+オフセット
→オフセットを推論
(CX,CY,w、h)を推論(Cセンター、中心点のXY)
SSD→6層のマルチスケール特徴マップ
特徴マップは6層、8732個のデフォルトボックス作成
VGG16から2層、追加ネットワークから4層使う
セルがデフォルトボックスを作る:比率を変える 形状変わっても捉えられる
もうひとひねり、出力層
デフォルトボックスの推論にK(形状を変えたはこ)*4チャンネル、クラスにP
→それはデフォルトボックス分必要
MNISTの場合10個だった
つまり、位置推定とコンフィデンスをやっている
計算一覧
・横の流れと縦の流れ
・バウンディングボックス
クラスに1つ追加:C0何も入っていない
クラスにC1~C20が0.6以上なら、バウンディングボックス+オフセット
一番近い確信度のボックスをのこす
Colaboratory
クラウド環境のJupyter Notebook
PyTorch1.0がインストール済み
2時間までGPU使える
Colab Notebookの中に格納
PyTorch
TensorはPyTorchの多次元配列
Numpyとほぼ同じ
viewで形状変えられる
データ型がある
→GPUとCPUの違い:GPUTentor,CPUTensor
(GPUは.cudaが入る)
ノートブックの設定で、CPU,GPU選べる
・SSDのプログラム
確信度のたかい200件の確信度+座標を持っている
→確信度を下げてしまうと、おかしなものが出る
VGG,追加ネットワーク、オフセット、コンフィデンスの畳み込みグループがある
【論文】
https://arxiv.org/abs/1512.02325