ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

ディープラーニングの物体認識(SSD)を聞いてきた!

2019-03-26 09:03:57 | Weblog
3月24日

ディープラーニングの物体認識(SSD: Single Shot MultiBox Detector)について

PyTorchのハンズオンで学ぶ物体検出(Object Detection) #1
https://ml-for-experts.connpass.com/event/123469/


で聞いてきた!ので内容メモメモ




・物体検出の特徴
 バウンディングボックスとクラス確信度を同時に推論
 →複数の物体を同時に
  回帰と分類同時にやっている
 物体検出
 X画像 Y政界の座標、正解のクラス

 データセットVOCの訓練データ
  画像
  クラスと位置

 物体検出の歴史
  YOLO→リアルタイム処理ができるようになって、世の中変わった
     直接バウンディングボックス

 YOLOV2のデモ

・物体検出のパフォーマンス
 速度と精度:速度と精度mAP,FSP
 SSD300

・SSDの仕組み
 ひな形のバウンディングボックスをばらまく→オフセットを推論
 バウンディングボックスの差票=デフォルトボックスの座標+オフセット
  →オフセットを推論
   (CX,CY,w、h)を推論(Cセンター、中心点のXY)

SSD→6層のマルチスケール特徴マップ
 特徴マップは6層、8732個のデフォルトボックス作成
  VGG16から2層、追加ネットワークから4層使う
 セルがデフォルトボックスを作る:比率を変える 形状変わっても捉えられる

もうひとひねり、出力層
デフォルトボックスの推論にK(形状を変えたはこ)*4チャンネル、クラスにP
  →それはデフォルトボックス分必要

MNISTの場合10個だった

つまり、位置推定とコンフィデンスをやっている

計算一覧
・横の流れと縦の流れ

・バウンディングボックス
 クラスに1つ追加:C0何も入っていない
 クラスにC1~C20が0.6以上なら、バウンディングボックス+オフセット
 一番近い確信度のボックスをのこす

Colaboratory
 クラウド環境のJupyter Notebook
PyTorch1.0がインストール済み
 2時間までGPU使える
 Colab Notebookの中に格納

PyTorch
 TensorはPyTorchの多次元配列
 Numpyとほぼ同じ
 viewで形状変えられる
 データ型がある
  →GPUとCPUの違い:GPUTentor,CPUTensor
   (GPUは.cudaが入る)
   ノートブックの設定で、CPU,GPU選べる

・SSDのプログラム
 確信度のたかい200件の確信度+座標を持っている
 →確信度を下げてしまうと、おかしなものが出る

 VGG,追加ネットワーク、オフセット、コンフィデンスの畳み込みグループがある

【論文】
https://arxiv.org/abs/1512.02325


この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 量子コンピューターの動かし... | トップ | 量子コンピューターの理解の... »
最新の画像もっと見る

Weblog」カテゴリの最新記事