ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

CNNで音声認識聞いてきた!

2019-08-13 08:10:19 | AI・BigData
8月12日

TensorFlow実装で学ぶ音声認識の基礎と簡易ハンズオンセミナー
https://ml-for-experts.connpass.com/event/142332/

を聞いてきたのでメモ




Simple Audio Recognition
 音声認識
  https://lib-arts.hatenablog.com/entry/implement_dl6
 12クラスのカテゴリ分類
 Small-footprint Keyword Spottingに対するCNN

ほかにRNNやdilated convolution

※混同行列(Confusion Matrix):対角成分がただしい

論文の読み方
1.Absrtructを読もう
2.わかんないところはその論文のコントリビューションの可能性大
  →そこがどこに書かれているか確認
3.Abstructみて、もちょっと

タスク:問題。
  CNN
  DNN→ここではMLP(マルチレイヤーパーセプトロン)
  adress取り組むの意味で
  constrains:制約条件
   最適化 optimization
    目的関数:objective
    制約条件:constrains

KWS:キーワードスポッティング
 特徴抽出→DNN→事後確率を求める
  P(c):事前確率
  P(c{x):事後確率
 →どっちも足して1
  MFCC (メル周波数ケプストラム係数)

 音素
  フーリエ変換する
  https://ahcweb01.naist.jp/lecture/2016/sp/material/sp-v2.pdf

動かしてみる
 https://github.com/tensorflow/tensorflow
 ダウンロードする
 解凍する
 anacondaのpyhthonのコンソール立ち上げ
 コンソールでcdして、解凍したtensorflow-masterまでいく
 python tensorflow/examples/speech_commands/train.py

ソース(train/py)
 training stepで動かしている
 session.run

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする