8月12日
TensorFlow実装で学ぶ音声認識の基礎と簡易ハンズオンセミナー
https://ml-for-experts.connpass.com/event/142332/
を聞いてきたのでメモ
Simple Audio Recognition
音声認識
https://lib-arts.hatenablog.com/entry/implement_dl6
12クラスのカテゴリ分類
Small-footprint Keyword Spottingに対するCNN
ほかにRNNやdilated convolution
※混同行列(Confusion Matrix):対角成分がただしい
論文の読み方
1.Absrtructを読もう
2.わかんないところはその論文のコントリビューションの可能性大
→そこがどこに書かれているか確認
3.Abstructみて、もちょっと
タスク:問題。
CNN
DNN→ここではMLP(マルチレイヤーパーセプトロン)
adress取り組むの意味で
constrains:制約条件
最適化 optimization
目的関数:objective
制約条件:constrains
KWS:キーワードスポッティング
特徴抽出→DNN→事後確率を求める
P(c):事前確率
P(c{x):事後確率
→どっちも足して1
MFCC (メル周波数ケプストラム係数)
音素
フーリエ変換する
https://ahcweb01.naist.jp/lecture/2016/sp/material/sp-v2.pdf
動かしてみる
https://github.com/tensorflow/tensorflow
ダウンロードする
解凍する
anacondaのpyhthonのコンソール立ち上げ
コンソールでcdして、解凍したtensorflow-masterまでいく
python tensorflow/examples/speech_commands/train.py
ソース(train/py)
training stepで動かしている
session.run
TensorFlow実装で学ぶ音声認識の基礎と簡易ハンズオンセミナー
https://ml-for-experts.connpass.com/event/142332/
を聞いてきたのでメモ
Simple Audio Recognition
音声認識
https://lib-arts.hatenablog.com/entry/implement_dl6
12クラスのカテゴリ分類
Small-footprint Keyword Spottingに対するCNN
ほかにRNNやdilated convolution
※混同行列(Confusion Matrix):対角成分がただしい
論文の読み方
1.Absrtructを読もう
2.わかんないところはその論文のコントリビューションの可能性大
→そこがどこに書かれているか確認
3.Abstructみて、もちょっと
タスク:問題。
CNN
DNN→ここではMLP(マルチレイヤーパーセプトロン)
adress取り組むの意味で
constrains:制約条件
最適化 optimization
目的関数:objective
制約条件:constrains
KWS:キーワードスポッティング
特徴抽出→DNN→事後確率を求める
P(c):事前確率
P(c{x):事後確率
→どっちも足して1
MFCC (メル周波数ケプストラム係数)
音素
フーリエ変換する
https://ahcweb01.naist.jp/lecture/2016/sp/material/sp-v2.pdf
動かしてみる
https://github.com/tensorflow/tensorflow
ダウンロードする
解凍する
anacondaのpyhthonのコンソール立ち上げ
コンソールでcdして、解凍したtensorflow-masterまでいく
python tensorflow/examples/speech_commands/train.py
ソース(train/py)
training stepで動かしている
session.run