不惑にしてまだ何者でもない者のブログ

Arduino関連、Raspberry Pi関連、プログラミング学習

paizaラーニング『Python×AI・機械学習入門編2: 話者認識をしよう (全6回) 』を受講してみた

2021-01-23 22:45:19 | paiza
さて、Python機械学習の続きをやっていこう。


あれっ!
ロシア語に字幕が付いたっ!?w

話者認識って何だ?
読んで字の如く、誰が話しているかを識別することらしい。
そんなことができるのか〜😲 

LibROSA(リブロサ)っていうのが、音声データを扱うライブラリなのか。
ローカル環境のJupyter notebookでは、未インストールのモジュールなので、
以下のコマンドでインストールしておく。

pip install librosa

その他にも、重要そうなキーワードがあるからメモしとこう。
  • パターン認識モデル
    • SVM(サポートベクターマシン):高い精度でパターンを識別できる
  • 音声の特徴量に関する用語
    • フーリエ変換:音声の波形データの変換方法で、どんな周波数の組合せでできているかを分析できる
    • MFCC:音声認識によく使われる音声の特徴量
この講義だけで理解できる内容ではないな😓 

でもなかなか興味深いテーマだったし、
講師の声優さんのぶっ飛びぐあいも面白かった😈 

完全に理解はできていないけど、とりあえず認定証を取得