さて、Python機械学習の続きをやっていこう。
あれっ!
ロシア語に字幕が付いたっ!?w
話者認識って何だ?
読んで字の如く、誰が話しているかを識別することらしい。
そんなことができるのか〜😲
LibROSA(リブロサ)っていうのが、音声データを扱うライブラリなのか。
ローカル環境のJupyter notebookでは、未インストールのモジュールなので、
以下のコマンドでインストールしておく。
pip install librosa |
その他にも、重要そうなキーワードがあるからメモしとこう。
- パターン認識モデル
- SVM(サポートベクターマシン):高い精度でパターンを識別できる
- 音声の特徴量に関する用語
- フーリエ変換:音声の波形データの変換方法で、どんな周波数の組合せでできているかを分析できる
- MFCC:音声認識によく使われる音声の特徴量
この講義だけで理解できる内容ではないな😓
でもなかなか興味深いテーマだったし、
講師の声優さんのぶっ飛びぐあいも面白かった😈
完全に理解はできていないけど、とりあえず認定証を取得