2021年1月23日のブログ記事一覧-不惑にしてまだ何者でもない者のブログ

さて、Python機械学習の続きをやっていこう。

あれっ！

ロシア語に字幕が付いたっ！？w

話者認識って何だ？

読んで字の如く、誰が話しているかを識別することらしい。

そんなことができるのか〜😲

LibROSA（リブロサ）っていうのが、音声データを扱うライブラリなのか。

ローカル環境のJupyter notebookでは、未インストールのモジュールなので、

以下のコマンドでインストールしておく。

pip install librosa

その他にも、重要そうなキーワードがあるからメモしとこう。

パターン認識モデル
- SVM（サポートベクターマシン）：高い精度でパターンを識別できる
音声の特徴量に関する用語
- フーリエ変換：音声の波形データの変換方法で、どんな周波数の組合せでできているかを分析できる
- MFCC：音声認識によく使われる音声の特徴量

この講義だけで理解できる内容ではないな😓

でもなかなか興味深いテーマだったし、

講師の声優さんのぶっ飛びぐあいも面白かった😈

完全に理解はできていないけど、とりあえず認定証を取得