星田オステオパシー

ありがたや~(源平討魔伝風に) 作詞支援プログラム05

さて、前回で一応自分なりの方法で動くようにはなった「ボイン発見プログラム」でありますが・・


これですねぇ~・・「余計なお世話」とか気を使って書いていただいてますけど、お金払ってもここまで丁寧な事ってしていただけないですよ!ホントありがたすぎて・・題材として使っていただける、いわばネタとして使っていただけるなら良いんですけど、もしも毎回添削しないとという流れが出来てしまったら申し訳ないので、本当にネタが無いし丁度良いか!とかそういう時用にしておいてくださいませ m(_ _)m

いやしかし「関数」の説明はハッ!としました。小さいブロックを作って積み重ねてゆくってイメージが全く頭にありませんでした。何というか頭から流れてゆくのをそのまま書いてゆくって発想だったのですが、これはもしやPC-6001時代のBASICでの写経体験が影響してるのかも!?とか。ま、言い訳か。今回の自力プログラミングの時もその頭から書いてゆくってのがあったからか、メインのプログラム部分まるごと1つの関数に入れてるだけで「変だな?」とは薄々思ってたんですけど見返して笑ってしまいました。

次のプログラムに行く前に、今回のCametan42さんのをじっくり読ませていただいて理解しながら写経して、ついでにちょっと次に繋がる機能を足したいと思います。ありがとうございます!

この3日ほどちょっと色々と重なって止まってたんですけどようやく再開です。まずは、辞書検索をするための元になるデータを作らないと。

こちら「英辞郎」という巨大英和辞書データを入れた作ったPDICってアプリの画面なんですが発音のところにちゃんと記号が入っている!
どうやら、文字コードによっては入力も表示も出来るらしい・・これを使えば発音記号の比較が出来ますね、多分。

で、PDICってから「単語」「発音」の部分のみを選択してエクスポートしたんだけど、単語だけじゃなくて熟語やら映画名やらも含まれてる巨大辞書なのでそれが邪魔。エクセル互換ソフトに読み込ませてから発音が入ってない項目を削除しようと思ったけどソフトに全部読み込めないというね・・こうなったらまずはPythonで発音が含まれている項目(つまり単語)だけを抜き出すプログラムを作るところからか・・・と覚悟してたんですけど、普通にPDICの検索設定で狙った部分だけの出力が出来ました。すごすぎません、このソフト。




こんな感じで発音記号が入ってるところだけ検索で選んでファイル出力すると・・181Mバイトだったものが670kバイトまで小さくなって


グーグルスプレッドシートでも全部読めるようになりました。写経させていただくプログラムでは、母音のパターンを記録しておいてこのデータから同じボイン配列の単語を選び出せるようにしてみたいと思います。発音記号の類似性で選び出すのは次のプログラムとして挑戦だなぁ~

続く

  • Xでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

最近の「プログラミング」カテゴリーもっと見る

最近の記事
バックナンバー
人気記事