昨夜は実験をしていました。文章の なかから自動的に情報を抽出するには一般に複雑な構文解析をおこないますが、そのような複雑な処理をおこなわずに簡単な方法で情報を抽出する実験です。
前日に簡単な解析ルーチンを作成してあります。解析ルーチンの開発に かかった時間は2~3時間。この開発時間から わかるとおり、ごくシンプルな しくみです。昨夜は、その解析ルーチンをつかって実際に1000件以上の文章から情報を抽出してみました。
ヾ(≧∇≦)〃 おーっ! でてくる、でてくる。
シンプルな方法なのに面白いほど情報が抽出されてきます。結果をみる かぎり、信頼性も十分です。おもしろい、おもしろい。と あれこれ実験しているうちに あさに なってしまいました。マシンに かじりついて夢中に なり、気づけば7時間が すぎていました。おもしろいのは いいけど、これは やりすぎ。徹夜でカラオケしたような ものです。体調をくずさないように、ほどほどに しないとね。
※ この記事の本文からは漢字の訓を排除しています。
前日に簡単な解析ルーチンを作成してあります。解析ルーチンの開発に かかった時間は2~3時間。この開発時間から わかるとおり、ごくシンプルな しくみです。昨夜は、その解析ルーチンをつかって実際に1000件以上の文章から情報を抽出してみました。
ヾ(≧∇≦)〃 おーっ! でてくる、でてくる。
シンプルな方法なのに面白いほど情報が抽出されてきます。結果をみる かぎり、信頼性も十分です。おもしろい、おもしろい。と あれこれ実験しているうちに あさに なってしまいました。マシンに かじりついて夢中に なり、気づけば7時間が すぎていました。おもしろいのは いいけど、これは やりすぎ。徹夜でカラオケしたような ものです。体調をくずさないように、ほどほどに しないとね。
※ この記事の本文からは漢字の訓を排除しています。