TickTack World

人口知能の分野である機械学習を、やさしく解説するホームページを紹介します。

「よくわかるディープラーニングの仕組み」を発売しました

2016-10-01 14:15:17 | 日記
10月1日より、ディープラーニング(深層学習)の入門書「よくわかるディープラーニングの仕組み」をAmazonから出版しました。

本書は、従来の数式ばかりの専門家向けディープラーニング解説書とは異なり、カラフルで分かりやすいイラストを多用し、数式は必要最小限に留め、専門家以外の人でもディープラーニングが理解できるようにしています。学生や文系ビジネスマンから、人工知能のプログラミングを始めたい人まで、ディープラーニングとは何か、そして何ができるのか、今後はどのような分野で活用できるのかが理解できると思います。
ディープラーニングの原型であるニューラルネットワークの原理から説き起こし、画像認識のCNN、時系列データを扱うRNN、自然言語処理分野で活用が始まったLSTM、誤差逆伝播法など、最新技術までその仕組みをわかりやすく解説しています。本書を読むことで、ディープラーニングの原理から、その秘めた能力まで理解し、身に付くことができるはずです。
http://gagbot.net

なぜAIは恋愛相談ばかり答えるのか

2016-09-13 12:59:17 | 日記
9月6日からNTTレゾナントの「教えて!goo」は、AIが恋愛のお悩みに回答するサービスを始めた。つい先日、「Yahoo!知恵袋」がIBM の「人工知能」Watsonを活用した、恋愛成就の可能性をすぐに答えてくれるサービス「脈ありチェッカーβ」を開始したばかりだ。なぜか最近、AIが回答する恋愛相談所が流行っているようだ。
この「教えて!goo」は、恋愛相談カテゴリーに投稿された質問に、人工知能(AI)の「オシエル」が、過去に投稿したQ&Aから最適な回答を探して回答するというサービス。わざわざ「恋愛系に特化」と明記されてあるのが興味深い。

NTTレゾナントのプレスリリースには、『世界初!AIによる長文回答生成技術』とあり、

=====================================

時系列ディープラーニングを質問と回答のマッチングに応用し、「AIによる長文回答生成」に世界で初めて取り組んでいます。
AIによる回答は、以下の手順で生成されます。
(1) 3,000万件以上のQ&Aデータから、使われている単語の意味やQ(質問)と A(回答)の対応関係、A内の文の組合せを、ディープラーニング(深層学習)を用いて学習し、モデル(型)を作る
(2)投稿されたQに対して、上記(1)で学習したモデルを用いて、質問にマッチする「共感」、「結論」、「理由」を含む文を回答集合より抽出、抽出した文を組み合わせて新たにAを生成する
この技術は、NTTレゾナントが独自に開発したものです。人生相談など答えが決まっていない質問に対し、ディープラーニングを用い、複数の文を組み合わせ、自然な回答を生成する技術としては、世界で初となります。今回、その技術を用いて、サービス化を実現しました。

=====================================

とある。ディープラーニングRNN(Recurrent neural network)の、Bi-LSTM(Bi-directional Long short-term memory)を使っているようだ。『恋愛相談に特化した単語ベクトルを生成し、単語の持つ意味を多次元で数量的に表現することで、表記のみでは捉えられない暗黙的な意味を表現する』とあるが、これが本当なら凄いこと。3000万件の日本語の文章を、LSTMのような計算量の多い処理をするだけでも、莫大な計算機リソースが必要なはず。しかも回答文は、『質問への共感となる文、結論となる文、例示となる文の3文の組合せを、現在の質問に沿って柔軟に組み替え、新たな回答文書を生成して回答』するのだそうだ。

Yahoo!の「脈ありチェッカーβ」の方は、一般的な自然言語処理で質問を感情分析しているだけで、回答も「脈あり」「脈なし」といたってシンプル。それに比べると、さすが日本語処理のトップNTTだけあって、似たようなサービスでもレベルが違う。それにしても、質問に対してAIが日本語で回答する初のサービスを、恋愛相談に特化させる理由はどこにあったのだろうか。

これは私の想像だが、「回答に正解がない。曖昧な回答でも許される。質問と回答の例が膨大にストック内にあり、前例のない質問がないはずなので、必ず回答例がストック内にある」からではないだろうか。もし正解が一つしかない質問だと、不正解ではAIの面目が丸つぶれになる。しかし恋愛相談なら、たとえテキトーに答えても「苦笑」で終われるので都合がよいのだろう。ま~それでも、まっとうな日本語で答えられるのだから、日本語処理の技術レベルは間違いなく日本のトップレベルだろう。

http://gagbot.net/

AIが恋の行方を診断するサービスの作り方

2016-09-06 16:31:49 | 日記
「Yahoo!知恵袋」がIBM Watsonを活用して、恋愛成就の可能性をすぐに答えてくれるサービス「脈ありチェッカーβ」を、8月から提供を開始。累計300万ダウンロードの実績があるAndroidアプリ「悩み相談できる質問・回答掲示板」への追加機能として提供した。ユーザーが「脈ありチェッカーβ」に恋愛相談をすると、「脈あり」「脈なし」を即座に判定。診断結果は回答の確からしさを示す確信度と共に表示されるとのことだ。

仕掛けとしては、まず「Yahoo!知恵袋」が持つ450万件の恋愛Q&Aを、IBMが今年から開始した機械学習サービス「Watson日本語API」の「NLC(Natural Language Classifier)」で分類して回答モデルを作成。「Document Conversion」と「R&R」のAPI を利用して、ユーザーから「告白しようと思っている相手がいる」などの質問から回答候補を検索。「Dialog」APIを利用して会話を制御して、「脈あり」「脈なし」と回答しているようだ。

日本IBMは、今年の2月から日本語APIの提供を開始している。Watsonは、元々Natural Language Classifier(自然言語分類)が得意の機械学習マシンだが、それまでは英語しか使えなかった。これをソフトバンクと協力して、やっと日本語も扱えるようになったのだが、今までは銀行向けのヘルプデスクサービスくらいしか実用例がなかった。
今回のYahoo!のサービスはAndroidアプリだが、日本語APIを利用した初めてのB to Cサービス。その意味では非常に先進的なのだが、サービスとしてみると「脈あり」「脈なし」しかないので、乱数で回答する「恋占い」とさして代わり映えがしない。せっかく高度な日本語での自然言語処理までしているのだから、恋愛指南くらいはしてもらいたいもんだ。クラス分類された学習済みMLモデルがあり、分類結果に対する「模範回答」のDBがあるのだから、難しい話ではないと思うのだが。まあ次のバージョンに期待しよう。

AIが書いた本「賢人降臨」が与えるインパクト

2016-08-27 16:18:13 | 日記
賢人降臨クエリーアイ株式会社は、人工知能「零」が書いた書籍「賢人降臨」(けんじんこうりん)を、8月24日電子書籍で出版した。この「賢人降臨」は、クエリーアイがディープラーニングで福沢諭吉「学問のすゝめ」、新渡戸稲造「自警録」の二冊を学習させ、文章を創作させたものだ。

お題は以下の五つで、本書はこのお題の答えを零が著したもの。それぞれ第一から第五の章とした五章構成で、総計約六万文字、一般的な新書の約半分に相当する量だ。
「若者」、「学問を修め立身」、「世界を制する」、「成功とは」、「人とは何を示すもの」

ここから導きだされた、それぞれの最初の文は、以下になる。

「若者もあり、あるいは才智|逞《たくま》しゅうして役人となり商人となりて天下を動かす者もあり・・・」
「学問を修め立身分を用うるの理あり。・・・」
「世界を制する者ははなはだ少ない。・・・」
「成功とはなんぞまらぬことである。・・・」
「人とは何を示すものでない。いつぞそういう者でもよい。・・・」

このクエリーアイ社は2010年創業で、名古屋大学と産学共同研究を行っているベンチャー企業。ディープラーニング特にRNN(Recurrent neural network)を得意としているようだ。この再帰型ニューラルネットワークは、画像処理で用いられるディープラーニングCNNと異なり、音声のような可変長データを扱うためのディープラーニング。文章も可変長データであり、対象となる単語の前後にある単語と関係が深いため、最近は自然言語処理にも、このRNNを用いた研究が進んでいる。

人工知能に小説を書かそうという試みは、「きまぐれ人工知能プロジェクト作家ですのよ」が「星新一賞」へ応募で一躍有名になった。しかし、現段階では人工知能が100%書いているわけではなく、かなり人出をかけているのが実態だ。しかし「賢人降臨」は、人が本文の校閲、校正を一切していないとのことだから、一気にレベルアップしている。

自然言語処理でディープラーニングを用いる場合、RNNでも最近はLSTM(Long Short-Term Memory)が流行り。これはシーケンシャルに入力されてくる「言葉」を、その前後関係も含めて「予測」する場合、長期間の前後関係まで考慮しようとすると、計算量が爆発してしまう。しかし、このLSTMは長期の依存関係を学習できる素晴らしいアルゴリズムなのだ。クエリーアイ社はLSTMを得意としており、IBMのSoftLayerにGPUを搭載した物理サーバを持っているようなので、この「賢人降臨」が出来たと思われる。

ただ小説と異なり、この「賢人降臨」には、ストーリーがあるわけではない。「学問のすゝめ」と「自警録」を学習させたRNNに、「お題」を与えて「予測」させたものだ。したがってRNNは与えられた「お題」、例えば「若者」という単語に続く「出現頻度の高い文章」を生成したものと解釈ができる。

それにしても、人がまともに読める文章が自動で生成できたのだから、素晴らしい成果と言えるだろう。単純に、LSTMに大量の文章を読み込ませただけでは、まともな文章は出力されないはず。何かノウハウがあるはずだが、まあ大学ではないので企業秘密だろうな。

エンジニア文明論

2016-08-19 18:55:17 | 日記
:::::: 目次 ::::::canstockphoto34223036

■2016年7月「ポケモンGOが政府もゲット」

■2016年7月「ITの超速進化と大企業没落の理由」その3

■2016年7月「ITの超速進化と大企業没落の理由」その2

■2016年6月「ITの超速進化と大企業没落の理由」その1

■2016年5月「ダジャレを話せるAI会話を作ってみたのだが…」

■2016年4月「人工知能が書く小説とは」

■2016年3月「AIにとっての倫理観とは?」

■2016年3月「AIは囲碁のルールも知らずになぜプロ棋士に勝てたか」

■2015年10月「米国調査会社の描く2018年とは」

■2015年10月「教育は商取引ではない」

■2015年8月「ジュラシック・ワールドとゲノム編集」

■2015年7月「同性婚・LGBTが与える衝撃とは」

■2015年7月「大企業の栄枯盛衰の仕組みとは」

■2015年6月「サイバー攻撃者はサラリーマン」

■2015年6月「文系大学は不要なのか?」

■2015年6月「日本に経済成長は必要なのか?」