ゴエモンのつぶやき

日頃思ったこと、世の中の矛盾を語ろう(*^_^*)

Androidで人工音声を生成する技術、KDDI研究所が開発

2012年01月28日 02時28分31秒 | 障害者の自立
 KDDI研究所開発主査の藤田顕吾氏、研究主査の西澤信行氏、開発主査の渡邊英氏によれば、「ささやくヤーツ」を支えるのは、KDDI研究所の日本語音声合成エンジン「N2(エヌツー)」だという。Androidマーケットでは「N2 TTS」というアプリとして提供されており、「N2 TTS」をインストールすると、Androidスマートフォン上で対応アプリを使って、人工音声による日本語読み上げ機能が利用できるようになる。携帯電話のユーザーインターフェイスの1つとなる「N2」はどのような経緯で開発されてきたのだろうか。

■ 軽量サイズが大きな特徴 普段生活する中で、人工音声に接する場面はいくつかある。たとえば電車を利用する際、行き先などを告げる音声も人工音声の一種と言えるが、これは長いセリフを録音して利用するケースが多い。一方、「N2」では、それまで世の中に存在していなかった文章を読み上げるため、音の1つ1つを生成する。さらに、人が読み上げたような自然に聞こえる声を目指している。実際試してみると、100%とは言えないが、多くの文章が自然に聞こえる。先述した「ささやくヤーツ」は、ビジュアル面で美少女キャラクターや執事風の男性キャラクターが用いられており、「~ぞえ」「~げす」と個性的な語尾を付けて喋るため、アニメのキャラクターのような芝居がかった声をつい想像してしまうが、実際に試してみると、感情を抑えた、淡々とした声、という印象で、少し拍子抜けする。「コンピュータが喋っている」という雰囲気が全くないわけではないものの、かなり自然なトーンに聞こえたのも事実。これがAndroidスマートフォンというローカル環境上で動作するのは、数年前には考えられなかった。



 藤田氏によれば、高齢者や視覚障害者が携帯電話を利用しやすいよう、かねてより音声合成技術の開発が進められてきた。しかし、フィーチャーフォン時代はメモリ容量などから、プリセットできる音声のファイルサイズが限られていた。かつては20~30MBは必要だったとのことだが、フィーチャーフォンでの利用に向けて軽量化が図られた。その結果、「N2 TTS」では音声データやプログラム本体を含め、ユーザーがダウンロードするファイルサイズが5.3MBになった。実行時のメモリ容量も10MB程度となった。

 こうしたファイルサイズの小型化を実現するために「N2」で行われている工夫について、西澤氏は、「(人工音声の生成の仕組みは)人の声を最初に録音して、声を細切れにし、合成時になめらかにつなぎ合わせて、声を生成している」と説明。声を細切れにする、という作業はイメージし辛いかもしれないが、たとえば「か(KA)」という音に対しては「K」と「A」、というように、子音と母音に切り分けるのだという。こうして分離した声は“音素”と呼ばれる単位で扱われ、音素を組み合わせて人工音声を生成する。ただ、これまでの技術では、音素を何の工夫もせずにつなぎ合わせていた。すると、音の波形がぶつ切りの状態でくっついてしまい、人が発声できないような音になりかねない。今回は、軽量サイズのプログラム上で、滑らかに繋がるような処理が取り入れられている。

 さらに、イントネーションやアクセントといった要素も、自然な声に聞こえるようにするために必要な要素で、そのために必要な辞書データも「N2 TTS」には含まれる。もし、イントネーション、アクセントなどを無視すると、漢字の読み間違いもさることながら、意味が通じにくい日本語文となって、聞き手は不快に感じる。

 KDDI研究所の工夫により開発された「N2」は、軽量に仕上げられスマートフォン上で動作するという特性を備えることになった。もともとはBREW向けに開発されてきた技術だったが、技術が完成したときにはスマートフォン普及期を迎えていた。しかもAndroidには音声合成インターフェイスが標準的に搭載されており、日本語エンジンとしての「N2」には絶好の場が整ってきた、と言える。

 一方、音声合成技術と言えば、クリプトン・フューチャー・メディアの「初音ミク」のようなソフトウェアを思い浮かべる人もいるだろう。そうした技術との違いについて、西澤氏は、「音声の作り込みが許容されるかどうか」と述べる。つまり、「N2 TTS」では聴き取りやすい声を簡単に生成できることが求められ、歌唱力やエンターテイメント性を高める“エフェクト”とは追求する方向が異なるということになる。

 またiPhoneの「Siri」などのように、ユーザーが発する音声をスマートフォン上で認識する技術にも関心が高まっている。「N2 TTS」で用いられている技術は、名古屋工業大学の徳田研究室が提唱している、統計モデル(HMM、Hidden Markov Model/隠れマルコフモデル)を音声合成に使うというもの。音声の波形を表わす技術が源流で、音声認識技術では、1980年代からHMM方式が用いられてきたが、その後、音声合成技術のほうでも、同じくHMMを活用することになったという。ただ、「N2 TTS」の発展が音声認識に影響を与えるわけではない。

 今後の課題として、渡邊氏はAndroid以外のプラットフォームへの展開、あるいは音声合成技術の活用アプリの拡大などを挙げる。現在も無料で公開されており、個人開発者が「N2 TTS」を活用するアプリを手がけるといった事例も出てきている。また藤田氏は、文章の“意味”を理解するエンジンを開発する企業で、「N2 TTS」の利用を薦めている、といった事例を挙げ、「N2 TTS」だけではなくさまざまな企業の技術を組み合わせたアプリの開発も可能になってきたと語っており、さらなる拡大も期待できる。コンピューターがユーザーを手助けするエージェント技術の一環として、人工音声は重要な基盤となる部分。今後の発展、活用スタイルの拡大は注目したい。

■ URL
 製品情報
 http://www.kddilabs.jp/products/audio/n2tts/product.html

ケータイ Watch - 2012/1/27 11:00

京大病院とNTT、リウマチ患者を対象とした情報共有システムを開発……病院外でもスマホで計測

2012年01月28日 02時15分09秒 | 障害者の自立
 京都大学医学部附属病院(京大病院)と日本電信電話(NTT)は27日、関節リウマチ患者の病気の進行度や症状・機能障害の程度をスマートフォンで計測し、かつ医療従事者がリアルタイムに計測情報にアクセスできるシステムを開発したことを公表した。

 手足の機能に大きな障害をもたらす慢性疾患の1つに「関節リウマチ」(Rheumatoid Arthritis)があり、患者の数は全国で60万人以上と推定されている。京大病院では2011年4月に、本格的な診療科横断的治療センターであるリウマチセンターを創設、治療改善のための研究を進めていが、関節リウマチの治療において、日々の活動状況を短い外来診察の時間の問診だけで判断することは難しいのが現状だった。

 NTTは、「疾患活動性情報共有システム」を開発。 疾患活動性情報共有システムでは、患者に負担をかけることなく日常生活のなかで簡易に計測・記録・評価が可能となる。スマートフォンを持っているだけで、歩容(歩いているときの身体運動の様子)や移動距離の測定が可能であり機能評価を行うことができる。また患者が日々の体調をスマートフォンで簡易に記録でき、疾患活動性評価を行うことができる。計測結果等を即時にネットワークを介してサーバへ転送し、医療従事者と共有することも可能。

 NTTが開発したXML形式の記述方式「FDML(Field Data Mark-up Language」を採用しており、スマートフォンからサーバへ送信されるさまざまなセンサ情報を、時間関連性を維持しながら扱うことができる。また、サーバ側がFDML(Field Data Mark-up Language)準拠であればデータベース構造の変更なく新しいセンサ情報を簡単に追加できる。

 両者は、スマートフォンで動作する歩容解析アプリケーションを利用し、京大病院内にて関節リウマチ患者の歩容を測定する予備実験を、昨年4月から5月にかけて実施。従来使用されてきた大型の加速度センサと同等の歩行評価が可能であること、歩容評価が関節リウマチの疾患活動性や問診による日常生活動作(ADL)と相関があることを確認したという。

 京大病院とNTTは、日常生活のなかでの有用性を確認するため、2月1日より患者にスマートフォンを貸与し、病院外でのフィールド実験も開始する予定。

RBB Today - 2012年1月27日(金) 18時15分

受験票の未確認原因 受験生放置問題で佐賀大

2012年01月28日 02時09分57秒 | 障害者の自立
 大学入試センター試験初日(14日)に、歩行障害などがある受験生が佐賀大(佐賀市)で間違った教室に案内され、試験開始が1時間5分遅れた問題で、同大の事故調査委員会(委員長=岩本諭副学長)は27日、この受験生の教室に監督者がいないことを不審に思った職員が事務室に連絡したが、事務室はミスに気付かず、受験票も確認しないまま放置していたと発表した。

 委員会によると、この受験生は他の受験生と同じ教室で受験するはずだった。しかし、障害を理由とした別室受験と思い込んだ職員が間違った教室に案内。試験開始直前に別の職員が監督者がいないことを事務室に連絡したが、「時間になれば来る」と言われて放置。試験開始約10分後に受験生が申し出るまで、ミスは発覚しなかった。

 大学側がミスに気付かなかった理由について委員会は、この受験生が午前中の試験2科目のうち2科目目のみを受験するため早めに教室で待機していると勘違いした可能性があるとしている。

 岩本副学長は「受験票を確認していれば防げた。配慮に欠けた対応だった」とあらためて陳謝。2月に実施する前期試験に向け、職員の配置見直しや事務連絡の周知徹底で再発防止に努める。

=2012/01/28付 西日本新聞朝刊=

憂楽帳:気づかない視点

2012年01月28日 02時06分03秒 | 障害者の自立

 1年ほど前、佐賀大名誉教授の斉場三十四(さいばみとし)さん(68)が「世の中には右側にしか立てない人がいる」というタイトルの本を私家版で出した。

 右翼思想の本ではない。両足などが不自由な斉場さんが、障害者の立場から社会の矛盾を指摘したエッセー集だ。タイトルは、エスカレーターに乗る時、利き腕の右手でベルトをつかまないと不安定になる障害者もいるのに、右側を空けて立つルールが定着し、追い越す側の強者の論理が横行していることへの疑問を表現した。

 09年に始まった75歳以上の高齢ドライバーへの「認知機能検査」にも触れ、公共交通機関が壊滅状態の地方での免許取り消しは「近代的うば捨て」「深刻な差別の誕生」と指弾する。

 東日本大震災後にお会いした際は「東京の地下鉄でエスカレーターなどが止められていた。節電は必要だが、それを頼りにしている高齢者、障害者への配慮を忘れている」と指摘。私たちが気づかない視点を示してくれる。

 現在は国際医療福祉大福岡リハビリテーション学部(福岡県大川市)で教授を務める斉場さん。ますますの辛口批評を期待したい。


毎日新聞 2012年1月27日 西部夕刊

県、計画案の意見募集 「障害福祉」と「高齢者健康福祉」【愛知】

2012年01月28日 02時00分26秒 | 障害者の自立

 県は、新年度から3年間の「障害福祉計画」案と「高齢者健康福祉計画」案に対し、パブリックコメント制度で県民の意見を募集する。2月23日締め切り。


 障害福祉計画案は、福祉施設入所者の地域生活への移行を積極的に進めることをうたい、グループホームやケアホームの整備を進めることなどが柱。高齢者健康福祉計画案は、介護や医療、生活支援サービスなどが切れ目なく提供される「地域包括ケアシステム」構築に向けた取り組みなどが盛り込まれている。いずれも県のウェブサイトで全文や概要が見られるほか、県庁や県民生活プラザでも閲覧できる。


 寄せられた意見は計画策定の参考にするほか、ウェブサイトなどで概要を報告する。ファクスや電子メール、郵便で受け付ける。問い合わせは、障害福祉計画案が県障害福祉課=電052(954)6317、高齢者健康福祉計画案が県高齢福祉課=電052(954)6288=へ。

中日新聞 - 2012年1月27日