歩けば楽し

楽しさを歩いて発見

  思い出を歩いて発掘

   健康を歩いて増進

眼底検査装置からの画像情報を用いて、緑内障を自動診断できる機械学習モデルを構築

2019-08-11 | 医学
 理化学研究所光量子工学研究センター眼疾患クラウド診断融合連携研究チームの秋葉正博チームリーダー、横田秀夫副チームリーダー(同センター画像情報処理研究チームリーダー)、安光州客員研究員、東北大学大学院医学系研究科眼科学教室の中澤徹教授らの共同研究グループは、眼底検査装置からのマルチモダリティ画像情報を用いて、緑内障を自動診断できる機械学習モデルを構築した。本研究成果は今後、各症例に対して機械学習モデルによる確信度を提示することで、緑内障の早期発見につながると期待できる。本研究成果は、英国の科学雑誌「Journal of Healthcare Engineering」のオンライン版(2月18日付け)に掲載。
 緑内障は、高眼圧、網膜への血流量低下などのさまざまな危険因子により、視神経が損傷を受け、やがて失明に至る疾患で、日本では中途失明原因の第1位となっている。緑内障は自覚性がなく、一度失った視野や視力を治療によって取り戻すことができないため、眼科検診により早期発見し、その進行を止める早期治療を行うことが求められている。従来の緑内障の診断は、カラー眼底画像や眼底の2次元断面を測定する光干渉断層計(OCT)画像で、視神経乳頭と黄斑の形状に対する読影を行うことにより主観的に判断されていた。一方、機械学習による眼科疾患検出においては、大量の眼底写真から糖尿病網膜症の自動診断システムがアメリカ食品医薬局(FDA)で認可されるなど、世界的に大きな進展がある。しかし、緑内障を対象とするマルチモダリティ画像情報を大量に収集することは難しく、緑内障の詳しい診断はできなかった。
 共同研究グループは、眼底検査装置で視神経乳頭と黄斑を撮影したデータから抽出したマルチモダリティ画像情報に対して、緑内障の自動診断を行う機械学習モデルの構築を試みた。
 〇研究手法と成果
 共同研究グループはまず、確定診断付きの緑内障208眼(MD値:-3.90±3.80dB)と健常149眼(MD値:-0.21±1.15dB)の合計357眼を対象とし、それぞれから視神経乳頭部のカラー眼底写真(RGB画像中のグリーン成分のみ)、3次元OCTデータから得られる視神経乳頭神経線維層の層厚マップとデビエーションマップ、同じく3次元OCTデータから得られる黄斑の神経節細胞複合体層の層厚マップとデビエーションマップの5種類を抽出した。なお、デビエーションマップは、正常眼データベースから算出した層厚マップの平均画像との差分画像のこと。
 次に、公開された訓練済みの畳み込みニューラルネットワーク(CNN)モデルの一種であるVGG19モデルを用いて、上記5種類の画像データセットでそれぞれのVGG19モデルを構築した(転移学習)。CNNには一般的に特徴量抽出部と分類部があり、訓練によって両者ともに自動的に学習される。そして、それらのVGG19モデルの特徴抽出部から緑内障と正常を分類するのに必要な特徴量を抽出した後、ランダムフォレストにより学習させ、緑内障の自動診断を行う機械学習モデルを構築した。
 最後に、構築した機械学習モデルの性能を調べるために、10-分割交差検証法により各種画像の組み合わせを検証した。その結果、最高性能としてAUC=0.963を示す高い診断精度を得ることができた。
 ◆補足説明
 〇眼底検査
 視力は網膜の働きにより得られる。眼底検査とは、眼科計測装置によって、瞳孔を通して網膜を撮影し観察すること。
 〇マルチモダリティ画像情報
 複数の異なる装置で撮影した画像データ。
 〇機械学習
 人間の学習能力と同様に、機械(コンピュータ)に学習能力を持たせる手法。データから機械自身が反復的に解析し、ルールを見つけ出すという特徴がある。
 〇確信度
 機械学習モデルの出力で、各分類結果をスコアリングした数値であり、0から1までの値をとる。値が1に近いほど、機械学習モデルのその分類結果に対して自信を持つことを意味する。
 〇光干渉断層計(OCT)
 光の干渉を用いて、非侵襲的に眼底の2次元断面を測定できる眼科装置。光ビームの2次元走査により、3次元形状の計測ができる。OCTはOptical Coherence Tomographyの略。
 〇視神経乳頭、神経線維層
 視神経乳頭は眼底中心より耳側約15゜の位置にあり、網膜内の全ての視神経繊維が束になり脳へ向かう部位である。神経線維層は、神経節細胞の軸索が集合したもので、その菲薄化は緑内障が疑われる。
 〇黄斑、神経節細胞複合体層
 黄斑は網膜の中心部分であり、色や形を識別する視細胞がたくさん集まっている部位である。神経節細胞複合体層は、網膜の10層構造中、網膜神経線維層、神経節細胞層、内網状層からなり、その菲薄化は緑内障が疑われる。
 〇転移学習
 すでにある領域で構築済のモデルを他の領域で適用させる技術。新しいデータセットを用いて、モデルを再構築する必要がある。
 〇ランダムフォレスト
 決定木を弱分類器として集団学習を行うアルゴリズムであり、説明変数が多い場合によく使われる方法である。
 〇AUC
 受信者動作特性曲線より下の部分の面積をAUCといい、0から1までの値をとるが、値が1に近いほど判別性能が高いことを示す。機械学習モデルの分類性能を評価するのによく使わる指標の一つである。AUCはArea Under the Curveの略。
 〇MD値、dB
 視野測定結果の一つとしてMD値があり、dBという単位で定量的に評価されており、同じ年齢の正常者と比較して、視野の欠け具合を表したものである。正常が0dBでマイナスになるほど、視野が欠けていることを表している。
 〇デビエーションマップ
 OCT装置メーカーにより提供された正常眼データベースから算出した、層厚マップの平均画像との差分画像。
 〇畳み込みニューラルネットワーク(CNN)
 視覚野の機能からヒントを得た、ニューラルネットワークの派生版であり、主に画像分析に利用されている機械学習手法の一つである。従来の機械学習と比べて、自動的に画像から有用な特徴を抽出することが可能な特徴抽出部がある。
 〇VGG19
 コンピュータビジョンの業界において、毎年ImageNetというコンテストが開催され、各チームは訓練済のCNNモデルを公開する。VGG19はSimonyan氏によって提案されたCNN構造である。
 〇10-分割交差検証法
 n-分割交差検証で、nを10に設定したケース。n-分割交差検証では、標本群をn個に分割し、そのうちの一つをテスト群とし、残りのn-1個の群で機械学習モデルを構築する。それぞれのテスト群で検証したn回の結果を平均して、機械学習モデルの評価を行うことが機械学習分野でよく用いられる。

 天気は曇り、黒灰の雲が時々現れ、雨が降りそう・・でも降らなかった、時々晴れ。
 散歩道沿いの畑で、植えられている”ヒマワリ”。高さが3m程に延び、花が咲いている。花は大きくて鮮やかな黄色、明るい空なら良く映える。
 名(ヒマワリ:向日葵、日回り)の由来は、名の如く日(太陽)を追うようにその方向に花が回るから。花言葉は、私の目はあなただけを見つめる・あこがれ・にせ金貨・・など。別名も日(太陽)を追う花から、”ひぐるま(日車)””にちりんそう(日輪草)”。
 米カリフォルニア大の研究チームの実験によると、「成長途中のヒマワリは、昼は太陽光を受けて東から西へ首を振り、夜は体内時計の働きで元に戻る。成長し終えて開花期になると、障害物がない開けた場所では首が東を向いたままになる。」(2016年8月5日付の米科学誌サイエンスに発表)
 ヒマワリ(向日葵、日回り)
 別名:日輪草(にちりんそう)、日車(ひぐるま)、天竺葵(てんじくあおい)
 英名:Sunflower(太陽の花)
 キク科ヒマワリ属
 一年草
 北米原産、16世紀に英国に伝わり、日本には17世紀に伝わる
 開花時期は7月~9月
 花はキク科の特徴である頭状花序(多数の花の集合)
 種子は食用になる。種子からの油は石鹸や塗料の原料となる
 余談:ヒマワリの種はX-Filesに出てくる食べ物
   主人公(モルダー)がこの種が好物で良く食べている・・ハムスター並!!