「深層学習」（ディープラーニング）とは何か！（前）

2015年11月26日 10:26

ツイート

（株）Preferred Networks　リサーチャー松元　叡一氏

　第3次AI（人工知能）ブームを牽引しているのが、「深層学習」（ディープラーニング）と言われる最先端技術である。あらゆる社会現象、経済現象の問題解決、さらにまたロボット技術などへの取り組みについても、大きな期待がされている。しかし、この「深層学習」について、一般向けに書かれた本はほとんどない。果たして、それはどんな技術なのか―。最近、ロボット自動運転の実用化につながる「分散深層強化学習」の技術デモをネット上で公開し、注目を集めた（株）Preferred Networksの若き研究者、松元叡一氏に聞いた。なお、同社取締役最高戦略責任者（CSO）の長谷川順一氏にも同席していただき、進行および解説を助けていただいた。

今、急増する「深層学習」の研究開発者
　――まずは、松元さんとAIとの関係について教えていただけますか。高校、大学時代は、国際情報オリンピックや国際的なプログラミングコンテストなどで、メダル獲得や優勝など、華々しい活躍をされていますね。

（株）Preferred Networks　リサーチャー松元　叡一氏

　松元　僕は高校時代から、人工知能、さらには生物の持っている知能にずっと興味を抱いてきています。大学の学部時代は物理学を専攻しました。最近の物理学は、いろいろなシミュレーションを行うことによって結果を出していく傾向にあります。流体力学のシミュレーションなど、AIとは少し距離はありますが、計算機を使って大規模計算をしますし、実験データを解析するときなどは、「機械学習」（「深層学習」は「機械学習」の1種）も必要になるので、いわゆるAIがらみのことは継続してやっていたことになります。
　大学院は、同じ物理系ですが、生物寄りの研究室に入りました。その理由は、その頃になると、すごく人間、生物の脳の仕組みが知りたくなっていたのです。そこで、脳科学と物理学の中間ぐらいの研究ができるところを探しました。研究室には、生命の研究をしている方、脳の研究をしている方などさまざまでした。私の修士論文では、「深層・再帰的ニューラルネットによる時系列高次構造抽出」をテーマとし、「深層学習」における新しいアルゴリズム（コンピュータの計算式）を研究していました。

　――「深層学習」（ディープラーニング）の研究開発者は世界でもとても少なく、ある本には2014年現在で、世界で約50人と出ていました。そんなに少ないのですか。

　長谷川　少ないことは事実だと思いますが、50人と言う数字がどのレベルの研究者までを言うのか、その根拠はよくわかりません。「深層学習」は「機械学習」の1種で、2006年に（株）Preferred Infrastructureを立ち上げたときから現在に至るまで、継続して「機械学習」の研究開発を行っています。当時は、「ビッグデータ」「深層学習」という言葉はなく、「機械学習」という言葉すら知られていませんでした。
　今、日本でも、USでも、“いわゆる”「深層学習」の研究開発者は急増しています。OSS（Open Source Software）として、“Caffe”というソフトウェアも提供されています。これは「深層学習」の手法を実装し、画像認識系の用途で便利に使えるものです。このようなOSSを使って、ベンチャーを立ち上げる方も増えています。ただし、本当に基礎から研究開発ができる「深層学習」の研究開発者は、それほど多くないかもしれません。
人間が行う学習能力をロボットや計算機で実現
　――それでは、この辺で本題に入りたいと思います。本日は、専門家でない読者にできるだけ易しく、「機械学習」や「深層学習」について教えていただけますか。

　松元　わかりました。それでは、「機械学習」からご説明します。機械学習とは、人間が行っている学習能力を計算機やロボットにおいて実現するための技術、手法、研究分野です。人間がルールを明示的に与えるのではなく、データから機械自身に法則を学習させるところが特徴です。ルールで記述しきれない複雑な現象や、季節や時間などで傾向が変わる現象の解析に強みを発揮すると言われています。
　1つ、例を挙げてみましょう。ある国の健康診断で、身長150㎝、体重40㎏の人が女性、身長160㎝、体重50㎏の人が男性、身長180㎝、体重70㎏の人が男性、身長170㎝、体重45㎏の人が女性…というデータが取れたとします。それらを機械が学習し、「では、身長170㎝、体重68㎏の人がいます。この人は男性ですか、女性ですか？」と、機械に判断させるのです。人間であれば、何となくデータを眺めていれば、「この人は男性に違いない」とわかります。しかし、機械はそうはいきません。あくまでも、論理的に解明していかなければなりません。
　次に、これを図で描いてみます。縦軸（Y）を体重、横軸（X）を身長とし、男性を黒丸、女性を白丸にして描き、その分布状態を見ます。今、僕が斜めに入れた線は、y＝ax＋b（直線の方程式）で表すことができます。もちろん、最初は正しく引けません。しかし、データが増えれば増えるほど、機械はより正しい線を引くことができるようになります。この線が正しく引ければ（aとbの数字がわかれば）、次にどんなデータがきても即座に正しい判断ができます。試行錯誤を繰り返しながら、限りなく正解に近づいていくわけです。
　では「機械学習」以前の状態はどうだったのでしょうか。それは、簡単に言えば、身長が170㎝以上で体重が80㎏以上の人は男性、身長が150㎝以下で体重が45㎏以下の人は女性…と、1つひとつ機械にルールとして教えていたのです。つまり、人間が無意識にやっていたことを、人間が意識的に考え、ルールとして機械に教えていたのです。
　そのことを考えると、機械自身が自分で学習し、正しい解に近い線を引けるということがどれだけすごいことかが、おわかりいただけると思います。
　長谷川　もう1つ、易しい例を私から提供しましょう。たとえば、人間100人が「4」と「9」の数字を書いたとします。人はそれぞれ、書き方に癖がありますので、全員が同じ「4」と「9」を書くことはありません。そこで、機械にさまざまな「4」と「9」を学習させます。そうすると、次には、どんな癖のある「4」や「9」であっても、機械がルールを獲得し、判別できるようになるのです。
（つづく）
【金木　亮憲】

＜プロフィール＞
松元　叡一（まつもと・えいいち）
筑波大学附属駒場高等学校、東京大学理学部物理学科卒業、2015年3月に東京大学大学院総合文化研究科修士課程卒業後、同年4月（株）Preferred Networksに入社。受賞歴として、（１）07年、国際情報オリンピック（クロアチア大会）日本代表銅メダル、（２）08年、国際情報オリンピック（エジプト大会）日本代表銅メダル、（３）08年、国際物理オリンピック（ベトナム大会）日本代表銀メダル、（４）11年、ACM国際大学対抗プログラミングコンテスト（ICPC）東大代表として国際大会（アメリカ）出場、アジア大会（フィリピン）優勝、（５）12年、iGEM（The International Genetically Engineered Machine competition）ソフトウェア部門でリーダーを務める。アジア予選金賞、国際大会本選で特別賞受賞など。