2022年01月22日( 土 )
by データ・マックス

目的の実現に最良の方法をAIが教えてくれる!(前)

東京大学大学院 工学系研究科 准教授 松尾 豊 氏

 「人工知能」(AI/Artificial Intelligence)という言葉は、少し前までは研究者のみが使う専門用語だった。しかし、最近は一般人の喫茶店の会話にも頻繁に登場する。今、第3次AIブームが起こっている。AIは私たちの暮らしや社会の利便性を飛躍的に高め、産業各界のビジネス・モデルに計り知れないインパクトをもたらすと言われる。しかし、その一方で、「自ら学んで進化するAI」の危険性に警鐘を鳴らす有識者も多い。AIと人間が共存するリアルな未来とは、どのようなものなのか――。日本を代表する新進気鋭のAI研究者、東京大学大学院工学系研究科 松尾豊准教授に聞いた。

AI研究が担うフロンティア的な役割

 ――まずは、先生とAIとのご縁について教えていただけますか。
 松尾 世の中には、数学、物理学、経済学など、さまざまな学問があり、それぞれに法則が存在しています。そのような法則を通じて人間は世界を見ているわけですが、本当にその法則が正しいと言えるのだろうかと思うことがあります。たまたま、人間にとって認知しやすいから、理解しやすいから、そういう法則だけが見えているのではないのか。実は、もっと精度の高い法則が世の中には存在しているのではないのか―などと、ずっと考えてきています。
 そうなると、この人間の知能を生み出している「脳の仕組みはどうなっているのだろうか?」を解明してみたいと思うようになりました。このことが私のAI研究の原点になっています。現在のAI研究者のなかには、私と同じような思いで、この道に入られた方もかなりいると思います。

 ――これまでのAI研究は、どのような道を歩んできたのでしょうか。

東京大学大学院 工学系研究科 准教授 松尾 豊 氏<

東京大学大学院 工学系研究科 准教授 松尾 豊 氏

 松尾 現在までに、人間のような知能、いわゆる「人工知能」(AI)をコンピュータで作成することに成功した人は、1人もいません。その取り組み過程で、副産物としての技術をたくさん生み出しており、たとえば「かな・漢字変換」(読み方を入力すると漢字に変換される)も今では当たり前のように使われていますが、人工知能と呼ばれたこともありました。しかし、技術が確立、広く普及すると、神秘性がなくなり、誰も人工知能と呼ばなくなりました。
 歴史的に考えると、AI研究は知能に関する研究が進んでいくなかで、常にフロンティア的な役割を担っています。そして、世の中の期待が過剰に高まれば“ブーム”と呼ばれ、ブームが去った直後には“冬の時代”を迎えるということを繰り返してきています。しかし、AI研究者は常に、「人間の知能のようなものをコンピュータで実現したい」という気持ちで研究をし続けてきていることに変化はありません。

 ――フロンティアとは良い言葉ですね。今は、「第3次AIブーム」と言われております。そのなかで、日本の立ち位置はどのようになっていますか。
 松尾 第3次AIブームで注目されているのは、人間の脳を構成する神経回路網を再現した「ニューラルネット」の1種である「ディープラーニング」という新しい技術です。
 この研究については、アメリカ、カナダ、フランス、中国などが先行、日本は先頭集団を追いかけるチームの1つになっています。ただし、このAI研究については、日本はかなり高いポテンシャルを持っています。早く態勢を整えることができれば、先頭集団に追いつくことができると思っています。
 「人工知能」(AI)という言葉は1956年のダートマス会議で提唱され、それから約60年にわたり研究されてきています。日本では第1次AIブーム(1960年~)、第2次AIブーム(80~)があり、この第2次AIブームのときに、通産省(現・経済産業省)主導で、「第5世代コンピュータ」プロジェクト(79~92年)が立ち上がりました。約10年間で570億円の投資が行われ、全国から研究者が数十人規模で、このプロジェクトに集合しました。終了後も、このときにできた日本のAI研究のコミュニティは、強く、大きく育ってきています。
 今回の第3次AIブーム「ディープラーニング」技術の研究とこのコミュニティとの連携が上手くいけば、すごく大きな成果が期待できると考えています。

AI研究における50年来のブレイクスルー

 ――それは期待できますね。そもそも「機械学習」、そして「ディープラーニング」とはどのようなものでしょうか。できるだけ易しく教えていただけますか。
 松尾 「機械学習」とは、人間が自然に行っている学習能力と同様の機能をコンピュータで実現しようとする仕組みのことを言います。この言葉自体はとくに新しいものではなく、60年あたりからAIの分野の1つとして研究が始まっています。「ディープラーニング」はこの機械学習の1種です。
 では、「ディープラーニング」の技術はなぜ、第3次AIブームと騒がれるのでしょうか。その解明の鍵は「特徴量」という言葉にあります。特徴量とは、問題の解決に必要な変数のことを言います。良い特徴量が発見できれば、問題の効果的な解決につながり、パターン認識の向上やフレーム問題の解決につながると期待されております。
 これまでの機械学習では、この特徴量は、データ・サイエンティストなど各領域の専門家である人間が抽出、コンピュータに指定していました。つまり、人間の専門家による特徴量の抽出の良し悪しで、機械学習の精度が大きく左右されていたのです。現代社会には、複雑で大規模な問題が満ち溢れています。これを人間の手に任せていたのでは、膨大な時間がかかりますし、間違った変数を選んでしまう危険性も十分にあります。ところが、ディープラーニングでは、この特徴量と呼ばれる重要な変数の抽出を、コンピュータ自身が行うことができるようになりました。私はこのことを「AI研究における50年来のブレイクスルー」と呼んでいます。

 いくつか簡単な例を挙げてみましょう。農作業の現場でみかん等果物の大きさ(大・小)を仕分ける作業があります。これは、人間にとっては単純作業ですが、今までは、AI(機械など)にはできませんでした。では、なぜAIにはできなかったのでしょうか。
 コンピュータはみかんを画像で認識します。そこで、人間の専門家はみかんの大きさを判断する特徴量として、たとえば、みかんの(1)「横の長さ」と(2)「縦の長さ」などを抽出し、コンピュータに指定します。ところが、実はそんな単純なものでは正しく仕分けができないのです。みかんはベルトコンベアー上で、さまざまな転がり方をして流れてきます。人間の場合は、どんな転がり方をしても、大・小を一瞬で判断できます。しかし、コンピュータの場合は、すべての判断は特徴量に基づいて行われます。横に転がると小さく見え、縦に転がると大きく見えてしまう場合もあり、判断を誤ってしまうのです。つまり、コンピュータは、みかんの画像のどこに注目したらいいかがわからないのです。

 もう1つ例を挙げてみます。ある犬がシベリアンハスキー犬であるのかどうかを見分ける命題があったとします。そのとき、人間の専門家は特徴量として(1)「顔の大きさ(X)」、(2)「体の色(Y)」、(3)「目の間の距離(Z)」などを抽出し、Xが2以上でYが3以下でZが4以上であればシベリアンハスキー犬であると指定します。しかし、それらの特徴量だけでは、正解に到達することはできません。私たち人間は、その他に目の周りの彫りの深さ、耳の尖り具合、全体的な感じを考慮して、シベリアンハスキー犬であると判断しているからです。

 現在、「ディープラーニング」技術の発達によって、コンピュータはこの画像認識、たとえば「チューリップなのか、チューリップに似たゆりの花なのか?」「土佐犬なのか、土佐犬に似た秋田犬なのか?」を人間よりも正確に判断できるようになっています。
 最近『将棋電王戦』で将棋ソフト(コンピュータ)がプロ棋士を負かし、大きな話題となりました。その背景は、この延長線上にあります。将棋の駒は40枚ですが、将棋ソフトの盤面の状況を表す変数である特徴量は、「各駒の価値」「位置関係」「駒の効き具合」など全体で数千、数万、ときには数億に上ります。人間にはこれだけ膨大な特徴量を扱うことはできません。将棋ソフト自身が機械学習によって学び、自分でその特徴量をつくっていくことができるようになっています。

(つづく)
【金木 亮憲】

<プロフィール>
matuo_pr松尾 豊(まつお・ゆたか)
1997年、東京大学工学部電子情報工学科卒業。2002年、同大学院博士課程修了。博士(工学)。同年より産業技術総合研究所研究員。05年10月よりスタンフォード大学客員研究員。07年10月より東京大学大学院工学系研究科総合研究機構/知の構造化センター/技術経営戦略学専攻准教授。シンガポール国立大学客員准教授、(株)経営共創基盤(IGPI)顧問。02年人工知能学会論文賞、07年情報処理学会長尾真記念特別賞受賞。人工知能学会編集委員長、第1回ウェブ学会シンポジウム代表。専門はWebマイニング、人工知能、ビッグデータ分析。著書として『人工知能は人間を超えるか』、共著として『人工知能って、そんなことまでできるんですか?』など。

 
(後)

関連キーワード

関連記事