人間の思考、機械の思考 — IT技術者のための機械による知能研究入門

2014年9月26日 2026年3月11日 MaruyamaFujio

はじめに

「機械は人間のように考えることは可能か？」という問題を考えてみよう。そうした能力をもつと皆が認める機械は、現状では存在しないので、こうした問いかけに、ただちに肯定的に答えることは出来ない。
1
ただ、問題を、「機械は部分的には人間のような知的な振る舞いを行うことは可能か？」に大幅にゆるめると、我々は ”Yes!”と答えることが出来る。

そこでは、現代のIT技術の進歩が大きな役割を果たしている。そうした「賢い機械」の出現が、近い未来のITの利用シーンを大きく変えることは確実である。IT技術者が、「人間の思考、機械の思考」に関心をもつ必要性は、ますます大きくなると思う。

小論の前半では、「知能研究」への、いくつかのアプローチを紹介した。「人間の思考、機械の思考」の問題は、IT技術・コンピュータサイエンスに閉じている訳ではない。様々の領域から、多様なアプローチが行われている。

小論の後半では、ITの領域にフォーカスして、現代の大規模分散システムと、それが検索と広告を通じてグローバルに張り巡らしたネットワークが、「知識」を扱い始めようとしていることに注目した。いわば、「ネットの知性」とも言うべきものが生まれ始めているのかもしれない。

動物（人間を含む）の知覚・運動能力について、機械でそれを実現することは、十分に可能だろう。人間の言語能力の解明が、我々人間にとっても、機械にとっても、今後の大きな課題となろう。

「賢い」機械たちの登場

生物と人間と機械の進化

進化が作り上げた生物と人間が発明した機械とでは、問題解決のスタイルに大きな違いがある。空を飛ぶという同じ目標に、生物の進化による飛行能力の獲得と人間による飛行機の発明は、違うアプローチをとった。

人間が、鳥の真似をして空を飛ぼうという試みは、うまく行かなかった。飛行機という機械を発明して、人間は初めて空を自由に飛べるようになった。

「知能」へのアプローチも、生物と機械とでは異なる可能性は高い。ただ、こうした問題に決着がついている訳ではない。

生物の知能

人間だけが「知能」を持つ訳ではない。多くの生き物が、感覚・知覚・記憶・認知の能力を持っている。
人間の思考能力もこれらの感覚・知覚・記憶・認知の能力の土台の上に構築されている。

多くの生き物は、こうした感覚・知覚の能力を運動能力と結び付けている。脳や神経は、「考える」より前に、まず、そうした能力の担い手として進化してきた。そして、多くの動物は、考えることを始める。
また、少なくない生き物が、コミュニケーション能力を持っている。

視覚の誕生と発展

生物の最も高度な知覚の器官は「眼」である。視覚は、今から５億年以上前のカンブリア紀に大きな進化を遂げたという。
捕食者として当時の生態系の頂点に立ったアノマカリスは立派な眼を持っていた。視覚に生物学的な（視覚神経的な）共通の基礎があるのは当然のことだと思う。
機械学習の最も基本的なモデルは視覚だといっていいと思う。

人間の知能の発展機械の誕生と進化

人間の知能を飛躍的に発展させたのは、30万年前に獲得した言語能力だった。それをを土台として、三千年前に文字を、15世紀半ばには印刷技術を発明し、20世紀初頭から、様々のメディアを発達させた。

機械が一般に普及するのは、18世紀の産業革命以後だが、機械の新たな進化が加速したのは、この数十年のあいだである。コンピュータとネットワークは、機械のあり方を一新した

人間の脳へのアプローチ

「知能」については、人間の脳は、いまだ機械の知能の理想とすべきモデルである。脳研究は、「人間の思考、機械の思考」研究の中心分野である。

脳研究をめぐる「対立」の構図

発端は、来年度のプロジェクトの予算配分で、認知科学的なアプローチの予算が、ばっさりと切られたことにあるらしい。それに反発した研究者のグループが、150名の連名で、欧州委員会に公開質問状を提出した。

対立の根底にあるのは、脳研究でのアプローチの違い。Henry Markramら主流派は、ニューロンとシナプスの数学的モデルに基づいて脳全体のモデルをボトムアップに作り上げようというアプローチ。一方、反対派は、脳研究には、認知科学の知見に基づいたトップダウンのリバース・エンジニア的なアプローチが必要だという。

「鳥の羽の全てをシミュレーションしたとしても、鳥が空を飛べることを解明出来ないのと同じことだ」

ニューラル・ネットワークのアプローチ

脳全体のモデルではなく、神経回路網をモデルとしたNeural Network(NN)をコンピュータ上に構成し、機械に学習能力を与えようという試み。

現在、活発に研究が行われており、大きな成果が上がっている。視覚・聴覚の分野では、ほぼ独壇場といっていい。

Googleの猫

我々は、ラベル付けされていないデータだけから、高レベルの、クラスに固有の特徴を検出することが出来るかという問題を考察した。例えば、ラベル付けされていないイメージだけから、顔の検出が可能かという問題である。

この問題に答える為に、我々は、９層からなるローカルに疎に結合した、プーリングとローカルなコントラストの正規化の機能を備えた自動エンコーダを、大規模な画像データセット（モデルは10億のコネクションを持ち、データセットは、インターネットからダウンロードした200×200ピクセルの一千万個のイメージからなる）上で訓練した。

我々は、このネットワークを、1000台のマシン（16,000コア）のクラスター上で、並行計算モデルと非同期SGDを使って、三日間訓練した。

広く受け入れられているように見える直観に反して、我々の実験結果は、顔であるかそうでないかのラベルをイメージにつける必要なしに、顔の検出が可能であることを明らかにした。

コントロールの実験では、この特徴の検出は、変換だけでなく、拡大や画面外への回転に対しても、頑健であることを示した。

言語能力へのアプローチ

Chomskyの観察Cartesian Linguistic

言語能力は、デカルトのいうように、人間という類を、人間以外の動物と区別するものである。
人間の言語能力の最大の特徴は、その創造性。いままで聞いたこともしゃべったことも無い、まったく新しい文章を、理解し発話出来る。
有限個の単語から無限の文を生成出来る。
言語の獲得には、可能な文型を全てカバーする大量のデータが必要な訳ではない。
人間には、全ての人間に共通の生物学的基礎を持つ、「普遍文法」と「言語獲得装置」とも言うべきものが、生まれつき備わっている。

言語能力に関係する遺伝子　FOXP2

Simon E. Fisherらによって発見された人間の言語能力に関係する遺伝子FOXP2 は、は虫類にも鳥類にも存在する。面白いことに、FOXP2は鳥のさえずりやコウモリの音響定位の能力とも関係しているらしい。

ゴリラやチンパンジーと人間のFOXP2はアミノ酸配列で2カ所違っているだけ。（ネズミとは3カ所違う）　この変化は、約30万年前におきたという。ネアンデルタール人のFOXP2は僕らと同じだと言う。

マックス・プランク研究所 ”Language and Genetics”

より根本的なレベルで、発話と言語は、人間である条件の諸特徴、我々人類という種の中心的な諸相を定義している。
ただ、我々は、遺伝子が言語に対応出来る脳をいかにして構成出来るのかについては、いまだ、ほとんど何も知っていない。また、我々に最も近い親類たちでさえも、この領域では、人間の能力にかなうことが、全く出来ないように見えるのは何故かについても、ほとんど何も知らない。

Power of DataGoogleの言語へのアプローチ

これまでの知見：計算パワーが増大するにつれて、以前には実際には計算することができなかった問題が解けるようになる。

新しい知見：データの量が増大するにつれて、以前には解けなかった問題が解けるようになる！

それは単に、より堅実な解法を得るというだけの問題ではない
少数のデータで考えると失敗するように見える方法が、巨大な量のデータのもとでは、うまくいくことがある。

Google?

「スペル訂正」でのGoogleのアプローチは、正しいと思う。データがパワーだという新しい認識も、その限りでは正しいものだ。
ただ、「統計的機械翻訳」のアプローチは、正しくないと思う。現実にも、Googleは、それだけで機械翻訳を実装してはいないだろう。
人間が、言語を習得する過程も、こうしたモデルには合致していない。我々は、Google的感覚からすると、少数の文を経験するだけで、正しい意味のある文を無限に生成する能力を獲得する。もっとも、機械と人間が、同じアルゴリズムに従う必要はないのだが。

Deep Learningによる言語学習モデル

人間の知覚が、単一の学習アルゴリズムで説明出来るという仮説は正しいように見える。もっと強い主張は、言語の習得を含めて、全ての学習アルゴリズムが同型であるという主張である。

大規模システムと検索の変化

機械とネットワークに「知識」を持たせる試み

資料種別: マルレク

テーマ: ディープ・ラーニング、人工知能