全体概要
本セミナー「人間の思考、機械の思考」は、「機械は人間のように考えることが可能か?」という根本的な問いを軸に、IT技術者が知るべき「知能研究」の全体像を俯瞰する講義です [p.4]。
この問いに対して講師・丸山不二夫は、現状では「人間のように考える」機械は存在しないと認めつつも、「部分的に知的な振る舞いを行う機械」はすでに実現しており、近い将来のITシーンを根本から変えると主張します [p.4]。講義の視座は、コンピュータサイエンスの枠に閉じず、生物学・脳科学・言語学・認知科学・大規模分散システムまで広がります [p.5]。
技術史的な位置づけとして本講義が強調するのは、二つの大きな断絶です。一つは生物の進化と機械の発明のアプローチの違いであり、鳥の真似をして空を飛べなかった人間が飛行機を発明したように、「知能」においても生物と機械は異なる経路を辿る可能性があるという洞察です [p.32, p.33]。もう一つは、2010年前後を境とする大規模データ処理の「第一世代(バッチ処理・量的蓄積)」から「第二世代(リアルタイム処理・グラフ構造・質的知識)」への転換であり、Google Knowledge Graph、Facebook Graph Search、Microsoft Satoriという三大プラットフォームの競争がこの転換を象徴しています [p.159, p.160]。
探求の核心にあるのは「データの力」と「アルゴリズムの限界」の緊張関係です。Andrew Ngの「勝つのは最良のアルゴリズムを持つ者ではなく、最も多くのデータを持つ者だ」という言葉 [p.2] が示すように、統計的・データ駆動的アプローチが機械学習・翻訳・検索を席巻しています。しかし一方で、人間の言語能力を有限の経験から無限の文生成能力として捉えるChomsky的合理論 [p.125] との対立が根底に流れており、「データで言語は解けるか」という問いは未解決のまま講義全体を貫いています。そして、ニューラルネットワーク・Deep Learningの台頭、脳研究プロジェクト群、知識グラフ技術、IBM Watsonの質問応答システムへの展開を経て、「ネットの知性」とも呼ぶべきものが萌芽しつつあるという展望で講義は締めくくられます [p.5, p.164]。
—
講義のロードマップ
ここでは、セミナーの講演資料がどのようなパートから構成されているかを示します。また、それぞれのパートのポイントを紹介します。
■ Part 1: 「賢い」機械たちの登場
現在すでに実用化されている「部分的に賢い」機械の事例を具体的に示すことで、抽象的な「知能論」を地に足のついた問題として提示します。インターフェースの進化(キーボード→タッチ→音声)が、知能を持つ機械との対話の中心になるという未来像も描かれます [p.26]。
■ Part 2: 生物と人間と機械の進化
知能を論じる前提として、生物・人間・機械それぞれが「問題解決」においていかに異なるアプローチを取るかを整理します。進化が作り上げた生物の知能(感覚・知覚・運動・コミュニケーション)と、人間が発明した機械の知能は、根本的に異なる可能性が高いとされます [p.32, p.33]。
■ Part 3: 人間の脳へのアプローチ
機械知能の理想モデルとしての人間の脳を研究する国際的プロジェクト群を俯瞰します。ニューロンとシナプスという生物学的基盤の圧倒的な複雑さを確認しつつ、ボトムアップ(ニューロンのシミュレーション)とトップダウン(認知科学的リバースエンジニアリング)の対立という脳研究の根本的な方法論的緊張が示されます [p.76]。
■ Part 4: ニューラル・ネットワークのアプローチ
脳全体のシミュレーションではなく、神経回路網をモデルとしたNeural Network(NN)とDeep Learningが、視覚・聴覚分野でほぼ独壇場の成果を上げています。特にAndrew NgとGoogleの協働による大規模教師なし学習実験が、ラベルなし画像から「人間の顔」を自発的に検出するという驚異的な結果を示した点が中心的なブレイクスルーです [p.102, p.103, p.106]。
■ Part 5: 言語能力へのアプローチ
言語能力へのアプローチをめぐり、「合理論(生得的普遍文法)」対「経験論(データの力)」という根本的な対立軸が鮮明に描かれます。Chomskyの生成文法、遺伝子FOXP2の発見、Googleの統計的機械翻訳、Deep Learningによる文生成が並置され、「言語の本質はデータで解けるか」という問いが未解決のまま提示されます [p.153]。
■ Part 6: 大規模システムと検索の変化
2000年代の「バッチ処理・量的蓄積」から2010年代の「リアルタイム処理・グラフ構造・知識検索」への転換を軸に、Google・Facebook・Microsoftの三社が「文字列検索」から「知識グラフ探索」へと競争の舞台を移した経緯を整理します。検索における「リンクを返す」から「答えを返す」への質的転換が核心です [p.159, p.160, p.161]。
■ Part 7: 機械とネットワークに「知識」を持たせる試み
Google Knowledge Graph(Freebase)、Semantic Web/HTML5 Microdata、Facebook Open Graph、Google Now、IBM Watsonという具体的な実装技術を通じて、機械が「知識」を獲得・表現・推論する仕組みの現状と限界を示します。いずれも極めてプリミティブな段階であり、言語能力自体の理解こそが次の飛躍に不可欠であるという結論で締めくくられます [p.196, p.210]。