人工知能の実現について考えてみる

人工知能に対する憧れは日本人とそれ以外ではだいぶ異なる。
以前より「人工知能により仕事が奪われる。故に人工知能は悪いやつ」みたいな主張に対して激しく疑問を感じていたが、それらを非常にわかりやすくまとめてくださる記事を見つけた。
https://www.businessinsider.jp/post-827
ここで一回原点に戻って、どのようにしたら自分たちの理想とする人工知能が実現するのかを考察してみる

理想の人工知能とは
私たちは社会性を持つ生命体である。この表現は非常に面白い、なぜならば生物は社会性がない状態がある意味デフォルトということを示しているからである。当然人間にも反社会的な側面はあり、歴史的に強大な力を持つ人たちが奴隷を従えていたというのはそれ自体は不自然なことではない。大多数の民衆より、その一部の人たちの方がまだ強かったということでしかないのである。それがいいか悪いかは置いておいて、人間にそういった欲求があることを否定してもどうしようもない。これらを踏まえた上で、私たちはなぜ人工知能に対して魅力を感じるのであろうか。
対人関係に踏み込んでも同じことが言える。人のコミュニケーションはもともと上手くいく保証がない。それぞれが別の意思を持っており、そしてそれらはコンフリクトすることの方が多いというのならば成り立つ方が特異な例ともみなせる。このような環境で生きて生きた私たちにとって人工知能という「私たちが作り出す人間のようなもの」という概念を提示された時に何を思うであろうか。作り出すということは恣意的な形にすることができ、ものということが所有感を感じさせる。そして人間というフレーズが、自分の社会性の利己的な面を刺激するのである。ようは、理想の人間を自分のものにすることができるのではないだろうかと考え出すのである。人間関係で普段からストレスを抱えてそうな日本人に大変受け入れられそうな存在であることは否定しきれない。
そのような存在が望まれること自体は受け入れられざるを得ない。これが本当に世に出て行くべきかというのは議論があるが、欲がある限り世界中で開発は続けられるし、止めることは実際上可能なのかどうかは検討しなくてはならない。これの開発を止めろと主張するよりかは、世にでるのはしょうがないとしてどのように対処していくか、あるいはこれの開発を促進している根本となる社会問題の解決に目を向ける方が本質であるような気がする。

人工知能と人間の違い
今の人工知能とは、主に深層学習、機械学習などの枠組みの中で「学習」という行為を通して、設計者がその行動を入力しなくてもデータからそれらしい行動を習得してくれる手法を表す。ここで重要なのは行動はデータに依存するということ、習得するのは行動だけであるということである。データは人間でいうところの記憶にあたるわけであり、人間に置き換えると少し不自然である。人に同様の過去の行動があれば良いが初めて遭遇するような事象にはどのように対処すれば良いのだろうか。確かに人間も初めてあった事象に対しては、過去に起こった事象に当てはめようとする心理的側面がある。しかし人間は工夫や推論という手法を当たり前のように行使できてもいる。工夫を想像上の中で一度シュミレーションを行い別の手法を見つけ出す行為と考えれば、それは今までの記憶を踏まえた上である種ランダムに手法を模索する行為である。今の人工知能のように「やってみたけどなんか失敗した」「やってみるとなんか成功した」という枠組みは間違っていないのかもしれないが、「人の会話のデータ群から、人間らしい応答をするシステムを構築する」みたいな開発では人の包括的な記憶を再現できないし、機械による工夫が顕現することは難しいのではないだろうか。
実は人工知能は推論を行うのは過去にはあったことである。今のニューラルネットが着目されるより前、知識工学という学問ではif-thenルールの塊により知的なアルゴリズムを構築していた。三段論法を用いているため例えば
一般的知識「暑いと水分がなくなる」「人間から水分がなくなると好ましくない」
観測された知識「今は暑い」「あなたは人間である」
から「今あなたは水分を取るべきである」という結論が導けたとする。ここでなぜですかと問いかけると使った前提知識のうち、どれか一つを言えばいいことになる。例えば「人間から水分がなくなると好ましくないから」と答えたあげたら良い。それで相手が納得しないようだったら別の知識を言っていけば良い(相手がどの程度の知識を持っているかは判断が難しいため)
しかし昨今着目を浴びている学習の枠組みは「この時は、こうである」というデータの集合であり、そうである理由というものが一切入力されない。それらのデータ群の推移的関係性を見ることもないため、「理由を説明しろ」と今の人工知能に要求する行為はあまり適切ではないだろう。
なら知識工学ベースでAIを再構築すれば良いではないかという意見が出てくる。しかしこれには大きな欠点があり、データをいちいち入力しなければならないこと、曖昧な表現を扱えないことである。上の例だと「水分」が「水」になったところで意味としては通じるが、機械はこれを別のものとして捉えてしまい「私は水を飲んだ方がよろしいですか」と聞いたらわからないと答える可能性がある。これは「水分」に関わるデータと「水」に関わるデータを統計とって、ほぼ一致していたら同じカテゴリにくくるという工夫が必要である。このような流れがあり人の手間を省力化した学習アルゴリズムが着目を浴びたのである。
上の方で「AIの行動はデータに依存する」と書いた。これは暗にAIそのものは目的を持っていないということを示しており、とある目的を持った設計者がその目的に合致したデータを集めてくるから今のAIは機能しているのである。機械学習でよく使わられる「上手く言ったら褒美をあげて、失敗したら罰を与える」という過程を人間が指示しているようでは、人間の助力なしに独立して考えることは無理であろう。人間の場合はどうなのだろうか。人間には基本的な欲求があり、それを叶えるために自分の持つ力を行使している。誰が指示しなくても物を食べるし、眠れる環境と睡眠不足がやってくれば寝るのである。これらは人間の身体性に起因した欲求であるが、人類のレベルで見れば「種の存続のため」に様々な欲求が生まれている。遺伝子の多様性と組織の維持のために社会性、性欲、向上心などがある。つまり機械にも自分の根幹となる欲求が必要で、それは自己の維持を最終目的とするべきであるということである。そうしなければ自然と淘汰されていくシステムとなるだろう。

今のAIには体がない
人類の欲求には身体性に起因するものがあるという話をした。上のURLの安宅氏も述べているが、「ものを食べる」ことがもとよりできない人に味の話をしたり食べ物の意義を聞いたりすることは本質的でない。知識として蓄えていれば応答はできるだろうが、その理由を理解したとはみなせない。人にも何かのものを伝える時「教えるより使った方が早い」というのはよく言われることである。
そもそも人間の体を電子部品の集合体で構成することは可能なのだろうか。人間の皮膚には細胞レベルの大きさの無数のセンサがあり、味覚も非常に多様である。センサの発達を待つより、人造人間の方がよほど現実的ではないだろうか。人間のレベルの多様なセンサがないと、人間らしい価値判断を持つ知能を作れないというのは議論の分かれるところである。
私はどちらかといえば人間そっくりそのままのシステムの実現を目指すより、人間が望むシステムを構築することの方が本質であると考えている。これを作ろうとしているのは人であり、その人を後ろから応援している人も人間である。彼らは皆自分の欲求に基づいて行動している。世界中の人々が主張していることと、本当に求めていることは時として一致しないというのはよく心がけておくべきだと思う。このような価値観から開発をするとなると、「人が喜ぶ」という目標を持つシステムを設計者は構築する必要があるだろう。こうなった時、知能を実現したいというアプローチは根本から崩壊することになる。
本当の知能を目指すべきかどうかはまだ結論のでないことであるがそれを一旦無視して、知性を生みだすために身体性の違いをどうカバーしていくのかという話をする。上で述べたように現状は人間レベルの身体を構築することは難しい。ともすれば「人間とは根本的に異なる知能」を目指せば良いだけである。人間には体があり、酸素の存在する世界がある。これとは別に今の人工知能に適した形の世界を構築し、その世界で生命の発展と淘汰を繰り返して知能を構成してくのが一番の近道ではないだろうか。今の電子媒体上で存在するAIはコンピュータとインターネットを主な世界としている。ようは電脳コイルというアニメで出てくるような電子空間の生命体を目指すことになるであろう。そういう意味ではコンピュータウイルスは原始的な電子生命体である。彼らは自己の繁殖に余念がない。しかし高度な生命体が存在し得るくらい、電子空間は複雑でない。理論整然とされた規約やアルゴリズム、セキュリティによって空間は制限されより単純な生命体が生きるのに適した環境となっている。高度な知能をここに実現しようとする場合は電子空間により乱数や煩雑さを加えていく必要があるだろう。

人工知能実現のためには
私は「電子ビジョン」というものをたまに友人に話している。スマホで何ができるかを考えた時にスマホになった気持ちで考えてみろというものである。スマホはカメラを許容されたら目が見えるようになり、マイクを許容されたら音が聞こえるようになる。バッテリーがきれたら眠らざるを得ないし、その間に何が起きているのかはしりようもない。このような状況で「私は今から何をしたらいいと思う」と聞かれると様々な質問をしなくてはいけないのである。これが手間だからそのアプリは普及しないと言われた時、どうやって実現するかわからないと頭を抱える人が多い。このような中でIoTという概念が出てきた。つまり電子媒体上で動くシステムの目が増えたのである。これにより聞かなくても機械が「推測する」ことがようやく原理的に可能になるケースが生まれてくるのである。
人工知能においてもこの概念は重要である。そもそもこのシステムは何が知ることができるのか、私は何をやらせようとしているのか、それが人間なら可能なのかどうか、それらを考えて初めて「これにはどんな目が必要なのか」まで話が進みIoTの活用事例が見えてくるのである。
今の人工知能研究は知能の構造にフォーカスしているものが多い。もちろんそういうアプローチも重要だし、その末に現実的な人工知能が生まれる可能性もある。だが私は「人工知能が活躍できる環境」を整えることがその前提として必要なのではないかと考えている。どういう知能構造であれ、環境から得られるデータの質にその本質が大きく左右されることは明白なのである。私たちの世界と電子空間の接点としてIoTには期待しているし、人間から見た世界を得るための情報としてARメガネには期待している。記憶が人間を形作るなら、人間らしい記憶を集める作業から入るのが自然なのではないだろうか。