MrTidy

ネオAI研究者の役割は,EAを実現し,アセスするための理論として,身体を持ち発展するアーティフィシャル・マインド構成論と,我々とEAが共存し共進化することによって構成されていく情報環境論の両方を構築することだ.例題としてお片付けロボットMrTidyを考えてみよう.
一見,MrTidyの主なミッションは「ご主人様」の「賢いしもべ」として,主人の意図を推定し,散らかっているものを片付けるという従来の秘書エージェント,アシスタント・エージェントの一種のようにみえるが,ここで描こうとするMrtidyはそのようなものではない.「従順なしもべ」という概念と「相互の共感」という概念の両立は非常に難しい.人間社会で「従順なしもべであり,かつ,相互に共感を持つことのできる人」のインスタンスを探すことは難しい.幻想に近いのではないか.MrTidyは,片付けの対象となるモノの持ち主の雇用者(あるいは,親)ならばもっと現実味が出るだろう.例えば,子供があまりに部屋を散らかすから親が「取り締まり」のためにMrTidyを買って子供の近くに置いておく,というセッティングで,当の子供とロボットの交流を考えると現実味がある.執事の視点を描いた映画として,「日の名残り」http://t.co/FYFFPury は秀逸だ.片づけられるものの所有者(ユーザ)とMrTidyとのインタラクションはどのようなものになるだろうか?
MrTidy-0
AIの入っていないMrTidyをMrTidy-0と呼ぼう.MrTidy-0は,不用品置き場に置かれたもの,あるいは,予め定められた「不用」シールを貼られたオブジェクトをみつけて資源回収センターに移動することになるだろう.あるいは,MrTidy-0はユーザが留守をすると,予め教えられたホームポジションにモノをしまい直すのかもしれない.このあたりだけでも,微細にみると結構面白いAI問題を含んでいるし,じゃまなモノを渡したら持ってきてくれるだろうから,テレビリモコンが見つからないなどという問題が解消されて結構便利なロボットができると思うが,そのあたりの話題はまたの機会に残して,先に進めたい.
MrTidy-1
AI機能を備えたMrTidyをMrTidy-1と呼ぶことにしよう.MrTidy-1はどんなことをしてくれるだろうか?MrTidy-1はAI機能を持っているから,ユーザとのインタラクションのログを解析して,不要そうなものを推定して,「これ,片づけておきましょうか?」と不用品のリサイクルを提案したり,「こんなレイアウトはどうでしょうか」といった提案をしてくれるかもしれない.MrTidy-1はユーザの声色,表情,身振りしぐさなどをみて,ユーザの意図をある程度察する努力をするかもしれない.また,ユーザのパーソナリティに応じてインタラクションの仕方を変えたり,異なるレイアウトを提案するかもしれない.こういう話になると,「またいつものおせっかいAIか!自分で好きにするから放っておいてくれ」ということになる.おせっかいAIが嫌われてうまくいかない理由は,意図のコミュニケーションが高価だからではないかと思う.
モノを片付けるとか,不用品のリサイクルの背後にある意図は,複雑・不完全・矛盾に満ちたものであり,それを簡潔に言い表すことはできないばかりか,尋ねられてもすぐに答えられないことも多い.だから部屋は散らかる一方なのだ.自分の持ち物をどう整理/始末するかというのは個々人にとって大問題であり,持ち主だって短時間でその解を見つけられない.長いこと思案して手放したとたんに,「しまった!」と悔いることも多い.いまはたまたま物理オブジェクトを対象にしているが,情報世界ではこの問題はかなり回避される.膨大な情報(データ)を安価に格納できるディスクはあるし,フォルダーを整理しなくて強力な検索エンジンがついていてくれる.「おせっかいなAIより強力なサーチエンジン」と言われても仕方がない.困難な問題の解決には強力な技が必要だ.私見では,我々の身の回りの物理的なオブジェクトは増える一方だ.便利なガジェットや何かの記念にもらったグッズはどんどん増えいく.こうしたものは物理的存在そのものに意味があるから,そんなものいらない,と全部倉庫にしまってしまうのも残念な敗退だ.
ちょうど銀行の貸金庫みたいに,自分の持ち物を全部トランクルームにしまっておいて,必要に応じてロボットに取り出させて再レイアウトしたり,予測制御する,というのは一定のコストはかかるもののよいプランかもしれない.超整理法みたいに,持ち物を整理してレイアウトするというプロセスを省略しようという考え方もあるかもしれない.どうでもいい仕事に関わるオブジェクトならそれでいいかもしれない.しかし,大事なものをコラージュしてレイアウトするというプロセスは創造にとって大切であるので残しておきたい.結局のところ,レイアウトの背後にある意図は複雑・不完全なのでコミュニケーションによってそれを伝えるためのコストは非常に大きくなるだろうが,それを解決しないことには益々乱雑になるばかりの生活空間の中で我々は埋没してしまうだろう.
MrTidy2
EA(共感力のあるエージェント)と呼ぶに値するMrTidyをMrTidy-2と呼ぶことにすると,MrTidy-2は,複雑化する一方の我々の生活環境を綺麗にレイアウトしなおすための複雑・不完全な意図をリーズナブルなコストで伝える能力を持つものでなければならない.ストーリーの集まりとしての記憶をユーザと共同構築する能力をもたせることが,MrTidy-2実現の鍵ではないかと思う.自分の持ち物が少ない初期状態では,共有されているストーリーは少なくてもよい.その状態から,ユーザはMrTidy-2とインタラクションをしながら少しずつモノと共有ストーリーを増やしていく.モノが増えていくに従って,ストーリーも増えていくが,ストーリーの方は単に集積するだけでなく,積み重ね,統合,一般化が起きて,(ダイナミックメモリーシステムの構築に成功したならば)常に整理された状態に保たれる.また,ストーリーが常にユーザとMrTidy-2の間で共有されるようにしておかねばならない.
ユーザとMrTidy-2の間の記憶の共有が保証されていると,その(たぶん膨大な)共有記憶を背景に,ユーザはあうんの呼吸でMrTidy-2と普段のコミュニケーションをすることができる.見渡してみると特にこれといった本質的な概念ボトルネックはないように思えるので,さらに掘り下げてみよう.
良質のコミュニケーションでは参加者に自発的にコミットさせる.低品質のコミュニケーションでは,参加者があまりものを考えないで発言することを許すから,参加者の意図=コミットメントは引き出せず,結局あとで覆されることになって高価になる(時間が無駄になる).
旅行代理店の会話で,エージェントが「どっちの方面がいいですか」などとクライアントに安易に尋ねて,クライアントが「今回はスイスに行きたい」等と安易に答えるが,その方向でプランを詳細化してはじめて実はク
ライアントの本音ははっとするほど美しい世界遺産を訪れたかった,といった話.会話からホテルや訪問先についてのユーザの嗜好がわかるから,行先をスイスからオーストリアのハルシュタットに変えても白紙からのプランニングより効率的な再プランニングが可能である(それはそれで面白いAI問題)とはいうものの,コミュニケーションは高価になる.
クラシックAIでは,「どうせ最適のルートと日程が決まればいいんでしょう,そのためのコミュニケーションを最も効率的に行うためにはどう会話をプランニングすればよいかという問題に帰着できる」と考えるかもしれないが,これだと何だかさびしい.どこが欠けているかというと,旅行のプランニングでクライアントとエージェントの間で共有されるべきものはルートと日程とコストといったものだけではなく,計画された旅行がクライアントとエージェントに対してもたらす「意味」(あるいは新たなストーリー)であるという点だ.
ここで,「ストーリー」とは,「所与の前提(それまで抱いていた願望,経験,制約,嗜好,…)をあるテーマのもとで結び付けて構造的にまとめあげたもの」くらいに暫定的に定義しておこう.
ストーリーの構成はオープンエンドで創造的なプロセスだ.よい創造ができる(よいストーリーが構成できる)なら,長い時間がかかっても惜しくない.ストーリーの品質と時間的制約がトレードオフの関係にあるとすれば,クラシックAIは限られた時間内で最低品質を保証するストーリーを効率的に構成する技術の開発にはある程度成功したと言えるが,逆のケース(=高品質ストーリーの構成)についてはあまり貢献してこなかったと言えるかもしれない.概していうと,クローズド知能の問題(与えられた問題をいかに知的に解くか)については,従来の人工知能研究の貢献は大であり,肯定的解決,否定的解決,単純化された問題の効率的解決を含め,概ね成熟期に向かっている.
一方,ストーリーの構成のように創造のようにオープンエンドな課題についてはこれからだ.オープンエンドな課題については,価値観からの価値尺度の構成が含まれるので,知能だけに閉じこもることなく,身体性,感性,情報環境(社会,文化,倫理)をすべて動員して統合的なスタンスでとりかからないといい結果につながらないだろう.
このことは,例題として暫定的に取り上げた旅行のプランニングだけでなく,MrTidy-2の例題で取り上げた片づけ作業にもそのまま当てはまる.レイアウトの背後にあるストーリーの(ユーザとMrTidy-2による)共同構成という話に帰着される.
ストーリーの共同構成は,ストーリーの種(願望,経験,制約,嗜好,…)を構造化してまとめあげることだが,何でもかんでもまとめればいいというものではない.構成者にとって「いいな」と思える,意味あるまとまりになっていなければならない.直観的に「いいな!」と思えるのは,そこに新しい意味が生まれるからである.人間はさままざまのものにさまざまな意味を与える.それを正確に言い表すことは難しくても,人は自分の前に差し出されたものが意味あるかどうか,ある程度は判断できるだろう.問題は,人工システムのほうだ.共同作業者であるAIの方も,自分独自の意味の体系を構成できる能力がいる.
残念ながら,人間が作り上げようとするストーリーをAIシステムが深い意味で「理解」することはできそうもない.それは人間とAIシステムの身体性が異なるからであり,人が「今日はだるいから外出を止めたい」と言っても,言葉上のつじつま合わせしかできない.これまでのAIシステムのように単にシンボル上の推論を行って,「だるい→動くと疲れる→負の感情…」などとやっていても追いつかない.
そのあたりを意識したうえで記号モデルを導入して人間の意味の体系を記号レベルでシミュレーションすることも考えられるかもしれないが,あまり面白くなさそう.同じ意味の体系をつくるには同じ身体性と同じ生活環境と同じ文化が必要という立場に立てば,人間と同じ身体性と感覚機構をもつロボットを作らない限り,完全には意味の体系が共有できないことになる.そこまでするのは何だか人造人間を作るみたいな話になってしまう.
人工物は人工物で自律的に意味の体系を作ることができるようにし,比喩的なコミュニケーション能力をもたせるようにしたら,完全でなくても「ある程度」意味の体系を共有できるのではないか?例えば,ぶつかると「痛み」を感じるようにしておいたり,重いものを持つと放電して(バッテリーの)エネルギーが失われるようにして,それを感情モデルに接続して,ロボットにとっての意味体系の基盤にする.そのまわりに,視聴覚機構をつけ,さらに「心の理論」,「言語化」,「言語の身体感覚化」などの高次の認知機構をつける.
MrTidy-2の実現には,いろいろな技術が必要だが,チャレンジングなものは何だろう? 人間の五感と体性感覚の(メタファーによる)理解,自分の感覚のメタファーによる伝達,貪欲に学習を続ける持続的なラーニングシステム,「気持ち」のコミュニケーション,機械学習の研究の歴史は長いが,長期間(例えば,1年間)持続的に学習を継続し,それにふさわしい成長を遂げる学習システムはないように思える.なぜだろう?
自分にとって意味ある手掛かりをみつけ,理論として体系化し,それに基づく合理的な行動を導き出す能力.この問題は高度に社会的な存在を含まない自然ドメインと社会ドメインをわけて考えた方がわかりやすいように思える.自然ドメインではとりあえず心の理論,さらに,複雑に構造化された言語的・社会的情報環境を無視して,かなり単純に自然科学的なセンスで考えられる.