人工知能と会話情報学

会話情報学の研究はこれからの人工知能研究の重要な一つの流れとして位置づけることができる.これまでの人工知能研究では,人工システム単独の知能の研究が主流であった.マルチエージェントシステムの研究にしても,人工システム同士のインタラクションが主であり,人間との間のインタラクションはHAI (Human Agent Interaction)など違う分野の領域だと思われていた.しかし,そうした人工知能システムの能力が高まるにつれて,より多くのことを人間から深く学び,人間にも学んだことを丁寧に教えたり,サービスの対象となる人間や人間のグループの持つ複雑で変化していく意向をより的確に把握し,提供するサービスの内容を必要に応じて正確に説明できるようにするためのコミュニケーション知能の実現が必要になった.コミュニケーションでは,単に機能的な側面だけでなく,人間の情動といった,対象に関わる微妙で暗黙性が高いメタレベルの情報のやり取りや,共感の生成といった知能を超えた,心の領域に踏み込まないとうまくいかない.
人工知能の歴史をたどってみよう.
人工知能研究は,1956年のダートマス会議から本格化した.John McCarthyが分野名称としてEpistemological Engineeringを主張したが,発音が難しいのでもっと平易なArtificial Intelligenceになったと言われている.
人工知能研究の成功した部門は,大規模探索,知識ベースシステム,言語・音声・画像処理,プランニング,機械学習とデータマイニング,人工知能と芸術との融合である.
これらの成果の背後には,「すごい」と言わせるくらいの高い問題解決能力をもつ知的エージェントを作ろうというマインドがあったと言える.
最近,米国の人気クイズ番組「Jeopardy!」において人間のクイズ王に勝ったクイズ解答システムIBM Watson,iPhone 4Sに搭載された音声アシスタント機能Siri,NTT DOCOMOのしゃべってコンシェル や,Google音声検索,Google Driverless Carなど,人工知能への関心が高まっている.
これらの背後には大きなトレンドの変化がある.第一に,人工知能研究は思想と技能が中心だった時代は終わり,科学の時代になった.第二に,当初は知能の本質を理解するために一定の役割を果たしてきた“toy problems”が色あせて,現実の困難な問題に適用できて初めて意味があると考えられるようになってきた. 第三に,研究ツールが広がり,多くのニューカマーが教科書を読み,ツールを組み合わせて,短期間で人工知能のフレーバーを持つシステムを実装できるようになった. 2010年にマイクロソフトから発売されたゲーム機Xbox 360向けのセンサーパッケージKinectが好例だ.これまでは,画像認識は専門家だけのものであったが,いまや広く画像認識ツールが使えるようになった.画像認識ができれば,インタフェースが向上し,アプリの間口が格段に広がることが期待される.第四に,ロボカップなどのコンペやベンチマーキングテストが普及し,また,参加のためのツールキットも普及して,競い合いながら人工知能の知識を深めていくための間口が広がった.
現代の人工知能技術は,高度に専門化された領域で設定された問題を大量データと高速計算によって解決するという計算知能に支えられていると言える.
これからの人工知能研究がさらに大きく発展するためには,単に「すごい」と言われたいという素朴な動機だけでは不十分であると考えられる.そのような研究は,社会に受け入れられなくなるばかりか,学術的にも不十分なものになりかねない.
第一に,人工知能技術が人間社会の創造活動に貢献するためには,単一の側面で優れているだけでは不十分であり,人間の創造活動において多様な形態で表れる人間の知性と緻密に結びつき,相互に触発しあって発展することができなければならない .社会への実装なしでは,インパクトは限定される.
第二に,現在加速しつつあるネットワーク社会では,結果だけを社会と共有してもすぐに色あせてしまうので,目標設定から,開発の過程全体を共同研究者,さらには社会と共有していく必要がある.このようななかで,単に社会を驚かせたいというだけの皮相的な「目標」を長期にわたって維持することは難しい.
人間の知能と人工知能が扱う対象の重複が増えてきた.計算知能を用いて人間社会の抱える種々の問題を解いたり,新たな価値を創出するためには,計算知能と人間社会の継続的で高度な協創をつくり出して,人間社会の意向を計算知能に反映させたり,計算知能のパワーを人間社会がいかんなく利用できるようにして,全体として継続的に成長していく知的共同体を構成する必要がある.
例えば,翻訳という作業を例にとると,本質的な部分は人間に頼らざるを得ず,計算知能の側は言語表現の置き換えを提案したり,集合知を支援したりするクラウドソーシングの段階から出発して,時間をかけて翻訳に必要な常識的知識を少しずつ獲得していくという継続的発展の道を取らざるを得ない.
知的共同体を構成するための知能は,オープンで社会的でなければならない.それを以下では仮にコミュニケーション知能と名付けて,計算知能とは区別する.
従来は,計算知能のもつ力を熟知し,人間社会のこともよく理解できる人がコミュニケーション知能を求められるタスクを遂行する主体であった. 次の人工知能研究の新たなターゲットは,コミュニケーション知能を内包した人工知能であろう.
次世代人工知能のターゲットを象徴するキーワードは「君がいてよかった!とユーザが言いたくなる人工知能」である.
人工知能技術を搭載したエージェントがユーザから「君がいてよかった!」と心から言ってもらえるためには,単にユーザに何らかのメリットのあるサービスを提供するだけでは十分ではない.
第一に,これまで述べてきたようにユーザの抱える問題やソリューションの持つ制約など,エンドユーザの意向をきめ細かく読み取らなければならない.
第二に,意向の解釈においても,ソリューションの探索においても,社会のオープンさや予測しない出来事に起因する失敗をゼロにすることはできない.そのようななかで相互信頼を形成し,維持しなければならない.失敗してもユーザが「君がいてよかった!」と言ってくれたら一つのレベルをクリアできたと言えるだろう.
第三は,ユーザが意識的に「君」と呼んでくれるかどうかである.メディアの等価性[Reeves 1996]のために,ユーザがメディア化された実体を実体と意識下で混同して「君」と呼ぶかもしれないが,自分の道具としてではなくパートナーとして明示的にエージェントを位置づけるようになるレベルをターゲットとしたい.
会話情報学は,コミュニケーション知能の中心となる課題として位置づけられる.
参考文献
西田豊明.人工知能研究半世紀の歩みと今後の課題.情報管理,Vol. 55, No. 7, pp. 461-471,2012. <available from here>