会話知能の諸相

会話知能の形態として次の3種を考える.順に難しくなる.
形態1:ナビゲータ
エージェントはユーザの要望を応じて,エージェントの持つ世界の中にユーザを案内し,ユーザが望むと思うサービスをproactive/reactiveに提供する. トラベルガイドなど.ジェニファージェイムス.会話知能は自分の世界を作り,コントロールできる.
形態2:メディエータ
エージェントはユーザ同士の知識/情報循環の仲立ちをする. 小話循環システム.実世界における情報循環も含む.エージェントはユーザの棲む世界を理解しなければならない.ただし,完全でなくてもよい.
形態3:パートナー
ユーザとともに世界を構築する.ゲームプレイにおけるチームメイト.Simulated CrowdにおけるNPCも含む.エージェントはユーザと共生する世界を完全に深く理解しなければならない.
ただし,人間と会話知能が協力して重い物を持ち上げるといった物理タスクは扱わない.
例:小さな庭

(1) 形態1の会話
ロボットは自分の滞在する家の庭を来訪した人を案内する.聞き手の話し手の興味や要求に応じて,実際の庭ないしはヴァーチャル化された庭を歩き回り,情報を提供する. ロボットは話し手として「これは私のいる家の庭です」「このナツメは…」「この姫リンゴは…」といった話をする.
(2) 形態 2の会話
ロボットは,(1)において聞き手の役割を演じて,オーナーの説明を聞いて,庭がどのようなものかを理解する.(1)とつなぐと,小話を中継するメディエータになる.新たに追加された部分は,パートナーの発話内容を理解して,(後で話せるように)記憶するところ.
(3) 形態3の会話
庭の真ん中に池をつくる計画について議論する.「ここにこんな風に池を作りたい」,「給水や排水の便を考えるとここを広げた方がよいですよ」,「いいや,こっちにしたい」,「ここには鯉がいるといいですね」…
会話知能にはどのような能力が必要か?
形態1が基本である.

  • 言語表現をつかってタスクの遂行ができること.
  • 非言語表現を使って,自分がすべてを知り尽くしている世界のなかの事物を参照できること.
  • 情動が理解でき,共感を作り出せること.

形態2ではさらに,

  • 言語・非言語表現がユーザの棲む世界のどのような状況を参照しているか理解し,また,参照表現を自ら生成できること.

形態3では,さらに,

  • 世界において自分の未知のことに遭遇したときに,ユーザとともにそれに対する概念・価値観を形成し,ユーザと共有できるようになること

が求められる.