会話量子理論

ここでは,会話をストーリーを共有するためのプロセスとしてモデル化する.

図1

会話自体は,2人またはそれ以上の参加者から構成されるjoint activityであり,共有された情景(シーン)においてストーリーを共有することを目指したものである.会話の中での発話は,話し手の頭の中でふつふつと湧き上がってきた発話のポイントの表れであり,それは話し手の記憶から来るものかもしれないし,話し手がその場で新たに思いついたものかもしれない.話し手は発話のポイントを言葉や身振りなどを使って表現し,他の参加者たちは話し手と様々なインタラクションをしながら解釈を確立し,その結果を記憶する.会話参加者たちは,別の人との会話において記憶された会話を参照しつつ,ストーリーを発展させていく.

このような特徴づけにおいて,会話量子説では,話し手の頭のなかでふつふつとわきあがり,聞き手の頭の中で次第に姿を現していく発話のポイント(「会話の粒」)を原会話量子と呼ぶ.原会話量子は,参加者の一人が持っていたストーリーのあるまとまった一部分,あるいは,その場で即席に創り出されるひとかたまりの情報を担ったものであり,インタラクション(ないしは波動)としての会話と,記憶としての(ないしは物質化された)会話をつなぐ役割を果たす.コンテンツ化は,インタラクションとしての会話を記憶にとどめることであり,インタラクション化はその逆のプロセスである.
もちろん,話し手の頭の中に生じた原会話量子と聞き手が解釈によって頭の中に組み立てた原会話量子は異なるかもしれない.実際,発話者の頭の中に浮かびあがった原会話量子を観察することもできなければ,聞き手の頭の中に構成された原会話量子も観察不能であるから,我々が扱えるものは,話し手と聞き手のやり取りの様子を傍観者として外から観察することによって推定された原会話量子にすぎない.
会話量子理論では,会話の場において一つの論点を構成すると考えられるやりとりを構成する言語的・非言語的な会話行動を傍観者の立場からひとまとめにしたものを会話量子と呼び,計測を凝らして,会話を会話量子の離散的な流れとして近似し,様々な応用に活用することをめざす.会話量子表現は,会話のコンテンツ表現とインタラクション表現から構成され,両者が関連付けられたものである.コンテンツ表現は,会話で参照される事物とそれに対応付けられた会話参加者の言語・非言語モダリティによるコミュニケーションイベントの系列からなる.
例えば,

図2

というAとBの間の会話を考えてみよう.この会話は次のような4つの会話シーンの連鎖から構成されていると考えられる.

図3

すなわち,

  • 会話シーン1:(状況の導入)今いる場所と,話者との関係を述べている.
  • 会話シーン2:(状況の部分への焦点)ナツメの木と姫リンゴの木に焦点をあてている.
  • 会話シーン3:(最初の焦点への言及)ナツメの木に焦点があたり,さらに,実に話題が飛んでいる.
  • 会話シーン4:(2番目の焦点への言及)姫リンゴに対する言及が行われている.

各会話シーンを,会話量子を用いて表現する.
会話シーン1に対して:

図4

この会話シーンの背後にある会話量子は,実世界におけるTNの庭を参照状況とし,それに対して,その所有者がTNであることを宣言する場合に対応している.
インタラクション化では,眼前の状況に対して会話知能が発話行為を行ったり,聞き手役を務める場合,テンプレートとする会話量子が選択されたのちに,会話行為がモニタされる.この会話量子が選択される場合は,Aが話し手として選択されると,Aは「ここ」を直示的ジェスチャなどによって眼前の場所と対応づけ,「TN」を「私」に置き換えて,ジェスチャと同期させつつ「ここが私の庭です」という発話をするだろう.Bが話し手として選択されると,Bが直示的ジェスチャなどによって「ここ」を眼前の状況と対応付けた後で,「ここはあなたの家の庭ですか?」と言い,Aが「はいそうです」と答えるような会話シーケンスが実現されることになる.同様に,3人以上の参加者がいる会話の場に対応付けることもできる.
コンテンツ化においては,概ね上記とは逆の向きに情報処理が行われる.例えば,Aの「ここが私の家の庭です」という発話を受け取ると,「ここ」という言語表現に伴って行われた直示的なジェスチャが吟味され,周囲の顕著な特徴(この場合は,敷地の境界など)を参照しながら,どの範囲か,ターゲットをいくつかの候補に絞り込んだのちに,「私の家の庭です」を聞いてから,「ここ」の粒度が家の敷地くらいであることを知り,また,「私」を話者であるA(この場合TN)に置き換えたのちに,全体として図1の上部にあるような会話量子を生成する.

会話シーン2に対して:

図5

ここでは,もとの会話シーンの一部が話題として取り上げられ,会話が進行する.インタラクション化では,どこに焦点が移ったかを言語表現と身振り手振りを交えて適切に支持しなければならない.コンテンツ化では,発話者の表現を正しくとらえて,会話シーンで参照されているものを理解できなければならない.

会話シーン3に対して:

図6

展開してきた会話シーンのさらなる一部が話題として取り上げられる.インタラクション化ではそれを適確に表現し,コンテンツ化では正しい解釈を作り出さなければならない.

会話シーン4について:

図7

最後の発話についても同様に進行する.
会話量子の大きさ,長さについてが気になるかもしれないが,これらは会話参加者の能力に依存する話であり,会話システムごとに異なっていて全く問題ない.一般に,会話量子が大きい(カバーしている時間蝶が長い)とそれだけ談話的なニュアンスが保持しやすいが,再利用性は下がるだけである.ゆるやかに共通化すべきところはデータ交換方式 ― 会話量子の属性やその値の表示方法 ― である.
ここまでの議論をきいて,より効率的な考えのやり取りの方法があることに気づくだろう.その方法は参加者それぞれにより高いスキルを仮定して,ちょうど専門論文にあるように,表現と対象との対応のさせ方を取り決めておいて,シンボル化されたコミュニケーション手段を使って一気に大量の情報をやり取りすることである.それは大人のコミュニケーションモデルであると言えるだろう.これまで描いてきた会話モデルはより原初的であり,子供でも有しているものである.効率は悪いが,スキルの確立されていない事柄や,どう言い表していいかわからないような暗黙性の高い事柄をイラストレイティブにコミュニケーションするときはこうした原初的なコミュニケーションに依拠せざるを得ない.子供のコミュニケーションではこうしたコミュニケーションの割合が高いと思われる.また,より高度なコミュニケーション手段を確立するための基盤となるものであるともいえよう.