Script/Mark up言語による会話エージェントの行動規則の記述

エージェントの行動パターンを規定するためのスクリプト言語/マークアップ言語

  • 次のような要件を満足しなければならない.①発話,視線,ジェスチャなどの同期,②パーソナリティや情報をジェスチャ,顔表情,発話などで表現できること,③複数キャラクタにも適用できること,④ユーザと他のエージェントとのコミュニケーションの取り扱いができること
  • H-animという標準が提案されている.ただし,この標準化はだいぶ古く,1997年~2003年くらいの間に行われたのではないかと思われる(要調査). http://www.hanim.org/ H-anim(の初期バージョン?)はVRML97における人間型キャラクタの身体の動きを詳細かつ標準的に記述しようとしている.The H-Anim 1.0 specificationからはじまり,The H-Anim 200x specification (ISO_IEC_FCD_19774)が最終版.最終版のなかのBibliographyリンクを見ると「委員会」となっているが,実際はプロダクトになっているみたい.会話エージェントの場合は,身体の動きを規定するだけでは不十分であり,発話との動機,顔表情の変化との同期などが必要.
  • かくして会話エージェント用のスクリプト言語の話になる.下記に代表的な研究が収集されている. http://www.springer.com/computer/hci/book/978-3-540-00867-5
  • STEP: a Scripting Language for Embodied Agents [Huang 2004].STEPの目指しているのは,①簡便さ(幾何学的な詳細を書かなくてもよいようにする),②構成的意味論,③再定義可能性,④パラメータ化,⑤いろいろなオブジェクト間の相互作用を記述しやすくしている.Direction referenceは身体の向き,X: left/right, Y: up/down, Z: front/back.Body referenceは先のH-animに基づいている.関節を表すJoint node,関節につながる身体の一部:Segment node,帽子や衣類や宝石をくっつける場所となるSite node.各Segment nodeはいくつかのDisplacer nodesをもつ.H-animに基づき,各関節は階層構造として規定されている.例えば,手は肘の下位,肘は肩の下位,….上位が動けば下位のパラメータも従属して動く.STEPの提案者であるHuangによれば,プログラミングには不便はないという.STEPは分散論理プログラミング言語で構成されている.動作の並列性,コンポーネント化などに手軽.基本的な動作.turn(回転)とmove(移動)動作の合成には,seq: 逐次実行,par: 並行実行,choice: 非決定的な選択,repeat: 繰り返し.例では,走行(run)は身体の形状を変えた歩行(walk)として定義されている.簡便さが取り柄.仮想世界のなかのオブジェクトとのインタラクションも同様に分散論理プログラミングで記述できる.ボールをつかむような場合は,簡単な計算によるinverse kinematicsで対応する.
  • CML (Character Markup Language) [Arafa 2004]. CMLでは,会話行動を詳細に記述できるようになっている.動作の分類.head gestureの分類,hand gestureの分類,body gestureの分類,情動の表示.例として,ハッピーな動きとポインティング,悲しげな動きとポインティング.コードはほとんど同じ.
  • AML (Avatar Markup Language) [Arafa 2004]はスマホ用.ただし,キャラクターはスマホ上のアプリ,例えば,携帯電話を勧めるといった行動を高品質に記述できないといけない.
  • SAIBA Initiativeで提案されたBML (behavior markup language)[Kopp 2006]とFML(function markup language) [Heylen 2008].もともとは一枚の絵の異なる部分(FMLは上流,BMLは下流)として構想された.まず,BMLの方から具体化が進んだ.
  • BMLでは,これまでの会話分析研究を反映して,同期など重要な概念を詳細に規定できるようになっている.当初の標準化の成果はBML1.0としてまとめられている. head, torso, face, gaze, body, legs, gesture, speech, lipsなどの成分に分けて比較的詳細な分析とモデル化が行われた.
  • FML [Heylen 2008]は,コミュニケーションの背後にある意図レベルのコミュニケーションを標準化しようとしたもの.まだ,議論が行われているだけ.
  • コーパスからの会話エージェントモデル構築 … より忠実度の高いモデルを生成するためにはコーパスが必要だ.