AmazonのAIエージェント Alexaでできることを調べようと思い、Amazon Echo上で「お手伝いさんに呼びかけて話をする」という想定の簡単なプログラムをつくってみた。家にはキッチン、リビング等、いくつかの部屋があって、子供と犬がいて、お手伝いさんがそこを移動しながら外にいる僕と話をするという設定だ。
僕 :さち子さんを呼んで (アプリ呼び出し名を「さち子」と設定)
Alexa:なんでしょう?
僕 :今、どこにいる?
Alexa:キッチンです (内部 statusを持つ)
僕 :そこに誰かいる?
Alexa:誰もいませんね。
僕 :ちょっと居間に行ってくれる?
Alexa:ちょっと待ってください。(2秒休止) リビングに来ました。
僕 :そこは誰かいる? (内部 statusは変化している)
Alexa:犬のサリーがいますね。 (サリーの居場所は、ランダムに変化する)
という程度の単純なものだが、とりあえず、発話タイミングや声のトーンを、どのくらい制御できるかの確認には役立った。(制御はSSMLで行う → ここ)
「単純だけど、これだけでも僕の頭のなかには、仮想の家が見えるなぁ」と思いながら、しばらくAmazon Echoで動作確認の会話テストをやっていたら、ふと、「もし飯野さんだったら、何を考えるかな?」と思った。一時期、少し親しく話をさせてもらったこともあったものの、残念ながら夭逝した天才クリエーター 飯野賢治の、音だけのゲーム「リアルサウンド ~風のリグレット~」を思い出したからである。
何を選択するかでストーリーが変化する、菅野美穂演じる初恋の女の子とのサウンドだけの恋愛の世界は、グラフィックは何もなくても(何もないだけに)、強く心を揺さぶった。そのときの、声を担当した菅野美穂と飯野さんとのエピソードは彼のブログに詳しいが、彼女の声は、圧倒的なリアリティをもっていた。
今のスマートスピーカーからの合成音声は、パラメータ制御できるとは言っても心を揺さぶるレベルには遠いが、今よりもはるかに高度な制御ができるようになってくるのは、そう遠くないだろう。その時にどんな世界が描けるだろう? 飯野さんだったら「今のレベルだと俺は興味ないけど、将来にはすごく期待してるよ」と言うかも知れない。
Oculus Goなどで、徹底的にグラフィクスのリアリティを追求するのも良いけれど(これはこれで早速試してみたら圧倒された)、あまりリアルなグラフィクスは、どちらかと言う想像力のはたらく余地を奪う気もするので、サウンドのリアリティが進み、想像力をかき立てるゲームも発展してほしいなと思う。