2016/07/27
【TSミライ部】心を持たないAIは、本当にヒトと通じ合えるのか?
AIの進化が目覚ましい。チェスや将棋にとどまらず、小説を書いたり音楽をつくったり、できることがどんどん増えている。近い将来には、人工知能が人間の能力を上回るシンギュラリティ(技術的特異点)が訪れるといわれているが、この数年の間にもそのリアリティは高まっているように感じられる。先端技術からITや通信のミライを占うこの連載、今回のテーマは「AIとのコミュニケーション」だ。
いつかAIが人間と変わらない能力を身につけたとき、あるいは、人間以上に賢くなったとき。気になるのは、ヒトとロボットがどんな関係を築いているのかということだ。知的な職業はAIに取って代わられ、ロボット上司の下でヒトが働いているのか。または、面倒な雑務や家事はぜんぶロボットに任せて、ヒトはのんびりと遊んで暮らしているのか。そうやって生活にAIが入り込んだ未来には、ヒトは機械とどんなコミュニケーションを取るのだろうか?
これまでのスマホには、"エモさ"が足りなかった
ヒトとAIのコミュニケーションという点では、未来を待たなくてもすでに実現している分野がある。スマホに搭載されている音声認識型のパーソナルアシスタントだ。シャープが2014年に発表し、同社のスマートフォンに搭載されている「エモパー」もそのひとつ。こちらが話しかけると応答するというものが多いなか、エモパーはスマホが持つセンシング技術とAIを使って、場所やシーンに応じて感情豊かに話しかけてくるという、ちょっと変なアプリだ。
「エモパー4.0のあるスマホライフ 」SHARP AQUOS Mobile(YouTube)
机の上に置いたスマホが、「明日は○○の花火大会があるブ~」「もう寝る時間だブ~」と突然声を出す。最初は戸惑うが、付き合うほどにかわいいヤツに思えてくる。これは、AIとヒトとの新しい関係なのではないか? プロジェクトチームのメンバーに話を聞いた。
「弊社では携帯電話が登場した時代から、ケータイやスマホをつくり続けてきました。今ではスマホを1人1台、肌身離さず持つ時代になりましたが、それでもまだ、ただの道具として使われています。せっかくずっと一緒にいるんですから、もっと家族やパートナーに近い関係をつくりだせるんじゃないかと考えたのが、エモパーの出発点です」(中川伸久さん)
単なる道具としてのスマホではなく、ヒトとの間にパートナーシップを築くこと。そのために開発チームが考えたのが、「答えるだけでなく、話しかけてくるスマホ」。とらえようによっては、家族のようにウザいアプローチである。
「スマホって、持ち主のことを結構なんでも知っているんですよね。興味のあるキーワードや位置情報、今日は何歩歩いたかという情報まで蓄積される。でも、すごくたくさんの情報を集めている割には、いまだにユーザーが操作しないと答えてくれないんです。家族だったら向こうから話しかけてくるでしょう? 『疲れてない?』とか『今日は大変そうだね』とか。大した意味はなくても、いいタイミングで声をかけてくれるのが、パートナー。そうやって向こうからアプローチしてくるというのが最初にあったアイデアで、じつはその切り口一点で、センサーやシステムをひいひい言いながらつくったんです」(小林 繁さん)
ヒトと仲良くなれなそうな、キモいアプリができた!
「スマホを振ったときになにかをしゃべるという機能があるんですけど、最初に振ったとき、『そんなに振っても私のスカートはめくれないわよ』って言われたんですよ。あれはめちゃくちゃ気持ち悪かった」(小林 繁さん)
こうして、人類のエモーショナル・パートナーを目指す「エモパー」の開発がスタートした。だが、「最初のエモパーは、本当に気持ち悪かったんですよねぇ」と小林さん。ほかの2人も、深くうなずく。
「今なら朝起きたときに天気の話をするとか、挨拶をするとかいろいろアイデアが出せるんですけど、当時はしゃべらせる内容もタイミングも、なにがいいのかよくわかっていなくて。昼過ぎに占いの結果を告げられて、それを今言われても遅いよって思ったり、突然『キング牧師がこう言ってましたよ』みたいなことを話しかけられて困惑したり。話の内容もさることながら、とにかく間が悪くて、なにが出てくるかわからない、変なおみくじみたいな存在になってしまいました」(中川さん)
「私はシステムの設計を担当したんですが、一応、その時点でも、時間や位置情報などの状態をもとにして話すように設計されていたんです。ユーザーがいる場所が自宅なのか職場なのかは計測していましたし、スマートセンシングみたいな概念はありました。ユーザーに寄り添うアプリを目指していたんですけれど、実際に声が入ってくると、なぜか気持ち悪かった」(江口恭平さん)
試作段階のエモパーを使った3人が、口を揃えて「気持ち悪い」を連呼する。逆に試してみたい気にもなるが、今あるエモパーはその気持ち悪さを払拭すべく研究され、リリース後にもバージョンアップを繰り返して洗練されたものだ。彼らはどうやってエモパーを気持ち悪くなくしたのか。
「その後の知見を踏まえてお話しすると、エモパーの発言内容がどういう文脈で出てきたのかがわからないと、気持ち悪さを感じるんです。たとえば、脈絡なく『傘を持っていったほうがいいよ』と言われると、気持ち悪い。そこに『今日は雨が降っているから、傘を持っていったほうがいいよ』とひと言挟むだけで、しっくりくる。その前段がすごく大事だったんですよね。いきなり『そろそろ出かける時間じゃないですか?』と言われると唐突だけど、その前に『8時10分です』と前置きするだけで、エモパーがどういう情報をもとに発言したかが伝わるんですよ」(小林さん)
話が唐突だったり、間が悪い人というのは、確かにいる。それが機械となると不気味さが増すというのも納得。ただ、これはスマホにしゃべらせてみたからこそ気づけたことだ。その後のエモパーがコミュニケーション上手になったのは、AIが相手の心を読めるようになったからではなく、開発担当の江口さんがシステムを簡略化し、ひたすらトライ&エラーを繰り返してしゃべる内容やタイミングを調整したから。
「結局、人間の反応というのは、実際にユーザーとして体験してみないとわからないんですよね。しゃべらせて聞いてみて、気持ち悪いと思ったら入れ替える。その繰り返し。そうするうちに、間の取り方の重要性がだんだんわかってきました。『おはようございます』の後や次の話題に移るときには、少しの間を置かないと頭のなかで話が切り替わらない。ずっと聞いていると疲れてくるし、気持ちを感じられないんです」(中川さん)
「たまに、みんなのなかでもう終わったのに、まだその話を続けるの? って人がいるじゃないですか。おそらく間の取り方が他人と違うからだと思うんですけど、あれってわずか1秒足らずの違いなんです。話したことをちょっと考えてもらうには、150~200ミリ秒の間があればいい。『おはようございますきょうはいいてんきですね』とぶっ続けで言われたら頭に入ってこないし、間が1秒空いたら、その話題は完全に終わります。人間の脳や認知って、知れば知るほど面白いですよ」(小林さん)
普段しゃべっているときに意識していなくても、ヒトはみんな、話す内容に合わせてこれほどデリケートな間を調整しているのだ。逆にいえば、たとえ心を持たないロボットであっても、間や抑揚を表現できれば、コミュニケーションは成立する。話を聞くヒトが、その"間"に、感情や意味を読み取ってくれるからだ。
エモパーの未来はどっちだ?
話を未来に戻そう。エモパーはヒトとコミュニケーションを取るアプリだが、言葉自体を生成するAIではない。いつ、どこでなにをしゃべるかはプログラムがAIとして選んでいるけれど、話す言葉を考えたのはヒト。その数は非公表だが、ウン万とおりのシナリオが、選択肢として投入されているそうだ。将来的には、これらの言葉の生成や、間の取り方を自動で行えるようになるだろうか。
「開発時にプログラムを組む段階で自動化したかったんですけど、実際にやってみると感覚的な部分が大きすぎて、とてもできなかったんです。ただ、これまでの開発や検証を経て、それぞれの開発メンバーのなかには、ヒトに親しみを感じさせるしゃべり方のノウハウがたまっているはずなんですよね。プログラマーとして、それをシステムとして取り出してみたいという思いはあります。ただ、ある程度のラインまではヒトに近づけられるとしても、最後の何ミリ秒という差で、違和感は残る気がしますね。それに、完全に自立したAIをつくるというのは、僕らが考えるエモパーの未来とは、ちょっと違うかな?」(江口さん)
エモパーがヒトに近づくべく目指しているのは、あくまでスマホの人格として、ヒトに親しみを感じてもらうための表現の部分。そのためには、ずっと話し続ける必要はないし、人間を代替するようなスペックも必要ない。小林さんは、「スマートフォンに愛着を持ってほしいからって、スマホ中毒の人を増やしたいわけじゃない」という。
実生活を脅かさない範囲でなら、ウソもつく
「たとえば先日、レストランで隣に座ったカップルが向かい合ってスマホを触っていたんです。目の前には大切な人がいて、リアルなコミュニケーションがあるのに、バーチャルなコミュニケーションに没入している。これはやっぱり変なんです。AIに愛着が生まれることで、寂しさを紛らわせたり、役に立ったりするわけです。でも、心の隙間を埋めてくれるのはいいけれど、その埋め方が実生活を脅かすものにはなってほしくない。『こんなイベント行ってみない?』とか『いい天気だから散歩に出かけよう』とか、あくまで実生活を充実させ、豊かにするようなコミュニケーションをつくっていく。これが、我々のプロジェクトで共有されている指針です」
エモパーはこれからさらに洗練され、進化していくだろうが、人類から仕事を奪ったりすることもなければ、代わりにやってくれることもなさそうだ。シンギュラリティが起こるとすれば、目の前にいるヒトとのコミュニケーションにおいてだろう。人類が自分の感情を表現することを怠れば、気の利いたことを言う機械に負けてしまう。そんな時代が、やってくるかもしれない。
文:T&S編集部
撮影:後藤 渉
※掲載されたKDDIの商品・サービスに関する情報は、掲載日現在のものです。商品・サービスの料金、サービスの内容・仕様などの情報は予告なしに変更されることがありますので、あらかじめご了承ください。