エンターティメントロボットAIBOその着想から商品化まで

 平成12年4月18日 15:00〜17:00
 虎ノ門ニッショウホール
 特許庁開催 発明の日記念講演会にて
 講演:ソニー デジタルクリーチャーズラボラトリ第一グループ課長 藤田雅博氏


※当レポートは、講演を聴きながらメモったものをそのまま掲載しております。そのため内容が不明な点が各所にあることを予めご了承ください。

講演概要
・自律ロボットの時代へ
・なぜエンターティンメントロボットか
・試作機MUTANTのデザインコンセプト
・OPENRとは
・AIBOのデザイン
・ROBOCUP

自律型ロボットの時代へ?
1990 infomationtecnology
1995 Networking
Autonomous
Robot....

アトムが作りたい

ロボットという定義
 映画、SFから類推した未来
 人間を助けたり社会を助けたりするもの

ロボットに必要なものとは、
 役に立つロボットの難しさ
 仕事を完全にこなせなければならない
 人間に対して安全であること
 認識や制御が実世界、実時間で実行できること

→技術的溝がある。
 画像認識、音声処理に人間の実世界のギャップ
 機械処理の困難さが露呈

そこに1つの解として。。。
エンターティンメントがこの溝のブリッジになるのでは???

Focus on Entertainment....これによって
早急にビジネスに結びつけることが可能ではないか??
また、「Sony」らしさ、にあっている。

SONYの「デジタルドリームキッズ構想」にもマッチ
〜小さい頃からSONYに対する企業イメージを埋め込み
購入層になったときに他企業との暗黙的な差別化を目的と
する長期的戦略

→研究へゴーサイン

Robot Pet
目的 Entertain Human
技術 Non MissionCritical
ResearchStyle CompleteAgent

今の技術で対応可能、将来楽しく、そこから人を助けるロボット
という本来の定義への移行ができるのではないか??

ロボットに必要な技術は、
ビジョンとして、画像認識の技術
歩行手法として 4足、2足歩行の研究
などなど。。。
これらの組み合わせをいかにCompleteするか

EntertainmentRobotの楽しみ方は、
 動きをみて楽しむ
 インタラクションを楽しむ
 ロボットを育てる
 ロボットを操縦する
 ロボットを作る
 などなど

操縦は、いままであった、ヴァーチャルリアリティとして社内に理解してくれる
ペット型ロボットは認知されるのに苦労した。
ロボットとのインタラクション、育てるという行為が人間の本能を刺激するのでは???
画面上では「たまごっち」や「モニタ画面水族館」などバーチャルペットが出始
めていた頃、、、、

小さい子がLEGOとかを組み合わせて作る、それをインテリジェントにしてつくる
あげるロボットの考え方もあるんではないかと考えていた。

まだまだはじまったばかり、
RobotEntertainment 産業を作ろう
いまは、始まったばかりで、これから企業、利用者が共に育てていく段階。

19997年はロボットの歴史上の特異点
 ソニーが4客自立型ロボットのエンターティンメント応用を提案、試作機を発表
 HONDA 2足ヒューマノイド(Pシリーズ)
 マーズローバー
 コンピュータチェス 人間に勝つ
 第一回ロボカップ

PetType Robot MUTANT(試作機)

デザインコンセプト
自然なヒューマンマシンインタラクション
エンジニア2人で2週間で試作機を完成
 虫みたいな6足ロボット

このときの定義は、、、
 実世界で動くロボット
 ノイズや環境の変化に強い認識
 家庭で動くこと
 複雑な動き
 生き物のような行動
 飽きない動き

超小型カメラ 
 ペットサイズにするために必須であったため、自分達で作ろう
 とし社内で協力を仰ぎ、切手大の大きさで4〜5ミリ程度の
 CCDを制作。
 物体追尾 色処理を元にした物体追尾

強い認識 トーン信号の検出
 音声は人間同士の対話ができる程度にしたい。単純なコマンド的一言で動かすだけ
 では物足りない。もっと自然な会話ができることが必要だと考えた。
 4足で動かすことで、複雑でアクションも多くできる。
 固定パターンの動きだと飽きる。もっと沢山のパターン、飽きない仕掛けを作ろう
 としてきた。

 カーナビの音声認識を行っている部隊で困難さを確認、デモンストレーション
 時に、静かであればいいが人が集まってうるさくなると音声認識が動かなくな
 る。マイクとの距離が近くないケースがほとんど。それを認識する必要がある。
 「リモートマイク」それだけで研究テーマになるほどのボリュームであるため
 まずは、音声認識はとりやめることに。

 人間のコマンドは数百ミリセカンドで変化する。
 一方トーンは、安定した周波数をもつので、フィルターして取り出すことができる。
 カクテルパーティ効果 多数から1つを認識する技術。
 簡易化するために、トーンにしている。

複雑な動き
 メカの構成 多自由度
 行動の同期を沢山持つ

 4足は歩行が遅く、カメラがぶれ易い。
 同僚のカゲヤマ氏が、画像と4足にこだわり、音声認識にもこだわる、各自が
 こだわりをもって検討を続けていた。音声認識もタイヤ走行も今後でてくるか
 もしれない。

4足構成
 複数の行動同期
 反射行動と塾工行動
 本能、情動、命令
 頭、手、あし、尻尾

 ペットには命令をしなくても動いて欲しい、〜本能
 情動は学習のためにいれる、感情で反応を変えることで、同じ刺激で違う
 動きをすることを可能とした。

 個々のユニットが別々に独立して動くことで、多数のアクションが可能

不気味の谷

縦軸
親和間
        −     −
      −− −   −
   −−−   −  −
ーーー      ー ー
         ーーー
        ↑      横軸 類似度
        文楽人形
          ↑
          不気味に感じてしまう点

縫いぐるみを着せたほうが いいのでは???という提案もあった。
本物に近くさせると、不気味になる。
アニメキャラみたいにデフォルメしたほうが、人間としては親和性が
高いと考えた。 
ぬいぐるみをかぶせたほうが、絶対にかわしい。という意見も多く、
実際に縫いぐるみを被せてみたけど、細かい動きがみえない。
また、見てすぐにロボットとして見え、その癖に、よく動いていること
が判り易い、そのままのほうが良いことを確信。

本物に似せすぎて、動きがかえって見栄えに対して、チープに見える
よりよい。

〜「メカメカなデザイン」

ラジコンのサブモータでロボットを作っていた。
ハンドリングしやすいが、大きさに対するトルクに不安があった。
ここでも自分達でモーターをつくった。軽量化とトルクを重点に作成。

ボディ、あたま、シッポが別々に動くことにした。

将来は顔認識、音声認識を簡単にいれられるようなアーキテクチャを導入。

試作は、黄色で楽しくなる
肌色でお手をする。
目を隠すと。。伏せをする。
音の方向を見る。
音階でおすわりをする。
頭のセンサーを短くたたくと怒る。怒って「ネコパンチ」する。
何度も怒ると、空手の型をして押忍をする。
起こりすぎると、お手をしない。手と頭をふって断る。

寝そべるような動作をする。アンバランスな格好が、ぬいぐるみを着ていな
いことで結構印象的にみえる。

どちらかというと、怒らせる方向でバリエーションをつくっていった。
ネコの攻撃パターンを参考にモーションを作成。
また、反応時のメロディは作曲家のプロに作曲してもらった。
口笛で呼んで、色のあるものをみて、それを追いかけていく。
画像と音の認識を併せた反応もトライ。
トーン認識で人間の言葉がはいっても認識することを確認

ラジコンのように、操縦することもしてみた。
人間がコントロールして、ボールをゴールする時間を競うゲームをする。
遊び方の将来性を確認

生物から学ぶ+人がデザインする。
 動物行動学
  本能欲求に基づく行動
  情動モデルによる感情表現
 モーションデザイン
  人のデザインによる具体的な動き
  人のデザインによる反応

デザインも、プロのグラフィックデザイナーである空山基氏に依頼。
デザインからモックアップし、それに向かってパーツを合わせて作り上げた。
〜SONYの総合力の凄さ

空山氏の提案の一部として、
つめ、みみ、シッポのシナリ具合
下あごによる口パク
胸に鍵。飼い主が鍵を持ち歩き、鍵を指すと動く
などなど

新しいことを発想し実現するには、反対されることに立ち向かう「力」が必要