拡大法
AIスピーカーを展望する
 2017年9月
制作
最新ニュース (2017年10月14日)
2017年9月10日、NHKは「グーグル日本が、10月上旬 、"グーグル・ホーム" 日本発売の方針を固めた」と報じた。詳細はこのページを参照されたい。右の YouTube は、最新版のグーグル・ホーム のPR ビデオ。

 
 Amazon
Echo Show型
 
Amazon
Echo型
 
ソニー
LF-S50G型
 
Google
Home
 
LINE
WAVE型

(写真はクリックで拡大します 拡大法を見る 

 数年前、米国のIoT分野では「AIスピーカー」という新しい領域が誕生した。2014年11月6日、上の写真にある「アマゾンEcho」 が発売されて以来、爆発的に売り上げを伸ばし、「2015年に170万台、2016年に650万台、2017年に2,450万台を出荷、今年の累計数は3,300万台になると予想 (ロボスタ)」 というぐらい爆発的な普及が始まっている。

 ジャーナリズムではうるさいほど「技術立国・日本の技術・・」を喧伝するが、残念ながら、日本はこの分野でも完全に立ち遅れている。3年遅れの今年7月、日韓合同の企業であるLine 社からWAVE型 (右上写真)というAIスピーカーが発売されたばかりで、本格的に普及するかどうかはこれからだ。

 AIスピーカーとは人工知能(AI)を搭載したスピーカーのことで、スマート・スピーカーとも呼ばれており、インターネットの常時接続が前提である。AlexaGoogleアシスタントSiri・・といった「AI音声認識システム」 と話し言葉で対話することにより検索、家電の制御といった斬新な利用ができる。

 AI音声認識分野では米国勢がリードしており、日本は完全に埒外である。「過度な期待は禁物(東洋経済)」という意見もあるが、「アマゾンEcho」が端緒を切り世界的な「AIスピーカー」ブームが始まった。今後のIoT領域の基盤となり、IT産業の覇権を左右する可能性を見て取ったのだろう、GoogleMicrosoftLINE,、ソニーアップルNTTドコモパナソニック・・といった企業がこぞって参入を始めた。 今のところ音声での利用が中心だが、画面併用により利用範囲が拡大するだろう。今までになかった斬新な領域のため、「ポスト・スマホ」との呼び声も高い。

 AIスピーカーでは、今のところ、次のようなことができている
(できない機種もある)。下の YouTube 動画は、日本では未発売の Google Home」 を、英語の使える日本人がレビューしたものである。 Google ホーム は、今夏、国内発売予定だったが9月10日現在まだ発売されておらず、発売日も未発表だから遅れているようだ。


声で検索(質問)
音楽を聴く(本体/別装置)
ラジオを聞く
TVを制御
照明・家電の制御  
交通情報を調べ
天気予報を調べる
アラーム・タイマー
予定を管理する
 
Googleホーム
レビュー

 非常に注目されている分野であり、Googleやアマゾンからは、"SDK"というソフト開発環境も発表されているので、国内で発売されたら、頃合いを見て筆者なりのアプリケーションを構築してみたいと考えているので、その現状・将来展望などを中心にこのコラムを纒めてみた。


  
 AIスピーカーとは何か
 アマゾンの新型 Echo Show を除いて、すべて主な構成要素は、音声認識機能・マイクロホン・スピーカーである。したがって、基本的には声で指示することにより、音楽を聞いたり、質問に答えたり、天気予報を聞いたり、時には照明を入り切りさせたり事ができる。初期設定時以外は文字やテキスト情報を使っていない点が大きな特徴である。

 マイクロホンは、ノイズキャンセラーなどを使って、車や電車の中、テレビなどの雑音がある部屋の中や音楽再生中でも命令を聞き取れるようにする機能を強化し、スピーカーは音楽をより高音質で聴けるような設計になっている。声は360度のどの位置からでも、至近距離~遠い所から来る可能性もあり、ちゃんと聞き取れないといけないのでここは各社の腕の見せどころである。

 発売予定のアップル HomePod は予定価格が4万円弱と最も高額だが、下の写真から分かるように、どう見ても音楽鑑賞を重点指向しているように見える。異例の4インチ大サイズ低音スピーカー、7個の中高音スピーカー、6個のマイクアレイからそれが覗える。私からしてみれば、いくら頑張っても、ピンからキリまであるとはいえ、70年ほどの時間をかけて蓄積・完成された音響装置には敵うまい。AIスピーカー全体について言えるが、音楽については聞き流す程度と思った方がよいと思う

 
HomePod 本体透視図
写真は「ロボスタ・サイト」からお借りしました

アマゾンの新製品
Echo Show

 
2017年5月に米国で発売された Echo Show は、上記の機能に文字や写真や動画が扱える機能を追加した新商品である。マイクとスピーカーだけの場合、表現の手段は音声だに限られ、より多くのことを成し遂げようとするためには片手落ちの感がある。例えば、買い物をする場合、高額商品だと仕様も見たいし肝心な口コミ内容も吟味するだろう。商品の外観やYouTube動画もあれば見ておきたい・・となる。これに欠かせない表現手段が画面である。アマゾンは最初の商品を世に出して早速この事に気がついたものと見える。かといって、スマホには今更手を付けにくい。Android、IOS のスマホが一世を風靡しているからである。

 
したがってAIスピーカーの発展形は、マイク+スピーカー+AI の音声認識機能に、表示装置を加えたものにならざるを得ないと思う。結局、AIスピーカー・システムはスマホに回帰するのではなかろうか。

   
要 点
  ■ あらゆる家電を音声だけで操作できる「ホームIoT機能」を持った中核機器として
    スマートホームのハブ的存在となる可能性をもつ。

  ■
IoT領域における画期的な方式
  ■ 音声コマンド(命令)が基盤
  ■ 今は、マイク+スピーカー+AI音声識別システムが基本要素
  ■ 今後は表示装置が必須となり、いずれスマホに回帰する。
  ■ 日本は世界的潮流に乗り遅れている。

各社のAIスピーカーの特徴 (主要品のみ)
 会社名  製品群 国内販売  外観  特徴
アマゾン  Echo型
Echo Dot型
Echo Show型
 2017年内を予想     音声認識機能 : ALEXA
  音声認識能力は劣る(日経新聞)
 この領域の創始社で2年ほどのリードあり
 表示装置を持ったAIスピーカーはアマゾン社のみ
 「ALEXAを採用した製品が2016年に5400を超え、いずれ7000を超える」と言われ業界を席巻中・・。
 
ユーザーがアプリを開発できるSDK環境がある。

 グーグル  Home型 2017年夏を予定


Googleホーム
レビュー
   音声認識機能 : Google アシスタント
 音声認識能力は抜きん出て強力(日本経済新聞)
 各国語の翻訳機能は優秀(日本経済新聞)
 個人ごとに音声を識別できる
 Googleアシスタン
が急成長見込み(ロボスタ)
 ユーザーがアプリを開発できるSDK環境がある。
 スマホとの連携機能が圧倒的に優れている。

 LINE  WAVE型  2017年7月発売済    音声認識機能 : Clova
 ●国内最初の発売
   (2017年7月)

 ●音声認識の反応が鈍い
   (発表会の印象)

 販売価格 15,000円
  
LINEのClova
発表会
アップル  HomePod型  (米国:2017年12月以降)
(国内は未定)
   音声認識機能 : siri
 "音楽特化戦略”を打ち出した
 音声認識機能は最も劣る(日経新聞)
マイクロソフト  Invoke型  (米国:2017年秋以降)
   音声認識機能 : Cortana
 Skypeで通話可能
 Harman Kardon製で音質が良いそうだ
 ソニー  LF-S50G型  (米国:2017年10月以降)
(国内は未定)
   音声認識機能 : Google アシスタント
 IPX3の防滴性能
 米国価格は約2万円を想定
 「ジェスチャーコントール」機能を搭載
 パナソニック  SC-GA10型   (未定)    音声認識機能 : Google アシスタント
 詳細仕様は不明
 オンキョー  VC-GX30型   (未定)    音声認識機能 : ALEXA
 詳細仕様は不明
 IKEA (照明具)
 照明キット  発売済  - Amazon Alexa、Google Assistant、Apple Siriから声で操作できるスマート照明を発表  (写真)

スマホのグーグルアシスタントは既に実用領域!

スマホのグーグル・アシスタントの現状

 2017年5月29日から、会話型AI音声認識システム「Googleアシスタント」が日本でもスマホで使えるようになった(Android 6.0以上)。早速、最新のレビューを見たり自分のスマホでテストを行ってみた。スマホのGoogleアシスタントGoogle ホームと同じAI音声認識システムを使っているので、Google ホームを買う前にその能力が試験できるだろう・・と考えたからだ。
 
 驚いたことに、スマホのグーグルアシスタントは既に実用レベルに達していることが分かった。この性能・機能だと、今まで議論してきたAIスピーカーは不要ではないかとすら思えてきた。


"あなただけの Google
アシスタント
"
(公式動画) 
 右のYouTube "あなただけの Google アシスタント" を見て欲しい。スマホのホームボタンを押すだけで、殆どの質問や検索に納得できる答えが返っている。自分でも確かめるために以下の2つの実証テストを行った。

実証試験① 実際に質問してみた
 愛用スマホファーウエイhonor6 Plus、version6)を使った。
 まず、ホームボタンを押してグーグル・アシスタントが使えるか確認。
 雑音環境下でも音声を認識でるかを確認するためにTVをオン。
 
天気や予定などを質問➡回答を確認。その時の様子は右の YouTube で・。

 結果は素晴らしいもので、正直びっくり、実用性も合格である。テレビの騒音の中でも、グーグル・アシスタントは発音や声質の悪い私の声もちゃんと聞き分ける。


実際に質問
電話をかける
(実写
  数年前、スマホの音声認識機能を使っていたときは、テレビでも点けようものなら、まず聞き分けてくれなかった記憶がある。数年間で格段の進歩を遂げたのである。Google は、検索、地図、メール、翻訳、画像管理・編集、動画(YouTube)、クラウドサービスなどの多くの領域で、独創的なアプリを生み出し、それらを無料で提供してきた。同時に間断なく、実用化・改善を重ねてきたようだ。 今回の音声認識テストでこのことが確認できた。 Googleアシスタントは個人ごとに声を聞き分け、その個人に合った回答や処理ができるようになっているるそうだから偉い。

 例えば、夫婦の両親がそれぞれの実家で健在だとして、夫が「
母に電話して・」と頼むと、夫のお母さんに電話がかかるし、奥さんが「お母さんに電話して・」と言えば、そのお母さんの実家に電話を掛けてくれるのだそうだ。ある程度の事前の設定が必要となるが、今のAIはそこまで調べ・判断してくれるのである。しかも学習能力まで備えている(私自身のテストでもこれを確認)。すごいことである。今のところ、個人の声の聞き分けはグーグル・アシスタントの独壇場のようである。

実証試験② 電話を掛けてみた
 続いて、同じスマホから横に置いてある固定電話に試験的に電話してみた。この固定電話の連絡先には「岡松自宅」と登録済である。
 私はPC・スマホ・タブレット3セットとも Google Chrome に統一しているので、メール・予定・連絡先などの情報は常に同期しており、これも効果を発揮しているものと思われる。
ついでに言えば、予定は孫の送迎スケジュールを管理するために親子間で共有しているので大変便利である(「私の神アプリ google予定」)。要するに、このテストの目的は「愛用のスマホから楽天でんわを使って音声の指示だけで電話がつながるか」を試すことである。ちなみにスマホで使っている楽天でんわは、通常の電話番号の頭に"003768"という数字を付加するとになっているが、電話料が半額になるので愛用している。

 テスト結果はOK
 驚いたことにスマホから"岡松自宅に電話"と話しかけるだけで、一発で我が家の固定電話に繋がってしまった。大成功である。Googleアシスタントには学習機能があるらしく、最初のテストでは、同じ呼びかけに対して、スマホからは、候補の連絡先の確認、電話アプリ(楽天電話)にするかの確認を、音声と画面両方から求めてきたが、2回目以降は、これらの手順や再度の質問もなく、本当に1発でつながってしまった。 (上の動画を参照。)  なお、スマホの画面を録画したかったのだが、同じスマホ内では、グーグル・アシスタントとスマホ画面録画アプリを同時に動かすことができなかったので、右の2つの動画は、別のスマホから撮影したことをお断りしておく。

 まとめ
 結論を出すのは時期尚早だろうが、Android スマホの Google アシスタント をいじって見た限りでは実用性は上々である。これならGoogleホームは要らないのではないかと思ってしまう。
 Googleホームが国内発売されたら、お小遣い程度で賄えそうなので、直ちに購入したいと思う。そして、無料のSDK環境を自分のPCにインストールして、自分なりのアプリケーションを制作してみたい。

 Googleホームだけでは大幅な生活革命が起きるとは思えない・というのが調べてみた結果の正直な感想である。
 第1、AIスピーカーが及ぶ範囲は、これが置かれている部屋、例えばリビングルームの中に限られ、声だけで部屋内の家電などを動かしたり、音楽を聴けるだろうが、寝室ではどうか、トイレや風呂に浸かっているときには影響が及ぶまい。 屋外に出たら無力である。

 第2に、これを使わないと生活上非常に困ることは一切なく、最初は面白がって使いまくるだろうが、いずれ飽きてくるような気がする。実は、私には経験があるのだ。当ホームページ 「超高機能リモコン・iRemocon」 でも紹介しているが、スマホのアプリをカストマイズの上、スマホからこのリモコンを経由して、テレビやラジオのコントロール、エヤコンのオンオフ、リビングルームの照明3灯の個別の入り切りや、照度などの制御ができるようにした。同時に音声でもオンオフできるようにしてある。使おうと思えば今でも動くが、次第に面倒になって、結局、壁についているスイッチやリモコンで入り切りする普通の方法に戻ってしまった。使おうと思えば、まずスマホを探してアプリを起動しなくてはならないし、すぐそばにスマホが置いてあるとは限らない。

 今は、朝6時30分から始まるラジオ体操を、このリモコンのタイマー機能でラジオを自動でオンさせ、6時40分に自動切断する機能だけに使っている状況である。これはこれで結構便利。もっとも、旅行で家を空けているときもラジオ体操だけは誰もいないリビングルームで動いているから、もったいないといえばもったいない・・ 泥棒さんがラジオ体操を聞いたら「家人は居るんだあ・・」と思わせる効果が無いではない。このページを泥棒さんが見ないことを願う!

 反面、AIスピーカーは常時音声がくるのを待っている状態だから上のような不便はなし・・と反論されるだろうが、どのみち、
結論は変わらないだろうと思っている。

 「AIスピーカー」大胆予想 (あくまで私見)

 
① AI 音声認識システムは数年以内に世界的な普及に至る。
   
(参考) "AI音声アシスタント、2021年までに75億台のデバイスに導入へ(ロボスタ"
 ② 将来はグーグルアシスタントが覇権を握るだろう。
   (参考) 同上 市場調査会社「Ovum」による
 ③ グーグルアシスタント・スマホはAIスピーカーを超えるだろう

理由は以下・

  
AIスピーカーだけでは生活の一部しかカバーできない。
  デイスプレイ装置も必須である。
  最新のスマホのAI音声認識能力は極めて高い(例:グーグルアシスタント )。
  スマホで充分AIスピーカーを代替できるのではないか。
  スマホは常時携帯している。
  スマホだと屋外でも活用できる。
       マップの活用(交通状況、ナビ、道案内・・)
       
海外旅行の通訳
       Word Lens を利用したリアルタイム翻訳
(下記のコラムを参照)
       
スマホによる決済
       
メール受発信
       
電話受発信
       
その他(省略)・・・


空港にて(実写)
Word Lens を利用したリアルタイム翻訳」
 これを使って、例えば、英語の看板にスマホのカメラをを向けると、画面が日本語に翻訳された看板に変わるという画期的なソフトです(左の写真を見てください)。
 これを最初に知った時、さすがグーグル・・と感動。昔、仕事でスロバキアの首都ブラチスラバで半年間生活したことがある。レストランの食事にも飽き、では自炊するか・と考え、スーパーに買い物に行ってはみたが野菜はともかく、日用品にしろ缶詰にしろ、何が入っているのか不明、何せ生活がかかっているのである、ほとほと参った。日用品では油なのか洗剤なのか分からないのである。缶詰などは絵や写真がついたものを買うしかない。ああ・これは鮭だな、これはイワシの缶詰か・・と言った具合。 そういうときに「リアルタイム翻訳」があると助かったのに・・と思った次第。
 

 買うとすればグーグルホームになると思うが、目的はシステム開発である。なるべく早くSDKをインストールして自前のアプリを開発してみたい。
 今考えているのは、孫たち(中1、小4、小1)用のシステム開発である。学校の時間割、目標管理、スケジュール管理、学習のための検索、好きな音楽を聴く、たまには相談相手にもなる・・という風なシステムを開発したい・。 さて、どうなるか今後の楽しみといったところ。
                                         (以上)