日本で音声コマンドは普及するか?

iPhoneを「バーチャル秘書」にする「Siri」リリース


 iPhoneをバーチャル秘書にできるアプリ「Siri Personal Assistant」を米新興企業Siriがリリースした。iPhone 3GSをサポートし、無料でダウンロードできる。


 Siriアプリでは、簡単な英語の音声コマンドを使ってレストランの予約やタクシーを呼ぶといったことができる。例えば、「Will it rain today?(今日、雨は降る?)」と話しかけると、SiriはNuanceの音声認識技術を使って音声コマンドを理解し、天気予報を表示する。「オフィス近くのイタリアンレストランを探して」と言えば、ユーザーの位置情報に基づいてレストラン情報を検索する。「明日の夜7時半に○○で2人分の席を予約」といったように、自然言語による操作が可能だ。

 Siriでは現時点では、レストランの検索と予約、近所のイベント検索、タクシーの予約、映画の上映時間の検索、地域情報検索、天気予報が利用できる。検索の結果はユーザーの位置、時間、過去の履歴によって異なる。例えば、レストランを予約した後に映画情報を検索すると、Siriは予約したレストランの近くの映画館の情報を表示する。さらに、ユーザーが許可すれば、Siriはユーザーの個人情報に基づいて学習するという。情報はGoogle MapsやレストランレビューサイトYelpなどのパートナーサイトから取得する。

 Siriアプリの現行バージョンはiPhone OS 3.1搭載のiPhone 3GSに対応する。近くiPod touchiPhone 3G、その他端末に対応したバージョンもリリース予定という。

 Siriはスタンフォード大学からスピンオフした企業で、GoogleYahoo!AppleMotorolaなどに在籍していたデザイナーやエンジニアが参加している。


2010年02月08日 09時40分 更新

ITmedia エンタープライズ
http://www.itmedia.co.jp/enterprise/articles/1002/08/news027.html


日本でもこのような音声コマンドによるシステムが普及するでしょうか。
音声コマンドは日本語の場合やっかいな問題が存在しています。日本語における話し言葉の多様性です。秘書アプリにいったいどういう言葉(口調)で話しかければいいのでしょうか。
日本語には、男言葉女言葉、上下関係における言葉、子供言葉、丁寧語、など話し方が多様であり、このような場合にどんな人でも使うことができるフラットな話し言葉が存在していないのです。日本語では話し方は相手や場面に依存する要素が極めて大きいのです。どういう相手か分らない秘書アプリに対しては話す言葉がない。
秘書アプリの機械相手の音声コマンドであっても「〜しろ」といったむき出しの命令形を使うのは心理的抵抗があります。
指示・命令を意味する表現が何通りも複雑にあると数も増えるし曖昧さも増えて音声コマンドとして理解させるのが困難になります。
ですから、たとえば介助犬に指示を与える時は、動詞は定められた英語、名詞は日本語で行うことになっています。
『Go to テーブル(テーブルへ)→ Up take リモコン(テーブルにアップしてリモコンをくわえる)→Bring(私のところへ持ってきて)→Give(渡して)→Thank you!!(ありがとう。)』
このような流れで介助犬への一連の指示が行われるのです。(日本補助犬協会参照)
これを、手伝ってくれる犬だからと、人それぞれの優しく丁寧な日本語の言い方でおこなっても、犬が戸惑ってしまうことになるでしょう。ペットに一方的に話しかけるだけで満足というわけにはいかないからです。
秘書アプリも日本語音声コマンドが難しいなら英語のままでやることにしたらいいのかもしれませんが利便性は低下します。
そこで、日本語での話し方が相手依存ならば、秘書アプリをどういう相手か先に設定し、その疑似人格への話し方として何パターンか用意しておく。例えば、ビジネス的な秘書、友達、何かのキャラなど、いくつかのパターンとそこに男女や年齢のバリエーションを持たせる。このように絞り込めば日本語音声コマンドも可能かもしれません。


(追記)
このSiriというサービスは2012年には日本語にも対応するらしいです。
日本語で自然に話すいろいろな言葉遣いを認識して理解し期待通りの処理が行われるならばすごい技術かもしれませんが、ユーザーの側はやはりどのような話し方をすればよいのか始め少し戸惑うでしょう。
自然言語の認識ではなくあらかじめコマンドとしての定型文が用意されているのかもしれません。



(追記2 2012年3月8日)
Siriというサービスが日本語に対応した模様。
そしてAppleの説明によると次のようになっている。自然な言語でコマンドを出せるらしい。

Siriを応答させるためには、決まった方法で話す必要がありますか?


いいえ。人に話しかけるのと同じように、自然な声と会話的な口調でSiriに話しかけてください。天気予報を知りたい時は「明日の天気はどう?」のように言います。「週末の天気は?」や、「週末の京都の天気は?」と聞くこともできます。どんな聞き方をしても、Siriはあなたにお望みの天気予報をお知らせします。

http://www.apple.com/jp/iphone/features/siri-faq.html#how-get


そして、例として挙げられている「明日の天気はどう?」「週末の天気は?」などで分かるように、「明日の天気を教えろ」「明日の天気はどうでしょうか」というような「教えろ」「でしょうか」といった用言の部分を省くことができるようだ。つまり命令や依頼問い掛けなどの厶ードの要素を明示しなくても済むということだ。命令形も丁寧な依頼の言い方も特に重要でないか不要なのだろう。口調による振幅が大きいのはこうした用言の部分である。名詞を並べるだけの言い方なら口調に依存することはほとんどないので、片言みたいな言い方でも文脈で通じてしまう日本語の柔軟性を逆手に取った上手いやり方とも言えよう。