プログラミングが不要なGoogle Homeアプリ制作サービス「RINDO」(ベータ版)を無料提供中!
Ebisu Voice Production Logo
開発ブログ

発話のテキスト変換について

Teruhisa Yamamoto
2018年07月17日

Google Homeやその他のスマートスピーカーでもそうですが、ユーザーが発話した内容はテキストに変換された上で処理にかけられます。ユーザーの喋った音声ファイルが処理にかけられているわけではないのです。開発者は、音声からテキストに変換された結果を元に処理を行います。

Google Assistantで音声入力後のテキスト変換を見てみるとわかりますが、かなりAssistantの性能によります。 ユーザーの滑舌が悪ければ?しようがないのかもしれませんが、日本語には辛い場面がよく起こりえます。英語、カタカナ、漢数字などユーザーの意図とは違ったテキスト変換をされることが多々起こります。(もちろん、意図とは全く違うテキスト変換されることもまぁまぁあったりします) 例えば、「ぐーぐる」とユーザーが発話した際に、ローマ字になるかカタカナになるかはGoogle Assistantの学習状態によります。

エンドユーザーにとって、どの様にテキスト変換されるかなどは考慮しません。そのため、アプリ開発を行う上ではこのようなことにも注意を払う必要があります。しかし、表記ゆれへの対応はまだしも、誤変換の対応は予想がつかないためかなりの無理があるかと思います。

解決策としては、場面場面でのログを確認することで、どのような入力がされているか、ユーザーの離脱率はどうかなどで対応を行っていくと良いかと思います。

恵比寿ボイスプロダクション
github icontwitter icon
Home
開発コンサル
RINDO
About Us
お問い合わせ
Privacy Policy