音声認識が普及してくると、認識した結果をどう活用するかが重要になってくる

こんにちは。レトリバの代表取締役の河原@kawaitiです。

音声認識は昔からある技術ですが、認識精度に問題があり、なかなか普及してきませんでした。

近年、コンピュータの高速化とディープラーニングの活用により、音声認識の精度は実用的なレベルまで向上してきました。

どれぐらい向上したかというと、以前の音声認識では認識精度80%程度が限界でしたが、ディープラーニングの活用により、認識精度が95%近くにまで向上しています。

これによって、音声をかなり正確にテキスト化することができるようになり、活用の場が広がってきていると思います。

スマートフォン上の音声認識機能も、ここ数年で格段に使いやすくなってきたのは、精度向上によるものだと思います。)


以前は、高額な商用音声認識エンジンしかありませんでした。また、音声認識エンジンを動かすために、高性能で高価なサーバが必要でした。

最近ではAI技術を得意とするベンチャー企業(レトリバも!)が独自の音声認識エンジンを提供しだしたり、オープンソース音声認識エンジンでも高い認識精度が出せるようになってきていたりします。

さらに、Google Search APIのような音声認識APIサービスができ、サーバー機器を用意しなくても音声認識システムを構築できるようになってきています。

音声認識を導入するハードルやコストも劇的に下がってきており、今後ますます音声認識を活用したシステムやサービスが普及してくるでしょう。


このように、音声認識はどんどん普及していくと思いますが、認識した結果をどう活用するかが今後の「カギ」になってきます。

今までデータ化しにくかった、対話や会話を音声認識を使ってデータ化できれば、今までデータが無くて人間の経験と勘に頼っていた、顧客のニーズやセールステクニックなどが分析できるようになってきます。

レトリバでは、音声認識の結果を活用するために、様々な自然言語処理AIをご提供しています。


今後このブログでは、最先端の自然言語処理技術の紹介や活用例、実際の利用事例などのご紹介をして行けたらと思います。