音声認識サービス「Amazon Transcribe」の技術検証
音声認識サービス「Amazon Transcribe」の技術について検証致しましたので、ご紹介いたします。
概要
【用途】
カスタマーサポートにおける、顧客との電話でのやり取りの内容をテキストデータにすることでカスタマーサポートの質を向上させる。
【検証した技術:Amazon Transcribe】
高度な機械学習テクノロジーを使用して、オーディオファイルの発話を認識し、それをテキストに書き起こす。また、ストリーミングでの文字お越しが可能なので、リアルタイムに文字に変換する。
日本語以外の言語の問い合わせにも対応できるよう、発話は31ヵ語の認識が可能。カスタム語彙の登録が可能で、業種独自の語彙を登録することで文字起こしにそのまま利用できる。
..
文字起こし方法
CLIとPython SDKを利用した二通りの方法。
CLI(コマンドラインインターフェース)
文字起こしの設定をjson形式の設定ファイルに予め記入し、コマンドライン実行時のそのファイルを指定することで文字起こし処理を実施する。スケジュール化されたタスクや、RPAから容易に文字起こしの処理を実行できる。
※AWSのチュートリアルより抜粋
Python SDK
Python SDKを利用することで、Pythonベースで文字起こし行うことができる。PythonベースのWebフレームワークと連携することでサーバーサイドで文字起こしが実施可能。
※AWSのチュートリアルより抜粋。
..
使ってみた感想
非常に簡単に文字起こしの機能を利用できるのはメリットがあります。
料金もリーズナブル(10秒程度であれば、0.006USD)なので、手軽に検証することができます。
その他、テキスト読み上げサービス「Amazon Polly」もあるので検証する価値があります。
.
お問い合わせ
AI・IoT、ドローン等、開発に関するお問い合わせやその他ご質問等ございましたら、下記よりお願い申し上げます。