日本語対応されたAmazon transcribeが便利すぎる! その機能について徹底解説

日本語対応されたAmazon transcribeが便利すぎる! その機能について徹底解説

Amazon transcribe(アマゾン トランスクライブ)を知っていますか?AWSのサービスで、音声をテキスト化する際、非常に便利なツールです。2019年11月より日本語にも対応し、たくさんの人に利用されています。どのくらい便利なのかを解説していきます!

Amazon transcribeとは?

AWSとは

Amazon transcribeとは、音声を自動でテキストへと書き起こしてくれる機能です。以前から英語版はリリースされていましたが、昨年11月に日本語を含めた7か国語に対応開始したと発表があり、話題になりました。

例えばzoomでのMTG内容や、セミナーの録音、カスタマーサポートのやり取りなどを簡単に文字起こしできるようになり、様々なビジネスシーンで重宝されるようになりました。文字起こしの正確さも評価されており、簡単な手直しをするだけで十分にテキスト化できるという声も多いです。

Amazon transcribeについて会話をすると、「AWS」「S3」という言葉が頻出するのですが、Amazon transcribeについて深く理解するためにもこのワードに関して説明をしておきます。

最新情報をいち早くお届け!

無料会員登録していただくと、
会員限定の特別コンテンツ記事を最後まで
読むことができます!
その他、更新情報・イベント情報を
お届けいたします。

「AWS」「S3」についても理解しよう

理解しよう

Amazon transcribe について語る際には、「AWS」と「S3」というワードは欠かせないものとなります。まずAWSというのは、Amazon Web Serviceの略で、Amazonが提供しているクラウドサービスです。

対して「S3」というのは、AWS内のサービスの1つであるクラウドストレージというものに分類されます。Amazon transcribeを利用するには、まずAWSのアカウントを作成し、S3を利用できるようにする必要があります。そして、音声ファイルをS3内に保存します。ここまで来れば、Amazon transcribeの使用準備は整いました!

実際にAmazon transcribeを利用してみよう

START
AWS、S3の準備が整ったところで、実際にAmazon transcribeを使用してみます。細かい設定方法を記載すると長くなりますので、設定作業に関しては下記を参考にしてください。

記事:Amazon Transcribe を使用して音声を文字起こしする方法 | AWS

動画:Amazon Transcribeを使った文字起こしをやってみた – 動画編集時のテロップ入力が楽になるぞ!

https://youtu.be/NqubYymvSO0

Amazon transcribeで文字起こしを行うと、60分音声が約15分ほどでテキスト化完了します。多少誤字などもありますが手直しで修正できるレベルの量になります。あらかじめ専門用語などは登録をしておくことで、システム自体が音声を読みやすくなる機能もあるようです。Amazon transcribeがあれば、会議の議事録やセミナーの文字起こしなど、単純作業にかかっていた時間を大幅に削減できます。

利用者の声

利用者の声
Amazon transcribeは、昨年よりたくさんの人に利用され、利便性に関しても多くの意見があがっています。個人的には、利用シーンによって満足度評価が変わっているようにも思います。

ポジティブな声

文字起こしの精度に関しては、若干課題がありつつも、全体の作業量としてはかなり軽減されたという感想が多いです。

ネガティブな声

 

高い精度での文字起こしを望む人からは、Amazon transcribeの機能について不満の声もあがっています。会議などの音声を完璧に文字起こしするにはまだ現状の機能では難しいです。

ただ、微修正を加えれば、資料として提出できるレベルまでは簡単に持っていけるので、従来の文字起こし作業の時間短縮ができることは間違いありません。

Amazon transcribe がもつ優れた機能

Amazon transcribe がもつ優れた機能

Amazon transcribeはただ単に文字起こしをする機能ではありません。しっかり読みやすくなるよう多様な機能が備わっています。

タイムスタンプ機能

タイムスタンプ

Amazon transcribeでは、文字起こしをしたすべての単語に、タイムスタンプが付与されます。実録音と照らし合わせながら、内容の確認を行うことができます。

句読点や書式の自動追加

句読点の追加

Amazon transcribeは、単純に録音データを文字起こしするのではなく、しっかり句読点などもいれ、読みやすくなるようになっています。読みやすいことから、修正にかかる時間も減り、結果的に、大幅な作業工数削減になります。

従来の録音データの文字起こしサービスには、なかなかなかった機能でもあるため、最先端の認識機能であると言えます。

複数話者の会話認識機能

会議

Amazon transcribeは複数人の会話を認識することができます。従来の録音データ文字起こしサービスは、特定の人物の声しか結果反映できないというケースが多々ありましたが、機械学習が進み、複数人の会話も、かなり高い精度で文字起こしが可能になりました。会議や、動画、テレビ番組の文字起こしも正確に文字表示できるようになるかもしれません。

語彙のフィルタリング機能

フィルタリング

Amazon transcribeでは、アダルトコンテンツや不快な表現に該当する語彙を自動でフィルタリングしてくれる機能があります。事前に管理画面にて表示結果から削除する単語を設定しておくことも可能です。

文字起こしの時間が不要になる未来が来る

文字起こしの時間が不要になる未来が来る

まだ完ぺきとは言えませんが、かなり高い精度で自動的に文字起こしをしてくれる時代が来ています。今まで単純作業に使っていた時間が自動化され、より、思考を伴う作業に時間を使うことができるようになります。会議、セミナーだけでなく、あらゆるシーンでAmazon Transcribeが使われるようになるといいなと思います。

LINEで送る
Pocket

  • この記事を書いた人
  • 最新記事