Live Transcribe
- 2026/02/16 06:19
- カテゴリー:PC・ツール・サイト
スマホのアプリその36
Googleの音声文字変換アプリ「音声文字変換&音検知通知」をインストール。この長ったらしい名前より、"Live Transcribe"の方でよく知られているかもしれない。
周囲の音声をリアルタイムで文字起こし、高精度、無料、120以上の言語に対応、会話の文脈を理解して自動修正、多人数での会議や日常会話の補助ツール、など、アプリ紹介にはそんな言葉が並んでいる。
実際に試してみた。「多人数」での討論番組「日曜討論」(NHK総合など、2/1 9時)を文字起こし。高市首相の代わりに出席した田村憲久氏(自由民主党政調会長代行)が述べているところへ、原口一博氏(減税日本・ゆうこく連合共同代表)が割り込んで来た場面。複数人の言葉が交錯する。これをどう文字起こししたか、
は、次のコーナー。 そもそも サラリーを落とす 税 なんです。雇用を不安定にする質問されたからでも全然 答えないじゃないですか。あなた方は だ って社会保険料って言ってるけど、社会保険料のない会社をどんどんどんどん増やす。
と、なんとなく雰囲気は伝わってくるが、よく判らない。他の文字起こしツールでの結果と比べると、かなり欠落していることが確認できる。例えば、nottaへ同じ部分の音声ファイルをアップロードして文字起こししてみると、
話者1:三兆円なので、消費税減税すべきでは?と聞きます。はい、じゃあ次のコーナーに進みます
話者2:すいません。もともと、この消費税というのは、そもそもサラリーを落とす税なんです。雇用を不安定にする。
話者1:...さん、あの、質問を示されてから。
話者2:いや、でも全然答えないじゃないですか。あなた方は、だって社会保険料って言ってるけど、社会保険料のない会社をどんどんどんどん増やすんです。
十分ではないけれど話者の区別をしてくれるし、頑張って言葉も拾っている。が、実際に聞こえて来る音声との乖離は大きい。もう一つ、Gemni(Model Pro 3 Preview)で、同じようにやってみた。これはかなり優秀。拾っている言葉は95%くらいの精度か。人物も特定している。割り込まれて、慌てている司会者の様子もよく捉えている。
原口:たくさんあるので、消費税減税すぐやるべきです。
司会者:はい、はい、それじゃあ次のコーナー進みます。
原口:うわ、すいません。もともとこの消費税っていうのは、そもそもサラリーを落とす税なんです。雇用を、不安定にする税—
司会者:原口さん、あの、あの、質問し、あ、指名されてから。
原口:いや、でも全然答えないじゃないですか。あなたがたは、だって社会保険料って言ってるけど、社会保険料のない会社をどんどん増やして—
という具合に、文字起こし比べをしてみた。かなり精度に問題のある「音声文字変換&音検知通知」(Live Transcribe)でも、使える用途はありそうな気がする。なにせ、スマホのアプリなので手軽で良い。
# 高市首相のいない日曜討論(サイト内)