エントリー

Live Transcribe

スマホのアプリその36
 
Googleの音声文字変換アプリ「音声文字変換&音検知通知」をインストール。この長ったらしい名前より、"Live Transcribe"の方でよく知られているかもしれない。
 
周囲の音声をリアルタイムで文字起こし、高精度、無料、120以上の言語に対応、会話の文脈を理解して自動修正、多人数での会議や日常会話の補助ツール、など、アプリ紹介にはそんな言葉が並んでいる。
 
実際に試してみた。「多人数」での討論番組「日曜討論」(NHK総合など、2/1 9時)を文字起こし。高市首相の代わりに出席した田村憲久氏(自由民主党政調会長代行)が述べているところへ、原口一博氏(減税日本・ゆうこく連合共同代表)が割り込んで来た場面。複数人の言葉が交錯する。これをどう文字起こししたか、
 
は、次のコーナー。 そもそも サラリーを落とす 税 なんです。雇用を不安定にする質問されたからでも全然 答えないじゃないですか。あなた方は だ って社会保険料って言ってるけど、社会保険料のない会社をどんどんどんどん増やす。
 
と、なんとなく雰囲気は伝わってくるが、よく判らない。他の文字起こしツールでの結果と比べると、かなり欠落していることが確認できる。例えば、nottaへ同じ部分の音声ファイルをアップロードして文字起こししてみると、
 
話者1:三兆円なので、消費税減税すべきでは?と聞きます。はい、じゃあ次のコーナーに進みます
話者2:すいません。もともと、この消費税というのは、そもそもサラリーを落とす税なんです。雇用を不安定にする。
話者1:...さん、あの、質問を示されてから。
話者2:いや、でも全然答えないじゃないですか。あなた方は、だって社会保険料って言ってるけど、社会保険料のない会社をどんどんどんどん増やすんです。
 
十分ではないけれど話者の区別をしてくれるし、頑張って言葉も拾っている。が、実際に聞こえて来る音声との乖離は大きい。もう一つ、Gemni(Model Pro 3 Preview)で、同じようにやってみた。これはかなり優秀。拾っている言葉は95%くらいの精度か。人物も特定している。割り込まれて、慌てている司会者の様子もよく捉えている。
 
原口:たくさんあるので、消費税減税すぐやるべきです。
司会者:はい、はい、それじゃあ次のコーナー進みます。
原口:うわ、すいません。もともとこの消費税っていうのは、そもそもサラリーを落とす税なんです。雇用を、不安定にする税—
司会者:原口さん、あの、あの、質問し、あ、指名されてから。
原口:いや、でも全然答えないじゃないですか。あなたがたは、だって社会保険料って言ってるけど、社会保険料のない会社をどんどん増やして—
 
という具合に、文字起こし比べをしてみた。かなり精度に問題のある「音声文字変換&音検知通知」(Live Transcribe)でも、使える用途はありそうな気がする。なにせ、スマホのアプリなので手軽で良い。
 
 

ページ移動

ユーティリティ

« 2026年02月 »

1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
- - - - - - -

検索

エントリー検索フォーム
キーワード

新着エントリー

Live Transcribe
2026/02/16 06:19
AIと冷却ファンの関係
2026/02/14 07:18
成都の切り絵
2026/02/12 06:10
衆院選翌日の報道
2026/02/11 07:13
私に贈る意外な10曲
2026/02/10 06:35
「公共放送を考える」
2026/02/09 06:42
数十年後の日本を救う
2026/02/08 05:41
情報の質を維持する
2026/02/07 05:40
不都合な真実を暴く
2026/02/06 06:12
安保の本質を検証する
2026/02/05 06:37

過去ログ

Feed