NoteBookLMでポッドキャスト生成してMacWhisperで文字起こししながら聴くのが英語のリスニング訓練に良い

最近「生成AIで英語を効率よく勉強するには」というnote記事で、生成AIをリーディング教材として活用するノウハウが紹介されていた。

note.com

これには共感できて、私も「海外ドラマを使って英語学習しよう!」というメソッドに乗って実践しては「ドラマ興味ねぇ〜」と挫折を繰り返すことが多かった。自分の好きなテーマで教材を作ればモチベーションが保ちやすいのはそのとうりだと思う。

私の場合、読み書きよりもリスニングをもっと鍛えたいという気持ちが強い。理由はソフトウェア技術関連の動画やポットキャスト(カンファレンス録画とかOSSのドキュメンタリーとかテックインフルエンサーの配信とか)の音声を即時に理解できるようになりたいから。即時性の高い一次情報が英語かつ音声でしか入手できないことが結構ある。

laiso.hatenablog.com

そこで活用できるのが Google の NoteBookLM。これは研究・ノート作成ツールのノリでウェブやファイルのソースを放り込んでおくとRAGのように使えたりテキストを生成してくれる。

laiso.hatenablog.com

しかし、米国ではどうもテキスト生成よりも「ポッドキャスト生成機能」がウケているようだ。この機能は登録したソースから15分くらいの男女の英会話を自動生成してくれるもので*1、指示次第で「もっと簡単な語彙を使って」とか「10歳児でもわかるように説明して」みたいに自由にカスタマイズできる。要は、好みのトピックを音声にしてくれるAIラジオが手に入る*2

(NoteBookLMの様子。日本語で使うとCSSを完全に理解してるのがちょっと面白い)

この機能でノイズがほとんどない発音と語彙がフラットな英語音声を入手できる。ノイズが少なければ文字起こしも精度が出る。そういうときに役立つのが「MacWhisper」。Appストア版の「Whisper Transcription」や、Gumroadでライセンス販売されてる「MacWhisper」と呼ばれるアプリがあるが、どちらも同じアプリで、最小の文字起こしモデルなら無料で使える。

goodsnooze.gumroad.com

この MacWhisperをリスニング訓練のUIとして活用できる。音声を再生しながら同時に文字起こしを表示してくれるし、セグメント(発言者)ごとにUIが分割されてるので、どこを話してるか一目瞭然。さらに、翻訳も手軽に実現できて、DeepLアプリを別途インストールして⌘+C+Cのショートカットで一行だけ訳したり、macOS標準の辞書機能で⌘+Ctrl+Dでポップアップ表示させて意味を調べられる。再生速度を1.0以下に落とせるので、聞き取りづらい箇所をゆっくり再生しながら「このフレーズってこう発音してるのか」とかチェックできる。

こんな感じで、NoteBookLMのポッドキャスト生成→MacWhisperの文字起こし→DeepLやDictionaryで補助、という流れを作れば、読み書き中心だった生成AIの活用法がリスニング寄りに広がる。ドラマ英会話は視覚情報があるので利点はあるが、このポッドキャスト生成機能は個人的に重宝している。

AI翻訳がリアルタイム化してもう英語勉強する必要なくなるんでしょ? と考える人もいるかもしれないが、先のnote記事を補足すると、英語に限らずに言語バリアになっていた部分が取り払われいろんな言語の情報にアクセスしやすくなることで外国語を理解することのレバレッジが効くようになるから人生の楽しみとして言語学習はやってみていいかなと思ってる。コミックやアニメのオタクコンテンツに触れたい人たちが日本語学習モチベめっちゃある、というのが良い例だと思う。

*1:注意点として日本語対応したら音声も日本語で生成されるようになってしまうかもしれない

*2:まだ試してないが最近のアップデートで会話に参加してこっちの音声を聞きとってくれるようになったらしい https://blog.google/technology/google-labs/notebooklm-new-features-december-2024/