技術イベントのメモはOpenAI WhisperとGemini CLIに任せる
BRANK

イベントの内容覚えてますか?イベントに参加しても内容を覚えていることって少なくないですか?イベントに参加しただけで満足して、特に生産的な活動に活かすことなく終わってしまうことがあると思います。また、登壇者の話を必死にメモしようとして、肝心な内容を聞き逃してしまうこともよくあります。イベント参加は、個人的には学習のモチベーションアップに繋がるので良いのですが、せっかくなら学んだ内容をしっかり定着させたいと思いました。そこで、YouTubeや現地の音声を文字起こしして振り返りたいと考えたものの、理想的なツールが見つからなかったので自分で作ってみることにしました。この記事では、OpenAIの音声認識モデル「Whisper」を使って、音声をリアルタイムで文字起こしする簡単な機能を自作したので紹介します。マイクで音声を拾うところから、YouTubeの音声を文字起こしするところまで一通りやります。最後は、文字起こしした内容をAIで要約させてみます。!Whisper良さそうやん使ってみよ!っと気軽に作ったもので、筆者はAIや音声認識技術に詳しくありません。!イベントによっては情報の記録・共有が禁止されている場合があります。使用する場合は…

zenn.dev
Related Topics: AI