ツール

ChatGPTを使うようになって音声書き起こしのフローが変わった

  1. HOME >
  2. ツール >

ChatGPTを使うようになって音声書き起こしのフローが変わった

ChatGPTを使うようになって音声書き起こしのフローが変わった

ChatGPTで音声書き起こしに変化

ChatGPTがすごい点はいくつもありますが、音声書き起こしのフローが完全に変わったので、どう変わったのかちょっと書いてみます。

zoomの録画から音声を書き起こして原稿を書くことが多いのですが、書き起こしに使っていたのが、Vrew。韓国の会社が開発しているツールで、何時間書き起こしても無料でした。しかし、2023年5月、ついに有料フェーズに転換しました。

vrewの料金プラン

Vrewの料金プランです。120分まで無料。

有料転換が来たらVrewに課金するつもりだったのですが、ChatGPTを使うようになったことで、Vrewの使用そのものをやめてしまいました。というのも、ChatGPTを使うことでVrewを使うことで起こっていた作業自体がなくなったからです。書き起こしのフローがChatGPTを挟むことで簡易化されたんです。

音声書き起こしフローの変化

元のフローはこんな感じです。

これまでの書き起こしフロー

Vrewで書き起こし ⇒ 手打ちで句読点や改行を微調整 ⇒ 原稿用の素材として使用

で、こちらがChatGPT導入後のフローです。

ChatGPT導入後の書き起こしフロー

動画か音声データをyoutubeにup ⇒ ChatGPTの拡張ツールでテキスト化 ⇒ 句読点や文章の軽い調整はChatGPTにやってもらう ⇒原稿用の素材として使用

Vrewの書き起こしは、動画の字幕用のテキストとして書き起こされることもあって、句読点なし、細かい改行ありでテキスト化されます。そのため、読み物としての原稿にするには、ここに句読点を打って、日本語として整えることが必要です。それが苦痛でした。

ChatGPTを入れることで作業のステップそのものは増えていますが、面倒な「手打ちで句読点や改行を微調整」の過程をChatGPTが代替してくれます。頼むときれいに整形してくれるのは、本当にありがたい。この一点だけでも、私にとってChatGPTを使う理由になるぐらい。

書き起こしはYouTube & Article Summary powered by ChatGPTを使う

Vrewを使わなくなった分、どこで文字を起こしているかというと、Youtubeです。書き起こしをするには、zoom等の録画動画をYoutubeにupし(自分のアカウントに非公開で)、ChatGPTのボタンをクリックすると一瞬でテキスト化されます。

それを実現するのが、Google Chromeの拡張機能「YouTube & Article Summary powered by ChatGPT」です。Youtubeにupされている動画を一瞬でテキスト化してくれます。ChatGPTをお使いの方で、まだ使っていない方にはおすすめの機能なので、ぜひ一度試していただきたいです。
拡張機能:YouTube & Article Summary powered by ChatGPT>>

動画の解説を見るとわかりやすいです。43秒から開始するとすぐに説明を見られます(リンク先は43秒開始に設定しています)。

ChatGPTの魔法のプロンプト

Youtubeでテキスト化した原稿は、そのままでは残念ながら使いにくいので、整形が必要です。

それも、ChatGPTで魔法のプロンプトを唱えれば、一瞬で読みやすい日本語に整えてくれます。ただし、文字数に制限があるので、作業が何回か必要になりますが、句読点を2時間分のテキストに自力で打ち続けるよりはマシ。

魔法のプロンプトとは、

あなたはプロの校正者です。次の文章はトークの書き起こしです。適切な場所に句読点や改行を入れてください。

の一文を入れて、文章を整形してもらいます。どんなふうに変わるかの例はこちらです。

Before:プロンプトを入れた元の文章

ChatGPTプロンプト例

これがyoutubeで吐き出された、元の書き起こし文です。

After:吐き出された文章

ChatGPTプロンプト例02

このトークは2人の話者がいる文章で、黄色のマーカー部分が人物A。マーカー外が人物Bです。余分な改行を削除した上で、人物ごとに分けて、文章をまとめ、改行してくれています。

会話文を会話としてまとめて、改行までしてくれるの、便利だと思いませんか。

ChatGPTが一度に整形してくれる文字数の上限

テキストの整形はChatGPTのGPT-4(※月20ドルの課金が必要)で行っていますが、GPT-4は3時間で25回しか投稿できず、一度に対応してくれる文字数は体感値で700~800文字ぐらいまで。800字を超えると容量オーバーで全文を処理してくれません。だいたい700文字ぐらいにするときれいに全部処理してくれるイメージです。なので、1回の書き起こしが3時間以内に終わらないこともあります。

GPT-4を使い切ってGPT-3.5でやってみると、日本語の処理精度がぐっと下がります。内容によって対応できるときとできないときがあるので(GPT-3が学習している簡易的な内容なら対応してもらえる感じ。専門分野は全然ダメ)、そこは割り切って使う必要があります。

GPT-4を効率よく使うには、今のところ録画時間・対応時間・処理回数を計算してやらないといけない部分はありますが、文字数や処理回数については今後変わっていくこともあると思うので、期待しています。

© 2023 matty3.com All rights reserved.