皆さん、国際学会の演題登録や論文投稿の際の手術動画等をアップロードするときに、ナレーションを吹き込むのに困ったことはありませんでしょうか?
私は、本当に英語が苦手なので、何度も何度も経験しています。
英語ナレーション吹き込みに際して、困る点はいくつかあって、
1. そもそも読み原稿が自然な英語なのか不安
2. スライドや動画を作った後に、どのソフトウェアを使って録音するのが効率的かよくわからない
3. 吹き込みしてみたものの、発音・アクセント、息継ぎのポイントなどが正しいのかよくわからない
の3つかなと、私は思っています。
1. については、近年chatGPTを代表とするAIチャット等を利用することで、かなりクオリティ高く仕上げられるようになっているのは、皆さんもご存知かと思います。
2. については、私はパワポの音声入力機能ではなく、動画編集ソフト(自分はFinal Cut Pro)のナレーション機能を使うのが一番使いやすいなと個人的には思っています。ですが、まだまだ検討の余地があるなとは思っています。一番キツいのは、動画が完成した後に、QuickTimePlayer等の再生ソフトに付属する音声録音機能を使い、最初から最後まで一発録音することかなとは思っています。
3. に関して、今回の本題ですが、最近私なりの解決策が見出せたので、共有したいと思います。
最近のAI voice generatorって利用されてますでしょうか??
はじめにお伝えしておきますが、AIの音声をそのままアップロードしようという話ではありません。
以前から、voice generatorの類はいろいろあったんですが、無料では制約が多かったり、発音があまりに不自然で参考にならなかったりで、私はほとんど利用していませんでした。
近年のAIの進化に伴い、最近はAI voice generatorのウェブサイトが増えてきていて、無料版でクオリティがかなり高いんです。
サクッと調べた限りで有名どころが以下のものになります。
* ElevenLabs: https://elevenlabs.kevinstratvert.com
* Murf AI: https://murfai.kevinstratvert.com
* Play AI: https://playai.kevinstratvert.com
* Wellsaid Labs: https://www.wellsaid.io
* Hume AI: https://humeai.kevinstratvert.com
* Speechfi: https://speechify.com/
* Respeecher:https://www.respeecher.com/
* Altered: https://www.altered.ai/
今日、午前中に時間があったので、上記の無料版を全て試してみました。
試したのは最近書いた論文の150 words以内で作成したabstractをコピペして、音声を作ってみました。
Murf AI, WellSaid, Speechify, Respecter, AlteredはL/minを読み間違えていました。本来、litter per minutesと呼んで欲しいところ、エル スラッシュ ミンやエル ミンと発音していました。その他は、きちんとL/minの記載でも正しく発音してくれました。
ほぼ全てのサイトがgoogleアカウント等があればすぐに利用可能ですが、Alteredだけは手入力でアカウント作成が必要でした。
ログイン後、AlteredとWellSaid, Respeecherはメルマガが来るようになったので、うざいです。(即unsubscribeしました)
Respeecherはサイトが重くて、やや使いにくく、音声も不自然な印象を受けました。
Speechifyもちょっと棒読み感がありました。
私の主観ですが、オススメはHume AiとElevenLabsかなと思います。
Murf Aiは、単位の読み間違え以外はクオリティ高いと思います。
AATSはvideo caseをアップするときはナレーションが必須です。
今後もし先生方が国際学会や論文に、ナレーション付きの動画をアップロードする際には、上記のサービスを利用して、正しい発音の練習をしてナレーションを吹き込むことで、よりクオリティの高いものを作って頂ければと思います。