字幕先行案件で失敗しないナレーション依頼術:SRT・Vrew・合成音声下書きを人収録へつなぐ実務設計

字幕先行案件で、なぜナレーション依頼が難しくなるのか
企業VP、eラーニング、SNS広告、展示会映像では、近年「まず字幕を作る」進行が増えています。編集側がVrewやPremiereの自動文字起こしで構成を固め、仮の合成音声で尺を確認し、その後に人のナレーションへ置き換える流れです。効率的に見えますが、実はこの工程、ナレーターへの依頼内容が曖昧になりやすいという落とし穴があります。
理由は単純で、字幕は「読める文章」であっても、「話せる文章」とは限らないからです。さらに、SRTの1行ごとの区切りは視認性の都合で決まっていることが多く、呼吸、意味のまとまり、強調位置と一致しません。ここを整理しないまま依頼すると、収録後に「思ったより固い」「字幕尺には入るが映像の温度感に合わない」「AI仮声よりテンポが遅く感じる」といったズレが起きます。
字幕先行案件で重要なのは、原稿を渡すことではなく、字幕・映像・仮音声の役割を分けて伝えることです。
依頼時に分離すべき3つの素材
まず、ナレーターに渡す素材は最低でも次の3系統に分けるのがおすすめです。
1つ目は読み原稿です。これは実際に口に出す最終文面で、句読点、漢字の読み、数字の読み方、固有名詞アクセントを確定させたものです。SRTをそのまま読ませるのではなく、話し言葉として整形した版を用意します。
2つ目は字幕参照データです。これはSRTやVTTなど、画面表示のタイミング確認用。ナレーターに「この改行で切る」と強制するものではなく、「この時間帯にこの情報が出る」という参照資料として共有します。
3つ目は演出参照素材です。仮のAI音声、絵コンテ、完成前動画、BGMラフなどがここに入ります。特にAI音声は便利ですが、その役割は“正解提示”ではなく“尺の仮置き”です。この位置づけを明記しないと、ナレーター側は不自然な抑揚まで模倣すべきか迷います。
依頼文では、「読むべき正本はどれか」「タイミングの基準は何か」「雰囲気の参考は何か」を明確に分けてください。これだけで修正率は大きく下がります。
SRTやVrew原稿を、そのまま収録台本にしない
字幕ツール由来の原稿には、音声収録に不向きな特徴があります。たとえば、1字幕あたりの文字数制限のせいで、不自然な改行が入る。自動句読点で意味の切れ目がずれる。検索性を優先した表記で、実際の発話では言いにくい語順になっている。これらは編集上は成立しても、耳で聞くと負荷になります。
実務では、SRT→収録台本に変換する際に、少なくとも次の3点を整えます。
- 1文を「1呼吸」で読める長さに再編する
- 同音異義語、数字、英字略語に読み指定を入れる
- 強調したい語の前後に、意味上の“間”を作る
たとえば「導入コストを最適化し、業務全体の生産性を向上」は字幕としては問題なくても、音声ではやや硬い。案件によっては「導入コストを抑えながら、業務全体の生産性を高めます」のほうが自然です。ここはコピーの良し悪しではなく、“口に乗るか”の問題です。
AI仮ナレーションを使うなら、比較基準を言語化する
最近は、依頼前に合成音声で仮ナレーションを作る現場が増えました。これは非常に有効ですが、ナレーターへの伝え方を誤ると逆効果です。「このAI音声みたいに読んでください」では、現場の質が落ちます。
人のナレーションへ引き継ぐときに必要なのは、AI音声のどこを採用し、どこを捨てるかの明示です。たとえば以下のように言語化します。
- テンポ感:AI仮音声の90〜95%程度
- 情緒:AIより少し人間味を足すが、売り込み感は抑える
- 間:字幕切替より、映像のトランジション優先
- 強調:名詞を立てるより、ベネフィット語を立てる
この指定があると、ナレーターは“機械の模倣”ではなく“演出意図の再現”に集中できます。ディレクションの本質は、サンプルを渡すことではなく、判断基準を共有することです。
依頼メールに入れるべき実務項目
字幕先行案件では、依頼メールの精度がそのまま収録効率に直結します。最低限、以下は入れてください。
- 使用媒体と想定視聴環境(会場、スマホ、研修、無音視聴前提のSNSなど)
- 収録秒数と、厳守尺か可変尺か
- 収録単位(全文通し、段落ごと、字幕ブロックごと)
- ファイル命名ルール
- リテイク基準(読み間違いのみ無償か、演出変更も含むか)
- 整音の要否(ノイズ除去、ラウドネス、頭尻処理)
- 参考資料の優先順位
特に重要なのは厳守尺かどうかです。人の声は、AIのように均一には詰められません。厳守尺が必要なら、ナレーターは初回から圧縮気味に設計できますし、可変尺なら自然さを優先できます。この一文があるだけで、録り直しの発生率はかなり変わります。
良い依頼は、ナレーターの表現力を広げる
「細かく指定すると、演技の自由を奪うのでは」と心配されることがあります。しかし実際は逆です。曖昧な依頼は、ナレーターに不要な推測を強います。結果として安全運転になり、表現は狭くなります。
一方で、読み原稿、字幕参照、演出参考、尺条件、修正基準が整理されていれば、ナレーターは安心して表現に集中できます。つまり、依頼の精度は管理のためだけでなく、クリエイティブのためにも必要です。
字幕先行、AI下書き、短納期。この3つが当たり前になった今こそ、依頼文の設計が品質を決めます。良いナレーションは、収録ブースで突然生まれるのではなく、依頼の段階でかなりの部分が決まっています。

小林 将大 Masahiro Kobayashi
Professional Narrator
企業VP、CM、ドキュメンタリーなど年間300本以上のナレーションを担当。
高品質な宅録環境を完備し、スピーディかつ最高水準の音声データを提供します。