字幕先行編集で破綻しないナレーション設計術:多言語展開を見据えた尺・間・情報密度の整え方

字幕先行編集で起きる「ナレーションの事故」をどう防ぐか
企業VP、製品紹介、展示会映像、eラーニングなどで増えているのが、「まず字幕を確定し、その後でナレーションを収録する」進行です。多言語展開や監修都合を考えると合理的ですが、音声の立場から見ると、この方式には独特の落とし穴があります。代表的なのは、字幕としては成立していても、声に出すと不自然に長い、情報が詰まりすぎている、映像の切り替わりに対して呼吸が置けない、といった問題です。
編集側では「1枚のテロップに入る文字数」と「画面上の表示時間」を基準に整えていても、ナレーションはさらに「意味のまとまり」「息継ぎ」「語尾処理」「固有名詞の視認性」といった、耳の処理速度を前提に組み立てる必要があります。ここを無視すると、収録で無理に詰め込む、あるいは編集で不自然にタイムストレッチすることになり、最終的に映像全体の品位が落ちます。
今日は、字幕先行の案件で破綻しないための、かなり実務的な設計ポイントを整理します。
文字数ではなく「発話負荷」で台本を見る
ナレーション尺の相談で、いまだに「この字幕は25文字だから大丈夫」と判断される場面があります。しかし実際には、同じ25文字でも負荷は大きく変わります。たとえば、漢語が連続する説明文、アルファベットや製品型番を含む文、数字の桁が多い文、助詞が少なく名詞が連なる文は、見た目以上に発話負荷が高いです。
私が現場でまず確認するのは、文字数ではなく次の3点です。
1つ目は、1センテンス内に何回アクセントの山が来るか。
2つ目は、初見で読み間違えやすい語があるか。
3つ目は、映像の切り替わりと意味の切れ目が一致しているか。
たとえば字幕上では一文に見えても、音声では「導入」「要点」「補足」に分けたほうが聞き手の理解は安定します。逆に、字幕を細かく分けすぎると、ナレーション側では毎回語尾を立てる必要が出て、説明全体がせわしなく聞こえます。つまり、字幕の区切りとナレーションの呼吸単位は、似ているようで別物です。
多言語前提なら、日本語の時点で“伸びしろ”を残す
多言語化を前提にした映像では、日本語版をぴったりの尺で作るほど、後工程が苦しくなります。英語、ドイツ語、スペイン語などは、日本語より発話時間が伸びるケースが少なくありません。逆に中国語は短く収まることもありますが、その分テンポ感が変わります。
このとき重要なのは、日本語版を「完成形」として詰め切らないことです。私はディレクション時、各セクションに数%の余白を残す設計を勧めています。具体的には、カット頭・尻の無音を完全には削り切らない、Bロール区間に説明の逃げ場を作る、重要な図版ではナレーションを一文減らして視認時間を優先する、などです。
特に製品紹介映像では、画面にUI、注釈、数値、ロゴが同時に出ることがあります。この状態でナレーションまで情報過多にすると、視聴者は「聞く」「読む」「見る」を同時処理できません。多言語対応以前に、単一言語でも理解効率が落ちます。字幕先行案件ほど、音声は“全部を説明しない勇気”が必要です。
収録前にやるべきは、読み合わせではなく「詰まりポイントの地図化」
効率の良い現場は、単に通し読みをするのではなく、事前に「どこで事故るか」を見える化しています。私は台本に対して、以下のような印を入れることが多いです。
- 息継ぎ必須ポイント
- 固有名詞・型番・英字略語
- 映像カット変わりの0.3秒前後
- 感情を乗せるより、明瞭性を優先すべき箇所
- 後で差し替えが発生しそうな文
これを収録前に共有しておくと、演者は「どこを表現し、どこを正確に処理するか」を判断しやすくなります。ディレクターにとっても、「なぜここは少し平たく読むのか」「なぜここで間を取るのか」を説明しやすい。結果として、抽象的な“いい感じでお願いします”が減り、リテイクの質が上がります。
また、字幕先行案件では、収録後に1フレーズだけ文言差し替えが入ることも珍しくありません。そのため、前後のトーン接続がしやすいよう、差し替え候補の文は少し独立性の高い読みで押さえておくと、編集が非常に楽になります。
AI音声との比較で見える、人間ナレーションの設計価値
最近は仮ナレや多言語展開でAI音声を使う案件も増えました。ここで誤解されやすいのは、「AIで読めたから、この台本は人間でも問題ないだろう」という判断です。実際には逆で、AIは極端に詰まった原稿でも、一定の速度で“読めてしまう”ことがあります。しかし、人間の耳にとって自然か、映像の切り替わりと調和しているか、重要情報に重みづけができているかは別問題です。
人間ナレーションの価値は、感情表現だけではありません。情報の優先順位に応じて、わずかに助詞を軽くする、固有名詞の前に認知の余白を作る、説明が重い箇所では語尾を処理しすぎず次へ流す、といった微細な設計にあります。字幕先行編集では、この“情報交通整理”の力が特に効きます。
AIを使うなら、仮組み段階で「どこが長いか」を測る用途には非常に有効です。ただし、最終判断は必ず人間の耳で行うべきです。見落としやすいのは、秒数ではなく理解速度のほうだからです。
映像担当者が押さえるべき、実務上の最適解
字幕先行でナレーションを成功させるには、台本・編集・収録を別工程として扱わないことが大切です。実務上、次の4点を押さえるだけでも事故率は大きく下がります。
1. 字幕確定前に、ナレーターまたは音声ディレクターが1回チェックする
2. 1画面あたりの情報量が多い箇所ほど、ナレーション文を短くする
3. 差し替えが起きそうな箇所は、前後を含めて別テイクで確保する
4. タイムストレッチ前提で収録せず、編集側で逃がせる余白を作る
ナレーションは、映像の最後に“乗せる”要素ではありません。理解の順番、視線誘導、ブランドの温度感を支える設計要素です。字幕先行のワークフロー自体は今後も増えるでしょう。だからこそ、字幕として正しいことと、声として伝わることは別だと認識しておくべきです。
映像が整っているのに、なぜか説明だけが頭に入ってこない。そう感じる作品の多くは、ナレーションが下手なのではなく、設計の段階で“耳の時間”が考慮されていません。字幕先行案件こそ、声のための余白を、最初から設計してください。

小林 将大 Masahiro Kobayashi
Professional Narrator
企業VP、CM、ドキュメンタリーなど年間300本以上のナレーションを担当。
高品質な宅録環境を完備し、スピーディかつ最高水準の音声データを提供します。
あわせて読みたい記事
ブランドは“声”で記憶される――ナレーションが担うコミュニケーションの本質
映像の印象を決めるのは、画だけではありません。ナレーションがブランドの人格を形づくり、信頼や共感を生む仕組みを実務視点で解説します。
BtoB動画の成約率を上げる!「信頼」を築くナレーションの役割
ビジネス向けの解説動画や製品PRにおいて、なぜナレーションが重要なのか。BtoB特有の視聴環境やターゲット心理を踏まえた、声の活かし方を解説します。
ナレーションが変えるブランドイメージ:声が企業の信頼を設計する
声のトーンや話速、抑揚は企業の信頼感や印象形成に直結します。ナレーションがブランド価値に与える影響を科学的視点で解説します。