ナレーション依頼で失敗しない『リファレンス音源』の伝え方:声のトーン・テンポ・感情を言語化する実務フレーム

ナレーション依頼で「参考音源を送ったのに違う」が起きる理由
ナレーション依頼でよくあるすれ違いの一つが、「参考音源は共有したのに、上がってきた読みがイメージと違う」というものです。原因は単純で、依頼側が受け取ってほしい要素を言語化できていないからです。
「この動画みたいに」「こんな感じで」「落ち着いた雰囲気でお願いします」。この伝え方は、一見わかりやすそうでいて、実はかなり曖昧です。ナレーターは参考音源から複数の要素を同時に読み取ります。たとえば、声質、明るさ、年齢感、語尾の処理、情報の立て方、テンポ、間、感情温度、マイク距離感、さらにはBGMとの馴染み方まで含まれます。
つまり、依頼側が「ここだけを参考にしてほしい」と思っていても、受け手は別の要素を重要視してしまうのです。ここを防ぐには、参考音源を“作品全体の雰囲気”として渡すのではなく、“分解した指示”として渡す必要があります。
リファレンス音源は「丸ごと真似る資料」ではなく「比較軸を定める資料」
まず前提として、リファレンス音源はコピーの指示書ではありません。実務では、参考音源を渡す目的を次の3つに限定すると精度が上がります。
1つ目は、声のトーンの基準を決めること。
2つ目は、テンポと間の密度を共有すること。
3つ目は、感情の温度を揃えること。
逆に言えば、これ以外の要素は別途切り分けて伝えた方が安全です。たとえば「この人の声質そのものが好き」は、本人指定でない限り再現不可能です。「このCMの完成版の空気感」は、BGM、SE、映像編集込みで成立しているため、ナレーション単体では同じになりません。
おすすめは、参考音源を1本だけにしないことです。実務では最大3本までに絞り、役割を分けます。
- 参考A:トーン重視
- 参考B:テンポ重視
- 参考C:感情重視
この分け方にするだけで、「Aの落ち着き、Bのテンポ感、Cの熱量で」と整理して伝えられます。
声のトーン・テンポ・感情を言語化する3軸フレームワーク
私が実務でおすすめするのは、以下の3軸で言語化する方法です。
1. トーン:声の明暗・距離・質感
トーンは「明るい/暗い」だけでは足りません。最低でも次の3項目で指定すると、解像度が上がります。
- 明暗:明るめ / 中立 / 落ち着き重視
- 距離感:近い / 標準 / 引いた感じ
- 質感:やわらかい / クリア / ドライ / ぬくもり重視
例:
「明るすぎず中立。距離感は近め。質感はクリアだが冷たくしない」
この一文だけで、かなり方向性が定まります。
2. テンポ:速度ではなく“情報処理の速さ”
テンポは単純な話速だけではありません。1分あたりの文字量や、句読点での間、語尾の抜き方まで含みます。目安としては、落ち着いた企業VPなら300〜360文字/分、情報量の多いサービス紹介なら360〜430文字/分、CM寄りならもっと変動します。
依頼時には次のように指定すると実務的です。
- 全体速度:ゆっくり / 標準 / やや速め
- 間の長さ:短め / 標準 / しっかり取る
- 語尾処理:止める / 抜く / 余韻を残す
例:
「全体は標準より少し速め。文節間の間は短め。語尾は切りすぎず、軽く余韻を残す」
3. 感情:熱量ではなく“温度帯”
感情指定で失敗しやすいのは、「感情を込めて」「自然に」という指示です。これは人によって解釈差が大きい。そこで、感情は“温度帯”として指定します。
- 低温:客観、理知的、静か
- 中温:親しみ、誠実、自然
- 高温:熱意、鼓舞、期待感
さらに、感情の向きを添えると伝わりやすくなります。
- 視聴者を安心させる
- 興味を引く
- 背中を押す
- 信頼を積み上げる
例:
「感情温度は中温。親しみはあるが軽くしない。視聴者を安心させながら信頼を積む方向」
依頼文にそのまま使えるテンプレート
実際の依頼では、以下の形が使いやすいです。
- 参考A:トーンの参考。中立でやや上品、近めの距離感
- 参考B:テンポの参考。標準より少し速く、間は短め
- 参考C:感情の参考。熱すぎず、期待感を静かに上げる
- 今回NG:芝居っぽい抑揚、過度に明るい販促感、語尾の強い断定
この「参考」と「NG」をセットで書くのが重要です。実務では、OK条件よりNG条件の方が精度を上げることがよくあります。
参考音源を渡すときの注意点
YouTubeやCM音源を送る場合は、必ずタイムコードを付けてください。たとえば「0:12〜0:24の入りの温度感」「0:45以降のテンポ感」のように区間指定するだけで、受け手の判断コストが激減します。1本丸ごと送って「全体的に」は、最も危険な渡し方です。
また、BGM付き音源は印象が盛られます。可能なら「声そのものの参考」なのか「作品としての空気感の参考」なのかを明記してください。この区別がないと、ナレーターは不要な演出まで読み取ろうとしてしまいます。
最後に
良いリファレンス音源とは、センスの良い音源ではなく、判断基準が明確な音源です。依頼の精度は「参考の数」ではなく、「分解して伝えられているか」で決まります。
「こんな感じで」を卒業し、
トーンは何か、
テンポはどの密度か、
感情はどの温度帯か、
を言葉にして渡す。
それだけで、初稿の一致率は大きく上がります。ナレーション依頼は、感覚の共有ではなく、解像度の共有です。参考音源は、そのための“素材”として使いましょう。

小林 将大 Masahiro Kobayashi
Professional Narrator
企業VP、CM、ドキュメンタリーなど年間300本以上のナレーションを担当。
高品質な宅録環境を完備し、スピーディかつ最高水準の音声データを提供します。
あわせて読みたい記事
ナレーション原稿の句読点設計術――読点ひとつで変わる映像の印象と、プロの原稿マークアップ実践法
ナレーション原稿は、言葉そのものだけでなく句読点の置き方で印象が決まります。読点の位置による情報の重み付け、尺調整、映像との同期を高める原稿マークアップ術を具体例つきで解説します。
ナレーション収録のNGワード集と言い換え術:薬機法・景表法・放送基準を避けて訴求力を落とさない台本設計
ナレーション収録で問題化しやすいNG表現を、薬機法・景品表示法・放送基準の観点から整理。安全な言い換え例、収録前チェック項目、ディレクション実務まで具体的に解説します。
AI音声で十分…の前に読むべき、指名されるナレーション設計術
AI音声が使える時代でも、なぜプロナレーターが必要なのか。発注者が見落としがちな“人の声でしか解決できない課題”を、依頼設計の視点から具体的に整理します。