AI創作ラボ

AIで小説を書くための実践ガイド

2026-04-02AI小説 複数キャラ 会話 書き分け

AI小説で複数キャラの会話を書き分ける方法——「発話マトリクス」で3人以上の声を制御する

AI小説で複数キャラの会話を書き分ける方法——「発話マトリクス」で3人以上の声を制御する

シェアオフィスの昼下がり。小説家志望の椎名、イラストレーターの戸塚、編集者の南條。3人の会話シーンをChatGPTに書かせた。

「今日の打ち合わせ、何時からでしたっけ」と椎名が言った。 「確か3時からだったと思います」と戸塚が答えた。 「そうですね、3時で合っていますよ」と南條が頷いた。

3人全員が丁寧語。全員が同じ長さのセリフ。名前を消したら誰の発言か区別がつかない。

2人の会話なら口調ルールで書き分けられる。だが3人以上になると、口調だけでは足りない。AIには「全員に均等に喋らせよう」とする傾向がある。この傾向を壊す設計が要る。

同じ3人に、この記事で解説する「発話マトリクス」を適用した結果がこちら。

戸塚がタブレットを放り出した。 「ねえ打ち合わせ何時だっけ、3時? 2時? あ、てか南條さんから来たメッセージどこ——」 「3時」 南條はコーヒーを啜りながら、戸塚の検索を待たなかった。 椎名はキーボードの上で指を止めていた。 「……あと、40分」 「40分!? まだ何も描いてないんだけど!」 南條が椎名を見た。椎名は目を逸らした。 「椎名、原稿は」 「……半分」 「半分か」 南條はもう一口コーヒーを飲んだ。それ以上は聞かなかった。

戸塚は早口で情報を詰め込む。南條は短く確認する。椎名は言葉が途切れる。この差を生んでいるのが発話マトリクス——キャラごとの発話量・反応速度・沈黙の意味を一覧表で設計する方法だ。

2人の会話と3人以上の会話は「別の技術」が要る

AI小説のセリフを自然にする方法では、セリフの長さ上限・返しのパターン・禁止表現で2人の会話のテンポを制御する技術を解説した。AI小説の口調が崩れる3つの原因では、口調ルールの4点セット(一人称・語尾・セリフ例・禁止語)でキャラの声を固定する方法を扱った。

これらは2人の会話で有効に機能する。だが3人以上になると、別の問題が発生する。

AIが3人以上の会話で陥る3つのパターン

均等配分。AIは全キャラに同じ分量のセリフを割り振る。3人なら各33%ずつ。現実の会話でそんなバランスは存在しない。教室でもオフィスでも、よく喋る人とほとんど喋らない人がいる。

順番発話(ラウンドロビン)。AがBに話し、BがCに話し、CがAに話す。全員が律儀に順番を守る。会話ではなく、朝礼のスピーチ回しだ。

性格の中央回帰。3人以上のキャラ設定を同時に渡すと、AIが全員の口調を「平均化」する。早口キャラの発話が短くなり、寡黙キャラが急に饒舌になる。尖った性格が丸まり、全員が似たトーンに収束する。

2人の会話では「誰が喋って誰が聞くか」は自動的に決まる。3人以上では**「誰が黙るか」を明示的に設計しないと**、AIは全員を喋らせてしまう。

複数キャラの書き分けは「発話マトリクス」で設計する

発話マトリクスとは、キャラごとの発話量・反応速度・沈黙の意味を表で定義する設計手法。口調ルールが「何を言うか」を制御するのに対し、発話マトリクスは「いつ、どれだけ、誰に向かって喋るか」を制御する。

発話マトリクスの3要素

要素1: 発話量。1ターンあたりの文字数と、シーン全体での発言回数の比率を決める。

| キャラ | 1ターンの文字数 | シーン内発言比率 | |---|---|---| | 戸塚遥 | 30〜60字(長い。途切れない) | 50% | | 南條一真 | 5〜15字(短い。確認のみ) | 30% | | 椎名朔 | 3〜10字(極短。単語で返す) | 20% |

この比率を明記するだけで、AIの「全員均等に喋らせる」傾向が崩れる。

要素2: 反応速度。質問や出来事に対して、どのタイミングで反応するか。

  • 戸塚: 即座に反応。相手の話が終わる前に被せることもある
  • 南條: 一拍置いてから返す。相手の言葉を反復して確認してから自分の意見
  • 椎名: 遅い。全員が喋り終わってから、ぽつりと核心を突く

反応速度の差がシーンにリズムを作る。全員が同じ速度で反応すると、会話が機械的に見える。

要素3: 沈黙の意味。同じ「……」でも、キャラによって意味がまったく違う。

  • 戸塚の沈黙: 異常事態。普段喋り続ける人が黙った=よほどのことがあった
  • 南條の沈黙: 計算中。次の一手を組み立てている
  • 椎名の沈黙: デフォルト。黙っているのが通常。喋ること自体が特別な意味を持つ

沈黙の意味を定義すると、AIは「……」の前後に異なる地の文を書くようになる。戸塚が黙れば周囲が気づく描写が入り、椎名が口を開けば他の2人が一瞬止まる。

プロンプトへの落とし込み

この3要素を、口調ルールとは別のブロックでプロンプトに入れる。

【発話マトリクス——グループ会話のルール】

■ 発話量:
- 戸塚: 1ターン30-60字。シーンの50%を占める。遮りあり
- 南條: 1ターン5-15字。シーンの30%。確認・要約が多い
- 椎名: 1ターン3-10字。シーンの20%。単語か体言止め

■ 反応順序:
- 出来事が起きたら: 戸塚→南條→椎名 の順で反応する
- 全員が同時に喋らない。必ず1人は黙っている

■ 沈黙ルール:
- 戸塚が黙ったら異常事態。他のキャラが気づく描写を入れる
- 南條の沈黙は短い。すぐ次の行動に移る
- 椎名が喋り出したら、他の2人は一瞬止まる(珍しいから)

口調ルールの4点セットと発話マトリクスは別レイヤーの問題。口調ルールが「声」を、発話マトリクスが「会話の力学」を作る。2つを重ねて初めて、3人以上の会話が生きたやりとりになる。

人数別のグループ会話構造——3人・4人・5人以上

3人会話: 2人が話し、1人が観察する「三角構造」

3人の会話で最も効果的なのが、2人がメインで話し、1人が観察者になる構造。

【3人会話の構造ルール】
- メインの会話は2人で回す
- 3人目は観察者。地の文で反応を書く(表情、動作、視線)
- 3人目が発言するのはシーンの転換点のみ
- 観察者は場面ごとにローテーションしてもよい

冒頭のシーンがこの構造を使っている。戸塚と南條がメインで会話し、椎名は観察者として「……あと、40分」と転換点でだけ口を開く。椎名の一言で場の空気が変わり、戸塚がパニックになる。

観察者ポジションのキャラは、セリフがない代わりに地の文で存在感を出す。「椎名はキーボードの上で指を止めていた」——この一文で、椎名が話を聞いていること、手が止まっていること(=原稿が進んでいないこと)が伝わる。

4人会話: 「2対2」か「3+1」で管理する

4人になると管理の難度が跳ね上がる。AIに4人を均等に喋らせると、読者は途中で誰が誰か見失う。

2対2の対立構造: 意見の異なる2人ずつのペアを作り、ペア内で補い合いながら対話させる。ペアAの1人が主張し、もう1人が補足する。ペアBも同様。全員が喋るが、発言の「方向」がペアごとに揃っているので混乱しない。

3+1構造: 3人が会話し、1人は完全な観察者。その1人が最後に一言で場の流れを変える。BLなら、3人が議論している横で黙っていたキャラが核心を突く——この構造は読者への「伏線」にもなる。

【4人会話の構造ルール】
- 4人が均等に喋る場面を絶対に作らない
- 1シーン内でメインの発言者は最大3人まで
- 4人目は動作・表情だけで存在感を出す
- フォーカスキャラ(その場面で最も感情が動くキャラ)を1人決める

5人以上: フォーカスを1人に絞る「カメラワーク」

5人以上の会話をAIにそのまま書かせると、ほぼ確実に破綻する。誰が何を言ったか追えなくなる。

解決策はカメラワークの考え方。映像作品のように、フォーカスするキャラを1〜2人に絞り、残りは「背景」として処理する。

【5人以上の会話ルール】
- フォーカスキャラは1-2人。この2人のセリフと反応だけを詳細に書く
- 背景キャラのセリフは要約(「周囲がざわついた」「誰かが笑った」)
- 全員のセリフを個別に書かない
- シーンを分割し、フォーカスを切り替える

二次創作やグループBLで5人以上のキャラが出る場合も、1シーンのフォーカスは2人まで。シーンを分割して、次のシーンで別の2人にフォーカスを移す。全体を読み終えたときに全員の存在感が残る構成になる。

実践テンプレート——3キャラ会話のプロンプト全文

冒頭の椎名・戸塚・南條の会話を生成した完全なプロンプトを公開する。ChatGPTでもClaudeでもそのまま貼り付けて使える。

あなたは創作小説の執筆アシスタントです。
以下のルールを【絶対に】守って、3人の会話シーンを書いてください。

【キャラクター口調ルール】

■ 椎名朔(25歳・小説家志望)
- 一人称: 使わない(主語を省略する)
- 語尾: 体言止め。「……」で終わることが多い。言い切らない
- セリフ例:
  1.「……半分」(状況報告。最低限の単語だけ)
  2.「わからない。まだ」(問い詰められたとき。語順が逆になる)
  3.「……そう、かも」(同意するとき。確信がない)
- 禁止: 説明的な長文。感嘆詞。「すごい」「なるほど」

■ 戸塚遥(23歳・イラストレーター)
- 一人称: あたし
- 語尾: 「〜でさ」「〜なんだけど」「〜じゃん」
- セリフ例:
  1.「ねえ聞いて、今日さ——」(話の切り出し。常に唐突)
  2.「え待って、それってつまり——」(驚いたとき。言葉が追いつかない)
  3.「いやだからさ、あたしが言いたいのは——」(反論。最後まで言い切れない)
- 禁止: 丁寧語。短い返事(常に長く喋る)

■ 南條一真(29歳・編集者)
- 一人称: 俺
- 語尾: 「〜だな」「〜か」(確認と断定のみ)
- セリフ例:
  1.「3時だ」(事実の確認。余計な言葉がない)
  2.「半分か」(相手の言葉を繰り返す。判断材料にしている)
  3.「で、どうする」(結論を求める。感情を挟まない)
- 禁止: 感情的な言葉。曖昧な語尾。「〜かもしれない」

【発話マトリクス——グループ会話のルール】

■ 発話量:
- 戸塚: 1ターン30-60字。シーンの50%。遮りあり
- 南條: 1ターン5-15字。シーンの30%。確認・要約が中心
- 椎名: 1ターン3-10字。シーンの20%。単語か体言止め

■ 反応順序:
- 出来事が起きたら: 戸塚→南條→椎名 の順で反応
- 全員が同時に喋らない。必ず1人は黙っている

■ 沈黙ルール:
- 戸塚が黙ったら異常事態。他のキャラが気づく描写を入れる
- 南條の沈黙は短い。すぐ次の行動に移る
- 椎名が喋り出したら、他の2人の動作が一瞬止まる

【演出ルール】
- 感情は説明しない。動作・沈黙・セリフだけで表現する
- 「嬉しかった」「悲しかった」等の心情説明は禁止
- 3人の中で最も感情が動いているキャラの描写を厚くする
- 地の文は動作・視線・物音のみ。「思った」「感じた」は禁止

このプロンプトに**「現在の状態」を追加**して使う。シーンを変えるたびに更新する部分だ。

【現在の状態】
- 場所: 駅前のシェアオフィス。昼下がり
- 状況: クライアントとの打ち合わせが40分後に迫っている
- 椎名: 原稿が半分しか終わっていない。焦りを見せないが指が止まっている
- 戸塚: ラフが1枚も完成していない。声が上ずり始めている
- 南條: 2人の進捗を把握している。追い詰めはしない
- フォーカス: 椎名(原稿の遅れに対する自責と、それを隠す態度)

テンプレートの構造は3つのブロックに分かれている。

  1. 口調ルール: 各キャラの「声」を定義(ChatGPTキャラ設定プロンプトの6項目テンプレートの口調セクションがベース)
  2. 発話マトリクス: 会話の「力学」を定義(本記事のオリジナルフレームワーク)
  3. 演出ルール+現在の状態: シーンの「空気」を定義

口調ルールだけでは3人全員が同じ分量で喋る。発話マトリクスを重ねることで、「戸塚が喋り、南條が短く返し、椎名は黙っている」という力学が生まれる。

キャラ名と設定値を自分のキャラに差し替えれば、そのまま使える。口調ルールの4点セットを精密に設計する方法はBL Prompt Kit(BOOTH)のキャラ設定シートで提供している。

群像会話でよくある5つの失敗と対処法

失敗1: 全キャラが均等に喋る

AIのデフォルト動作。3人なら各33%、4人なら各25%ずつセリフが配分される。全員が同じ量を喋ると、キャラの個性ではなく「情報の分配」に見える。

対処: 発話マトリクスで比率を数値で明記する。「最も喋るキャラ」と「最も黙るキャラ」の差を大きく取る(50%と10%など)。「均等に配分しない」と明示的に書くことも有効。

失敗2: ラウンドロビン(順番に発言)

A→B→C→A→B→C……と機械的に全員が順番に喋る。司会進行のように整然としていて、会話としては死んでいる。

対処: 「毎回全員が発言しなくてよい」と指定する。1ターンで2人だけが喋り、1人は動作描写のみのパターンを入れる。「反応順序」を設定しつつ「2ターンに1回は誰かが黙る」ルールを加える。

失敗3: 途中でキャラの声が混ざる

3人目以降のキャラが、他のキャラの口調に引きずられる。全員が中間的なトーンに収束する問題。2人でも起きるが、3人以上だと顕著になる。

対処: 口調ルールを並列対比形式で書く。3人分を並べて「この3人は全く違う喋り方をする」とAIに認識させる。長い会話では4〜5ターンに1回、口調ルールを再掲する指示を入れると安定する。口調維持の詳しいテクニックはAI小説の口調が崩れる原因と対策を参照。

失敗4: 地の文が感情説明に逃げる

会話シーンなのに「椎名は申し訳なさそうに思った」「戸塚は焦りを感じた」と地の文が説明に走る。3人以上だと、AIが「この人は今こう思っている」と全員分の内面を解説し始める。

対処: 演出ルールの「心情説明禁止」に加えて、「地の文は動作・視線・物音のみ」と限定する。「思った」「感じた」「考えた」をプロンプトの禁止語リストに入れる。

失敗5: フォーカスが分散して誰にも感情移入できない

3人全員の反応を均等に描写して、読者がどのキャラに感情移入すべきか分からなくなる。群像劇の失敗パターン。

対処: 「現在の状態」でフォーカスキャラを1人指定する。「このシーンでは椎名の内面の動きを中心に書く。他の2人は外から見た描写のみ」と明記する。フォーカスキャラだけ地の文の描写を厚くし、他のキャラはセリフと動作だけで書く。

まとめ

AI小説で3人以上の会話を書き分けるには、個別の口調ルールだけでは足りない。

  • 発話マトリクス(発話量・反応速度・沈黙の意味)で会話の「力学」を設計する
  • 三角構造(2人が話し、1人が観察する)で3人会話のシーンを管理する
  • 均等配分を壊す——最も喋るキャラと最も黙るキャラの差を大きく取る
  • フォーカスキャラを1人決め、内面描写はその1人に集中させる

口調ルールが各キャラの「声」を作り、発話マトリクスが「誰がいつ喋り、誰が黙るか」を制御する。この2層を重ねて初めて、群像会話が「3人の別人がそこにいる」読み心地になる。

本記事のテンプレートで使った口調ルールの4点セット(一人称・語尾・セリフ例・禁止語)は、BL Prompt Kit(BOOTH)のキャラ設定シートをベースに設計している。フルキットには攻め受けの書き分けテンプレート、口調キーププロンプト、演出ノートも含まれている。

作ったキャラ設定をクラウドに保存して複数のシーンで使い回すなら、キャラノート(β)で設定シートを管理できる。シーンごとに「現在の状態」だけ書き換えて、口調ルールと発話マトリクスはそのまま再利用する——この運用が、群像会話を安定して量産するコツだ。