
ソーシャルメディアプラットフォーム(LinkedInやRedditなど)では、シンセティックユーザーとのインタビューについて、特にそのメリットとデメリットに関して、多くの議論が交わされています。
しかし、UXやマーケティングの専門家にとって、本当に誇大広告のようなものなのでしょうか?それとも、この考えの背後に実質的な価値があるのでしょうか?結局のところ、UXリサーチの本質は、実際のユーザーを観察し、インタビューを行い、彼らのペインポイントを理解し、彼らの体験を特別なものにする要因を見出すことです。
従来のインタビューは確かに高額ですが、最終的には人間の相互作用や感情の背後にある微妙な違いや複雑さを発見することができます。
ChatGPTのような生成AIツールは、高度な大規模言語モデルで動作しますが、作成できるAI参加者は集合的な平均を反映するだけで、一般的な層に見られる多様な個性や特異性を欠いています。
しかし、ブランクページの問題を解決したい研究者や、組織的な摩擦に直面している多国籍企業にとって、シンセティックリサーチは確かに物事を前進させる触媒となり得ます。従来の手法と比較して、必要なコストと時間も最小限で済みます。
では、これは市場調査で実在の人々をAIが生成したユーザーに置き換えられるということでしょうか?あるいは、ビジネスに大きな影響を与える可能性のある重要な意思決定を、シンセティックインタビューに頼ることができるのでしょうか?詳しく見ていきましょう。
シンセティックインタビューや 合成 ペルソナ について説明する前に、シンセティックデータについて理解する必要があります。シンセティックデータは最近のものではありません。元のトレーニングデータが使い果たされた後、大規模言語モデルのトレーニングに広く使用されてきました。
名前から明らかなように、シンセティックデータは人工知能(AI)を使用して生成された人工データです。実際のソースから収集されたものではなく、実世界のデータを表すものでもありませんが、実世界で見られるパターンから導き出されています。
では、その魅力は何でしょうか?それは、安価で比較的生成が容易だということです。
実世界のデータはエラーやバイアスの影響を受けやすいですが、シンセティックデータはこれらのエラーを最小限に抑えるように設計できます。機密情報や個人を特定できる情報を共有することなく、元のデータセットに似たデータを生成できるため、ユーザーのプライバシー法を気にする必要がありません。
また、ニッチな対象者を扱う場合や、利用可能なデータが不完全または限られている場合に役立ちます。
ユーザーや顧客からオリジナルの市場調査をまとめるには多くの費用と時間がかかることは誰もが知っています。これが、大手ブランドや小規模企業が今日、ターゲット層に関する貴重な洞察を得るためにシンセティックデータを使用している主な理由の1つです。
シンセティックな回答者は、マーケティングとデザインリサーチで注目を集めています。生成AIはあらゆる場所で使用されているため、これらの分野の人々(全員ではありませんが)がシンセティックユーザーを作成するために活用しているのは驚きではありません。
簡単に言えば、合成 ペルソナは、お客様やユーザーのデジタルアバターまたは仮想表現です。これらは、マーケティングやデザインの専門家が開発した従来のペルソナとは異なり、AIと機械学習技術で構築されています。
最も簡単な作成方法は、GPT-4などのLLMを通じてです:まずターゲット顧客を説明し、次に目標、課題、ニーズを特定し、最後にそれらの問題の解決策となる製品やサービスのアイデアを追加します。それが完了したら、この対象者の「ペルソナ」を採用するようにプロンプトします。

特定の人口統計グループを代表し、調査やインタビューに正確に回答できるAI生成のペルソナを何百、何千も生成できます。ChatGPTのようなツールは、複数のソースや業界からの書き言葉や話し言葉の会話を含む多様なデータセットでトレーニングされているため、さまざまなユーザーの行動や好みを模倣できます。
このように、シンセティックユーザーを使用して、製品やサービスを市場にリリースする前に、さまざまなシナリオをシミュレーションしてトライアルやテストを実行できます。大量のデータを処理し、デザインやキャンペーンの改善をサポートするフィードバックを提供することができます。

しかし、その多くの用途にもかかわらず、シンセティックペルソナには基本的な限界があります:新しいコンセプトを扱う場合や、コロンビアのプランテーション労働者のような新しいタイプの顧客を理解しようとする場合、十分な成果を得られない可能性が高いのです。
ヒューマンセントリックデザインの提唱者であるChristopher Roosenが説明するように:
「ジェネレーティブAIはインターネットの取り込みに基づいています...それはインターネットのすべてのバイアスの構造を保存しており、それには多様な色、形、アイデアを持つ人々からの偏りや、非常にステレオタイプ化された人々の表現への偏りが含まれています。」
AIはオンライン上で十分に表現されていない人々を表現することに苦労します。そのため、コロンビアの労働者のペルソナを生成するよう依頼すると、学習データに含まれる表面的な描写により、一般的なステレオタイプを作成してしまう可能性があります。ツールは重要なポイントを見落とし、クリシェに頼り、新しいグループや周縁化されたグループに向けた質問に答えるために必要な深さを欠く可能性があります。
シンセティックインタビューはユーザーインタビューに似ていますが、実際の人々に質問をするのではなく、シンセティック参加者(別名シンセティックユーザー)とテキストベースの対話やアンケート形式で対話し、様々なトピックについてユーザーインサイトを収集します。
インタビューやフォーカスグループなどの調査を行ったことがある人なら誰でも、それが時間と費用のかかるものであることを知っています。結局のところ、適切な質問を準備するだけでも、多くの計画、調整、訓練された専門家が必要です。さらに、適切な目標や課題を特定するために、多くの人々と話をする必要があります。
これと比較すると、シンセティックインタビューは、ユーザーや顧客との会話を行うための、より迅速で費用対効果の高い代替手段を提供するように見えます。

ジョン・ウェーレンの講座「シンセティックユーザーの実践:カスタマーリサーチの未来」によると、シンセティックインタビューは以下の場合に理想的です:
どんな質問をしても、シンセティックユーザーは躊躇することはありません。
しかし、生成されたデータや出力は必ずしも完璧ではありません。これらのインタビュー回答は「何が」には答えられますが、必ずしも「なぜ」には答えられません。
人間の表情や声でしか提供できない微妙な文脈を見逃してしまいます - 微表情、イントネーション、ボディランゲージがないため。また、シンセティックインタビューは、従来の研究プロセスで見られる文脈的な豊かさが書き言葉には含まれないため、人間の感情の深さを捉えることが困難です。
そのため、シンセティックインタビューを定期的に人間の回答と照らし合わせて評価・検証する必要があります。なぜハイブリッドアプローチなのでしょうか?それは、インタビューデータはAIが生成したものかもしれませんが、それに基づいて行う決定は実世界に影響を与えるからです。
スコット・スティーブンスとマイケル・クリステルは1998年、「シンセティックインタビュー:人間と機械ベースのキャラクター間の"ダイアド"を創造する芸術」という論文でシンセティックインタビューについて議論しました。もちろん、カーネギーメロン大学の研究者たちは、大学が開発したシンセティックインタビュー技術に焦点を当てていました。
彼らの論文は合成インタビューを次のように定義しました:
「個人やキャラクターと深く会話する手段で、ユーザーが会話的な方法で質問をすることを可能にし...質問された内容に対して関連性のある適切な回答を得ることができます。」
この技術は、人間の思考やプロセスを反映する形で、情報を「生き生きと」伝えることを目的としていました。ユーザーは、コンピューター生成(CG)のペルソナに対して、音声や文字入力インターフェースを通じて質問し、その好み、行動、価値観を理解することができました。
これを実現するため、人間の俳優による数千のビデオクリップがデータベースに記録・保存されました。これらの俳優は、想定される質問への回答を録画され、さらにコーヒーを飲む、頭を掻く、笑うなどの非言語的なクリップも含まれ、キャラクターをより人間らしく感じさせるようにしました。
これらの応答は、トーキングヘッド形式で表示され、ユーザーがその人物と対面しているような感覚を得られるようになっていました。CGペルソナには、アルベルト・アインシュタインのような、表現される人物特有の習慣も含まれ、より本物らしさを演出しました。
インターフェースでは、ユーザーがマイクに向かって普通に話しかけ、インタビューの流れを設定することができました。音声認識システムは、既存のLLMを使用して質問を分析し、関連する質問に対して正確な結果を、予期せぬ質問に対して許容可能な結果を提供しました(これが何を意味するかは論文を読んでください)。
当時、この技術は俳優や宗教指導者、その他の公人との対話型体験を提供する方法として見られていました。
これは生成AIツールが登場する前のことでした。現在では、モデルに特定の人物、あるいは私たちの場合は特定の顧客やユーザーグループとして「演じる」ように依頼するだけで、トーキングヘッドは除いて、即座に生き生きとした応答を生成することができます。
人なしでユーザーリサーチを行うのは難しそうに聞こえますが、実際にはそうではありません。必要なのは生成AIツール、ターゲット層の良い理解、そして適切なプロンプトと質問のセットだけです。
これに加えて、リサーチのニーズを概説します。目標とユースケースは何ですか?このインタビューセッションから何を学びたいですか?これはインタビューの質問を組み立てるのに役立ちます。合成ユーザーの数、形式(テキスト、アンケート回答)、回答の多様性をどの程度にするかを決定します。
実演のため、Delve AIのResearch Personaという最新製品について、ChatGPTの無料版を使用して7人の合成ユーザーを作成します。
最初のステップは、理想的なユーザーグループに関する詳細を含むドキュメントをアップロードすることです - これにより、回答者を特定の層に限定するのに役立ちます。次に、製品説明を追加し、適切に表現されたプロンプトを使用してシステムが生成する合成参加者の数を指定します。

プロンプトを入力すると、ChatGPTは即座に多様な合成ペルソナを生成しました。以下は、eコマース企業のマーケティング担当副社長である Dan Miller という名前の一例です。

これらのペルソナそれぞれに対して、以下のインタビュー質問(自由回答形式とアンケート形式の質問を組み合わせたもの)を実施しました。
チャットボットに、製品に対する問題や懸念事項、気に入った点、そして裏付けとなる引用を強調した、クリーンで専門的なレポートにインタビュー回答をまとめるよう依頼しました。

予想通り、システムはこの種のペルソナ作成においてユーザーが一般的に抱える問題のほとんど - 一般的な出力、プライバシーの懸念など - を把握しました。続いて製品の好ましい点についてのまとめがありましたが、これもまた悪くありませんでした。

このインタビュープロセスにより、潜在的なユーザーが気にする可能性のある事項が明らかになりましたが、特別なものはありませんでした。回答は迅速で - 全体の作業は約15分で完了しましたが - このデータは実際のユーザーに対するより良い、より具体的な質問を作成するためにのみ使用できます。
完全な結果と、使用されたプロンプトや質問はこちらでご覧いただけます。
インタビューデータは、システムが構築する合成ユーザーの質に依存します。このような方法で合成インタビューを生成したい場合は、モデルに入力した顧客データの品質を徹底的に確認してください。バイアスやギャップはありませんか?そもそも適切なデータを含めていますか?システムに何かを模倣させるのですから、その「何か」が本当に望むものであることを確認してください。
LLMが実際の人間の反応の複雑さやニュアンスを反映したデータを生成するには、良質なプロンプトが必要です。
覚えておいてください:良質な入力データ + 適切に作られたプロンプト = 質の高いインタビュー出力。
合成データが生成されたら、使用する前に検証してください。品質、一貫性、正確性を評価するために、手動チェックとバリデーションツールを活用してください。ステークホルダーは合成データに対して懐疑的です(当然のことです)。そのため、ユーザーリサーチレポートでAI生成データを使用する場合は、透明性を保つようにしてください。
マイケル・メイスは、生成AIを使用して顧客インタビューをシミュレートするツールであるSynthetic Usersと実際の人々とのインタビューを、"AIはディスカバリーインタビューに取って代わることができるか?競合比較"という記事で比較しています。
合成回答者、そして合成インタビューのデメリットについて議論する必要がある場合、彼の投稿は素晴らしい出発点を提供しています。
メイスは、空飛ぶ車を使用するライドシェアサービスという斬新なアイデアを用いて、Synthetic UsersとUserTesting(オンラインパネルから実際の人々に質問できるサービス)の間で研究を行いました。
この研究の結果は、合成ユーザーに有利ではありませんでした。
Synthetic Usersは確かに速かったです。ユーザーを作成し、質問を追加すると、数分で回答が生成されます。対照的に、UserTestingを使用するには丸一日必要でした - 計画の作成、スクリーナーの設定、回答の待機、そして結果の分析。そしてそれでも、求める特性を持つ適切な人々を見つけるのは困難でした。
Synthetic Usersの問題点は、特定の問題を持つユーザーを定義した場合、その問題が存在するかどうかを疑問視しないことです。単にそれが存在すると仮定します。そのため、現実には存在しない仮説的なユーザーが生まれてしまいます。
これは問題です。
生成されたトランスクリプトも少し完璧すぎて、フィラーワードや繰り返し、不完全な文がありませんでした。UserTestingが提供したような感情的な手がかりが欠けていました。ビデオや表情を分析することができなかったからです。
さらに、合成参加者は互いによく似た声で、ほぼ同一の回答をしていました。
ベーシックで平均的で、実生活から切り離された印象でした。実際のユーザーは、洗練されていない回答であっても、より多様で詳細な情報をもたらしました。
スピードと対象者の基本的な概要以外に、このツールは顧客の考え方や反応の仕方についてより深く理解する助けにはなりませんでした。残念ながら、これが多くの合成的な研究手法の問題点です。
手動でのシンセティックリサーチの方法を見てきましたが、次はAIを活用した方法を見ていきましょう。Delve AIのシンセティックリサーチソフトウェアは、ユーザーや顧客のためのAIペルソナを作成し、アンケートやインタビューを実施するのに役立つツールの1つです。
現在、このリサーチソフトウェアには3つの機能があります:
ファーストパーティーデータとパブリックデータソースから構築されたこれらの仮想ペルソナは、拡張性が高く多様です。任意の数のユーザーを生成し、希望する数の定量的・定性的インタビューを実施できます。
模擬ユーザーを開発する前に、基本となるペルソナを作成する必要があります。そのためには、当社のペルソナ製品のいずれかにサブスクライブする必要があります。
現在、当社のAIペルソナジェネレーターでは、以下の6つを提供しています:
この場合、先ほど説明した調査 ペルソナツールを使用してペルソナを構築します。
Delve AIにサインアップまたはログインし、Research Personaに移動してドキュメントをアップロードします。インタビュー記録、アンケートレポート、業界ニュース、過去のユーザープロファイルなど、関連する情報を含めることができます。

「ペルソナを作成」をクリックすると、Delve AIは提供されたデータに基づいてペルソナを開発します。研究資料がなくても心配ありません。ターゲットオーディエンスの簡単な説明と、製品やビジネスに関する詳細(任意)を追加するだけで、あとは私たちが対応します。
プラットフォームは、ユーザーの入力に加えて、過去に生成された何千ものペルソナからの学習を活用して、ユニークな顧客プロファイルを作成します。出力は、オーディエンスやユースケースに応じて、1つまたは複数のペルソナになります。各セグメントには、ペルソナの詳細、分布、ジャーニーマップが含まれています。

PERSONA DETAILSをクリックすると、ユーザーの人口統計、ライフスタイル、キャリアステータス、願望、購買決定に影響を与える要因、心理的要因(目標、動機、ニーズ)、および主要な課題が表示されます。



これに続いて、好みのコミュニケーションチャネル、ソーシャルネットワーク、ブランド、ショッピングウェブサイト、音楽、テレビ番組、映画、YouTubeチャンネル、ポッドキャスト、サブレディット、影響力のあるリソースなどの情報が表示されます。














配信タブでは、チャネル、ソーシャルネットワーク、年齢、性別、言語、場所、アクティビティレベル、トピック(共感されるものと一般的なもの)によって分類された特定のセグメント内でのオーディエンスの分布が表示されます。
最後のタブ「カスタマージャーニー」には、ユーザーの目標、行動、問題、思考プロセスを探る個別のフェーズに分かれたユーザージャーニーマップが含まれています。

注意: personasは毎月新しいデータで自動更新され、追加の研究データで補完することもできます。
personasを作成したので、次のステップに進みましょう。つまり、合成ユーザーの生成です。なぜこれが必要なのでしょうか?インタビューを実施できないからです。
開始するには、Synthetic Researchダッシボードに移動し、必要なユーザー数(例:100)を購入します。このパネルをグループ化し、Marketing Insights Groupのような名前を付けてください。これにより、後でオーディエンスを整理・管理しやすくなります。
persona(s)またはpersona製品から合成ユーザーを生成するために使用したいものを選択できる画面に移動します。ここでは、Research PersonaのEdward Collinsというセグメントから選択します。

下記のように、ソフトウェアは特定のユーザーpersonaセグメントに基づいて100人の合成ユーザーを生成しました。各ユーザーには「チャットを開始」オプションがあり、これを使用して対話することができます(詳細はDigital Twinをご覧ください)。

シミュレートされたpersonasの準備ができました。ユーザーリサーチのアンケートとインタビューを実施する時です。
サイドバーでMarketing Insights Groupをクリックし、ドロップダウンからアンケートを選択します。ダッシュボードで「アンケート作成」ボタンをクリックします。アンケート名(例:プロダクトマーケットフィット調査)、ユーザー数(例:100)を入力し、アンケート質問を含むCSVファイルをアップロードするよう求められます。

ファイルには、多肢選択、評価スケール、リッカートスケール、自由回答、ランキングなど、様々なタイプの質問を含めることができます。回答の生成には短時間しかかかりません。

結果とともに、各質問に対して特定の回答をした回答者を詳しく調べ、チャット機能を使って選択の理由を尋ねることもできます。

また、他のマーケティングや製品に関する課題についてフィードバックを求めることもできます。上記のサンプルでは、オンラインショッピングで購入を決定する際に影響を与えた要因について、ユーザーに質問しています。
AI生成リサーチへの主な批判は、実際のインタビューで得られる典型的な真正性、深さ、感情的なニュアンスが欠けているということです。また、トレーニングデータのバイアスが研究結果を歪める可能性があるという懸念もあります。
Niloufar Salehiは合成ユーザーに関する記事で以下のように書いています:
「人々にインタビューし、そして...収集した大量のデータを分析する時間を費やす全ての目的は、彼らとつながり、信頼を築き、より深く掘り下げ、ストーリーを共有してもらい、彼らの感情や情緒について学ぶ能力にあります。パターン合成エンジンはそれらの機能を持っていません。」
しかし、特に広範なユーザーリサーチの時間や予算がない、これから始める人やチームにとって、合成インタビューは魅力的でアクセスしやすい代替手段となり得ます。
Delve AIの合成リサーチソフトウェアは、人々を採用したり、インタビューしたりしません。
しかし、ユーザーについて収集した情報を使用して、類似オーディエンスを作成します。ファーストパーティ(CRM、ウェブ分析)、セカンドパーティ(ソーシャルオーディエンスデータ、競合情報)、そしてカスタマーボイスデータを使用して生成されたpersonasから構築されたこれらの仮想ユーザーは、ChatGPTが作り出した一般的なものではありません。
これらはあなたのビジネスのユースケースに合わせてカスタマイズされており、ユーザーとその核心的なニーズについてより良い理解を提供する可能性が高いでしょう。
シンセティックインタビューは問題になる可能性がありますが、それは模擬ユーザーが一般的、不正確、または偏見を持っている場合のみです。シンセティックペルソナの質は、得られる回答の質に直接関係します。質が良ければ良いほど、回答も良くなります。
そのため、信頼できるシンセティックリサーチソフトウェアを選択するか、可能であれば構築する責任は皆さんにあります(これには多くのリソースが必要です)。
一度見つかれば、実際のインタビューを行う前に明白な問題を特定するために活用できます。シンセティックユーザーは新しいアイディアのブレインストーミングにも適しています。すでにあった新しい視点や意見を、あなたが知らなかっただけかもしれません。
言うまでもありませんが、現状では、シンセティックインタビューは調査研究を補完するものでしかありません。模擬ユーザーは実際のユーザーよりも優先されるべきではありません。複数のシナリオをテストするために使用できますが、それらの結果は常に実際の研究結果で検証する必要があります。
結局のところ、どのようなユーザーを選ぶかは重要ではありません。重要なのは、あなたが尋ねる質問、あるいは尋ねない質問です。
シンセティックユーザーは、ソフトウェア、ウェブサイト、またはサービスをテストするために作成されたデジタルプロファイルです。クリック、検索、さらには商品の購入など、実際のユーザーのように行動します。これにより、さまざまな条件下でのパフォーマンスを確認し、実際のユーザーが使用する前に問題を発見することができ、実際のユーザーにとってスムーズな操作を確保することができます。
シンセティックインタビューでは、ターゲットオーディエンスのバーチャルアバターと詳細な会話を行うことができます。これらのキャラクターはAIとMLテクノロジーの助けを借りて構築され、実際の顧客の行動や思考プロセスを模倣することができます。そのため、質問票をアップロードするか、インタラクティブダッシュボードを使用するだけで、実際のユーザーを関与させることなく、質問に対する関連性のある回答を得ることができます。