
在社交媒体平台如LinkedIn和Reddit上,关于与合成用户进行访谈这个话题引发了很多热议,特别是关于其利弊的讨论。
但对于用户体验和营销专业人士来说,这真的如外界所说那样毫无价值吗?或者这个想法背后其实是有实质内容的?毕竟,用户体验研究的重点就是观察和访谈真实用户,了解他们的痛点,并发现使他们的体验独特的因素。
传统访谈确实成本高昂,但最终它们能让我们发现人类互动和情感背后的细微差别和复杂性。
像ChatGPT这样运行在高度先进的大型语言模型上的生成式人工智能工具,只能创建反映集体平均水平的人工智能参与者,缺乏常见人群中的多样化个性和特质。
然而,对于想要克服开始困难的研究人员,或面临组织阻力的跨国公司来说,合成研究确实可以成为推动事情发展的催化剂。与传统方案相比,所需的成本和时间也相当少。
那么,这是否意味着你可以在市场研究中用人工智能生成的用户替代真实的人?或者依靠合成访谈来做重要决策;那些可能对你的业务产生重大影响的决策?让我们来深入研究一下。
在我们讨论合成访谈或合成 persona 之前,我们需要了解合成数据。合成数据并不是最近才出现的;在原始训练数据耗尽后,它被广泛用于训练大型语言模型。
顾名思义,合成数据是使用人工智能(AI)生成的人造数据。它不是从真实来源收集的,也不代表真实世界的数据,而是从现实世界中发现的模式派生而来。
那么,它的吸引力在哪里?嗯,它成本低廉且相对容易生成。
真实世界的数据往往容易出现错误和偏差,但合成数据可以通过设计来最小化这些错误。你可以生成类似于原始数据集的数据,而无需共享任何敏感或个人身份信息,因此你不必担心用户隐私法。
此外,当你处理小众受众或数据不完整或有限的情况时,它会派上用场。
众所周知,从用户和客户那里收集原始市场研究需要大量的金钱和时间。这是现今大品牌和小企业使用合成数据来收集有关目标受众的宝贵见解的主要原因之一。
合成受访者在营销和设计研究中正在流行。生成式AI无处不在,因此这些领域的人(虽然不是全部)利用它来创建合成用户并不令人惊讶。
简单来说,合成 persona是你的客户或用户的数字化头像或虚拟表现。它们不像营销或设计人员开发的传统 personas,而是通过AI和机器学习技术构建的。
创建一个最简单的方法是通过像GPT-4这样的LLMs:首先描述你的目标客户,然后指定他们的目标、挑战和需求,最后,添加你的产品或服务理念,作为解决这些问题的方案。完成后,提示它采用这个受众的"persona"。

你可以生成数百甚至数千个代表特定人口统计群体的AI生成的 personas,它们可以准确回应你的调查和访谈。由于像ChatGPT这样的工具是在包含来自多个来源和行业的书面和口头对话的多样化数据集上训练的,它们可以模仿各类用户的行为和偏好。
因此,您可以使用合成用户来模拟各种场景,并在将产品或服务推向市场之前进行试验和测试。它们可以处理大量数据并提供反馈,以支持设计和营销活动的迭代。

然而,尽管有诸多用途,合成personas确实存在一个基本局限性:如果您正在处理一个全新的概念或试图了解一种新类型的客户,比如哥伦比亚的种植园工人,它们可能会显得不够充分。
正如人本设计倡导者Christopher Roosen所解释的:
"生成式人工智能是基于对互联网的捕获...它存储了互联网所有偏见的结构,这包括对丰富呈现的各种肤色、形态和想法的人群的偏见,以及对人群非常刻板化的呈现方式的偏见。"
人工智能在表现网络上代表性不足的人群时会遇到困难,所以当您要求它为哥伦比亚的工人生成personas时,它可能会创建通用的刻板印象,因为它训练所用的数据包含了对这类人群的表面描述。您的工具可能会遗漏关键点,陷入陈词滥调,并且缺乏回答针对新群体或边缘群体问题所需的深度。
合成访谈类似于用户访谈;但是,不是向真实的人提问,而是与合成参与者(又称合成用户)互动,通常通过基于文本的对话或基于调查的格式,来收集各种主题的用户见解。
现在,任何做过研究的人,无论是访谈还是焦点小组,都知道这会多么耗时和昂贵。毕竟,仅仅准备合适的问题就需要大量的规划、协调和训练有素的专业人员。此外,你需要与很多人交谈才能确定正确的目标和痛点。
相比之下,合成访谈似乎为与用户或客户进行对话提供了一个更快速、更经济的替代方案。

根据John Whalen在他的课程"实践合成用户:客户研究的未来"中所说,合成访谈特别适合:
无论你问什么样的问题,合成用户都不会犹豫。
但获得的数据或输出并不总是完美的。这些访谈回答可能回答"是什么",但不一定回答"为什么"。
你会错过只有人类面部或声音才能提供的细微背景 - 没有微表情、语气和肢体语言。合成访谈也难以捕捉人类情感的深度,因为书面文字往往缺乏在传统研究过程中发现的情境丰富性。
这就是为什么你必须定期评估和验证合成访谈与人类回应的对比。为什么要采用混合方法?因为虽然访谈数据可能是AI生成的,但你基于它们做出的决定将会产生实际影响。
Scott Stevens和Michael Christel在1998年的论文"合成访谈:创造人类和基于机器角色之间'二元关系'的艺术"中讨论了合成访谈的话题。当然,来自Carnegie Mellon的研究人员关注的是合成访谈,这项由该大学开发的技术。
他们的论文将合成访谈定义为:
"一种与个人或角色进行深入对话的方式,允许用户以对话方式提问...并获得与所问问题相关、恰当的答案。"
这项技术应该以"栩栩如生"的方式传递信息,反映人类的思维和思考过程。用户可以通过语音或文字界面向计算机生成(CG) personas提问,以了解他们的偏好、行为和价值观。
为了实现这一点,数千个人类演员的视频片段被录制并存储在数据库中。这些演员被录制回答潜在问题的视频,以及额外的非语言片段,如喝咖啡、抓头或微笑,以使角色感觉更像人。
这些回应以说话头像的格式呈现,让用户感觉他们在与角色面对面交谈。CG personas还包括了所扮演角色的独特习惯,比如Albert Einstein的,以使其更加真实。
该界面允许用户正常对着麦克风说话并设置访谈流程。语音识别系统会使用其现有的LLMs分析问题,为相关问题提供准确结果,为意外问题提供可接受的结果(阅读论文以了解这意味着什么)。
当时,这项技术被视为提供与演员、宗教领袖和其他公众人物互动体验的方式。
这是在生成式AI工具出现之前。现在,你可以简单地要求模型"扮演"特定人物,或在我们的情况下,扮演特定的客户或用户群体,它就会立即生成栩栩如生的回应,当然,除了说话头像。
在没有真人的情况下进行用户研究听起来很难,但事实并非如此。你只需要一个生成式AI工具,对目标受众有清晰的认识,以及正确的提示和问题集。
除此之外,还要明确你的研究需求。你的目标和使用案例是什么?你想从这次访谈中学到什么?这将帮助你构建访谈问题。决定你想要多少个合成用户,以什么格式(文本、调查回复),以及他们的回答应该有多么多样化。
为了演示目的,我们将使用ChatGPT的免费版本为我们最新的产品Research persona by Delve AI创建七个合成用户。
第一步是上传一份包含我们理想用户群详细信息的文档 - 这有助于将受访者限制在特定人群。然后,我们添加产品描述并通过一个措辞恰当的提示来指定系统需要生成的合成参与者数量。

一旦提示完成,ChatGPT立即生成了各种合成personas。这里有一个名为Dan Miller的电商公司营销副总裁的示例。

我们通过每个personas运行以下访谈问题(包括开放式和调查式问题的混合)。
我们要求聊天机器人将访谈回答总结成一份清晰专业的报告,突出他们对产品的问题或担忧、他们喜欢的方面以及支持性引述。

正如预期,系统获得了用户会与这种personas创建相关联的大多数常见问题 - 输出过于笼统、隐私担忧等。接下来是他们喜欢产品的方面总结,这同样不错。

这个访谈过程让我们了解到潜在用户可能关心的事情,但没有什么特别之处。响应很快 - 整个练习只花了约15分钟 - 但是,这些数据只能用于为实际用户创建更好、更具体的问题。
您可以在这里查看完整结果,以及使用的提示和问题。
您的访谈数据质量取决于系统构建的合成用户质量。因此,如果您想以这种方式生成合成访谈,请彻底检查您输入模型的客户数据质量。是否存在任何偏见或缺口?您是否包含了正确的初始数据?您是在训练系统模仿某些内容,所以要确保那个"某些内容"确实是您想要的。
要让LLM生成能反映真实人类回应的复杂性和微妙之处的数据,您需要好的提示。
请记住:优质输入数据 + 精心设计的提示 = 高质量访谈输出。
一旦生成合成数据,在使用前要对其进行验证。进行人工检查并利用验证工具来评估质量、一致性和准确性。利益相关者对合成数据持怀疑态度(这是正确的),所以如果您在用户研究报告中使用AI生成的数据,请保持透明。
Michael Mace在他的文章"AI能替代探索性访谈吗?一个竞争性比较"中比较了使用生成式AI模拟客户访谈的Synthetic Users工具与真人访谈。
如果我们要讨论合成受访者以及合成访谈的缺点,他的文章提供了很好的切入点。
Mace使用一个新颖的想法 - 使用飞行汽车的网约车服务 - 对Synthetic Users和UserTesting(允许您向在线用户群提问)进行了研究。
这项研究的结果对合成用户不利。
Synthetic Users确实很快。您创建用户,添加问题,几分钟内就能生成回应。相比之下,使用UserTesting需要一整天 - 写计划、设置筛选条件、等待回应,然后分析结果。即使这样,找到具有您想要特征的合适人选也很困难。
Synthetic Users的问题在于,如果您定义了一个有特定问题的用户,它不会质疑该问题是否存在。它只是假定问题存在。因此,您最终得到的是现实中不存在的假设用户。
这是个问题。
甚至生成的访谈记录也过于完美,没有填充词、重复或不完整的句子。它们缺乏UserTesting所能提供的情感线索,因为没有视频或表情可以分析。
此外,合成参与者听起来彼此相似,给出近乎相同的答案。
除了速度和对受众的基本概述外,这个工具在帮助你了解客户思考和反应方式方面没有任何作用。不幸的是,这也是大多数合成研究方法的问题。
他们感觉很基础、平庸,而且与现实生活脱节。虽然真实用户的反应可能不够完善,但却带来了更多的多样性和细节。
我们已经了解了进行合成研究的人工方法;现在,让我们来看看人工智能驱动的方法。Delve AI的合成研究软件是帮助您为用户或客户创建人工智能personas并利用它们进行调查和访谈的工具之一。
目前,该研究软件包括三个功能:
这些虚拟personas基于第一手和公共数据源构建,具有可扩展性和多样性。您可以生成任意数量的用户,并进行任意数量的定量和定性访谈。
在开发模拟用户之前,您需要创建基础personas。为此,您必须订阅我们的其中一个persona产品。
目前,我们的人工智能persona生成器提供六种类型:
在本例中,我们将使用前面提到的研究 persona工具构建personas。
注册或登录Delve AI,进入Research Persona,然后上传您的文档。您可以包含任何相关内容,如访谈记录、调查报告、行业新闻或过往用户档案。

点击"创建Personas",Delve AI将根据您提供的数据开发personas。如果您没有任何研究材料,不用担心;只需添加目标受众的简短描述以及有关您的产品或业务的一些详细信息(可选),我们就会接手处理。
除了您的输入外,我们的平台还借鉴了之前生成的数千个personas的经验来创建独特的客户档案。输出可以是一个或多个personas,具体取决于您的受众和使用场景。每个细分市场都包含persona详情、分布和旅程图。

点击PERSONA详情,您将看到用户人口统计信息、生活方式、职业状况、aspirations、影响购买决策的因素、心理驱动因素(目标、动机、需求)和核心挑战。



接下来是关于他们首选的沟通渠道、社交网络、品牌、购物网站、音乐、电视节目、电影、YouTube频道、播客、subreddits、有影响力的资源等信息。














分布标签显示了您的受众在特定细分市场中的分布情况,按渠道、社交网络、年龄、性别、语言、位置、活跃程度和主题(包括引起共鸣的和一般的)进行细分。
最后一个标签"客户旅程"包含了用户旅程地图,分为不同的阶段,探索用户的目标、行动、问题和思维过程。

注意:您的personas每月都会自动更新新数据,您还可以用额外的研究数据进行补充。
现在我们已经建立了personas,让我们进入下一步,即生成合成用户。为什么这是必要的?因为没有它们就无法进行访谈。
要开始,请转到合成研究仪表板并购买您需要的用户数量 - 例如100个。然后,创建一个包含此群组的面板,并为其命名,例如 Marketing Insights Group。这将帮助您以后组织和管理您的受众。
您将被引导至一个屏幕,在那里您可以选择要用于生成合成用户的 persona(s) 或 persona product。在这里,我们将从名为 Edward Collins 的 研究 persona 中选择一个细分群体。

如下所示,软件已根据该特定用户 persona 细分群体生成了100个合成用户。每个用户都包含"开始聊天"选项,您可以用它与他们互动(参见 Digital Twin 了解更多信息)。

我们的模拟 persona 已准备就绪;现在是时候进行用户研究调查和访谈了。
在侧边栏中,点击 Marketing Insights Group,然后从下拉菜单中选择调查。在仪表板上,点击"创建调查"按钮。系统将提示您输入调查名称(例如,产品市场契合度调查),指定用户数量(例如,100),并上传包含调查问题的CSV文件。

您的文件可以包含各种类型的问题,如多选题、评分量表、李克特量表、开放式问题和排序问题。生成响应只需要很短的时间。

除了结果之外,您还可以深入了解哪些受访者对每个问题给出了具体答案,甚至可以使用聊天功能询问他们选择背后的原因。

您还可以询问他们关于其他营销和产品相关主题的反馈。在上面的示例中,我们询问了一位用户在网上购物时影响其完成购买的因素。
对人工智能生成研究的一个主要批评是,它缺乏通常从真实访谈中获得的真实性、深度和情感细节。此外,训练数据中的偏见可能会潜在地影响您的研究发现
正如 Niloufar Salehi 在她关于合成用户的文章中写道:
"花时间采访人们,然后...分析收集到的大量数据的全部意义在于能够与他们建立联系,建立信任,深入挖掘,请他们分享故事,了解他们的感受和情绪。模式合成引擎没有这些。"
然而,对于刚刚起步的个人或团队,特别是那些没有时间或预算进行广泛用户研究的人来说,合成访谈可以是一个有吸引力且容易获得的替代方案。
Delve AI 的合成研究软件不招募人员,也不对他们进行访谈。
但它确实使用您收集的用户信息来创建相似受众。这些虚拟用户是基于使用您的第一方数据(CRM,网站分析),第二方数据(社交受众数据,竞争对手情报)和客户声音数据生成的 personas,而不是 ChatGPT 随意生成的通用内容。
它们是根据您的业务用例定制的,很可能会让您更好地了解用户及其核心需求。
合成访谈可能会有问题,但只有在您运行访谈的模拟用户过于笼统、不准确或有偏见时才会如此。合成personas的质量与您获得的响应质量直接相关;质量越好,响应就越好。
因此,选择或者如果您有能力的话,构建可靠的合成研究软件(这将需要大量资源)的责任在于您。
一旦找到合适的软件,您就可以在进行实际访谈之前识别明显的问题。合成用户对于头脑风暴新想法也很有帮助。这些可能是全新的观点,或者是已经存在但您不知道的观点。
不用说,在目前的阶段,合成访谈应该只是作为研究的补充。模拟用户永远不应该优先于真实用户。您可以使用它们测试多种场景,但始终要用真实的研究结果来验证这些结果。
最终,您选择什么样的用户并不重要;重要的是您问什么问题,或者不问什么问题。
合成用户是一个为测试软件、网站或服务而创建的数字档案。它像真实用户一样运作,执行点击、搜索甚至购物等操作。这让你可以观察系统在不同条件下的表现,并在真实用户使用之前发现任何问题,确保一切为实际用户顺利运行。
合成访谈允许你与目标受众的虚拟化身进行深入对话。这些角色是在AI和ML技术的帮助下构建的,可以模仿真实客户的行为和思维过程。因此,你可以简单地上传问卷或使用交互式仪表板,无需真实用户参与就能获得相关问题的答案。