其中,他们将基于角色的模型分为三类:

第一类叫经验总结(新老澳门开奖结果2023开奖记录)科学家以《教父》人物为原型,探索GPT-4决策能力,提升大型模型个性化能力,也就是可以表示某一类人的大模型,比如医生、棒球迷、糖尿病患者等等。

第二类就叫,也就是根据已经“定型”的知名人物或者著名人物来打造的大模型,比如哈利波特、蝙蝠侠、马斯克等等。

第三类是利用个人数据为用户建模数字化身或个人助理,以完成各种下游任务,我们熟悉的Siri、App推荐系统都属于此类。

此前,个性化大模型、基于角色的大模型研究尚处于起步阶段,很多工作倾向于构建角色对话机器人或者用大模型替代传统推荐系统中的组件。

但对于个性化大模型和基于角色的大模型,一方面需要更加可靠的,另一方面基于角色的大模型需要与个性化任务相结合。

此前对大型人物模型的评估多是通过一些人物的语气、知识、心理性格等进行评估,这种评估其实是一种“复制”而非“预测”,即只复制人物之前的行为而非预测新的行为。

对于“预测”来说,需要对过去的数据进行整体建模,并根据当前任务进行推断。

因此团队希望在学习了个人数据之后,也就是学习了人物的历史背景之后,大模型能够帮助用户做出各种决策,让大模型成为更好的个人助理。

决策是大模型个性化能力的最好体现,决策是人的活动基石,也贯穿了人的生活,决策也是一种极具个性化的行为。

人类生活中每天都会做出大量的决策。每个人都是复杂的个体,有很多因素可以决定一个人的决策。

人类在做出决策的时候,不仅需要考虑很多因素,而且所需的推理链也很长。

因此,为了完成这项研究,团队首先需要开发一个用于评估大型基于角色的模型的良好基准。

最初他们考虑使用真人数据,但是出于隐私原因,很少有真人数据能够同时满足可解释、有长上下文、有代表性和具有挑战性的问题的特点。

经验总结(新老澳门开奖结果2023开奖记录)科学家以《教父》人物为原型,探索GPT-4决策能力,提升大型模型个性化能力  第1张

因此他们选择小说数据和剧本数据作为数据来源,在优质的小说中,主人公的决策往往能体现出人物的性格和历史。

在美国作家马里奥·普佐的小说《教父》中,人物迈克尔·柯里昂做出了一个非常重要的决定。

当他的父亲被暗杀并且他的家庭陷入混乱时,迈克寻求向毒枭维吉尔索洛佐和纽约警长进行报复。

这一决定符合迈克冷静、勇敢的性格以及他成为下一代教父的潜力,也与小说中迈克的历史资料息息相关。

比如当毒枭索洛佐要去医院杀死病重的教父时,麦克及时赶到,巧妙化解了危机。

这次事件中,麦克发现自己握枪的手甚至没有抖,这加深了他的个人特点2023澳门全年资料免费大全,也为之后的决策埋下了伏笔。

基于此,研究人员认为,这类数据质量非常高,可以用来评估模拟人类决策的大型模型。

通过对一些文学网站的分析,研究团队找到了这些决策数据发生的节点。

然后,将节点之前的数据喂给大模型,让大模型(GPT-4)还原角色的选择。

为了更好地量化结果,他们把大模型的决策设计成多项选择题的形式,并设置错误的选项来产生误导。

在这期间,团队遇到了数据泄露的问题,即大模型可能记住了相关的决策。

为了缓解这个问题,他们开始选取那些热度不那么高但评分更高的小说,同时对数据进行了清洗,包括替换大量实体名称、删除可能泄露信息的句子,从而解决了这个问题。

近日,相关论文《角色就是命运:大型语言模型能否模拟角色扮演中的角色驱动决策?》(Role is : Can large mock up role- in role-?)在arXiv[1]上发表。