加载失败,

角色扮演大模型的碎碎念

2024年8月12日修改
NLP工作站 快乐子涵酱|阅读原文
转载请联系原作者取得授权
今天给大家带来一篇角色大模型相关思考的文章,来自知乎@快乐子涵酱(已授权)。
什么是角色扮演大模型?
首先提两个问题,目前大模型有自己的“自我意识”吗?为什么大模型生成的答案可以一眼分辨出来?
答案其实很简单,目前所有大模型技术,并不能让大模型具备本身的独立意识,大模型表现出的「拟人化」本质上是在努力扮演一个人类喜好的Assistant角色;或者说,大模型通过SFT和RLHF等技术路线实现与人类喜好的对齐。然而,以chatGPT为例,目前市面上所有的通用大模型的答案具有一种浓浓的「Assistant」语气,具体来说就是很官方、书面,具有强烈的说教口吻,不够口语化,例如「总之......」「记住......」等等。这一切来源于openAI的标注标准,我们不做深究。当大模型作为一个「提效工具」时,这种答案风格是完全OK的;然而对于大部分非程序员的用户群体来说,大模型的「提效能力」并不是一个必需品,「娱乐能力」才是提升一个产品留存率和黏性最重要的能力纬度。当大模型作为一个娱乐工具时,非常官方的语气和说教口吻必然会带来巨大的违和感。
随着以character.AI为首的众多以角色扮演能力为核心的大模型产品的爆火,我们不去讨论当今环境下人类社交形式的演变以及背后的社会原因,我们只讨论对于用户来说,他们更需要的是一个 可定制的、高度拟人化的有情感、有温度的聊天机器人 ,这就是角色扮演模型。
角色扮演模型和通用模型的区别是什么?
概念上
目前大模型本质上是扮演一个assistant助手,直接使用通用大模型进行角色扮演任务,类似于「让一个大模型扮演的assistant助手去扮演某个特定角色」,大模型“意识”中的「我」仍然是一个asisstant助手,「角色扮演」相当于是人类分配给这个助手的一个任务,相当于我们绕了一圈来达到角色扮演目的,效果必然打了一个折扣。
但对于角色扮演模型,我们可以直接让这个AI去扮演某个角色,如虚拟女友、历史人物等。此时大模型“意识”中的「我」就是某个特定的人物,它一切出发点和“自我意识”都是从某个人物的角度出发和考虑。
表现上
对于通用大模型和角色扮演模型,在说话的风格和语气上有明显的不同:
对于角色扮演模型来说,不会具有明显的官方语气和说教口吻,除非你明确要求角色扮演模型去扮演一个类似的角色;相反会表现出符合角色的特定性格特点和说话风格,比如在扮演“张飞”时性格莽撞不拘小节,说话豪爽大气
角色扮演模型可能会具有一定的情绪能力,例如我们可以问通用大模型100遍1+1等于几,但对于角色扮演模型来说,问到第2遍就可能会表现出差异或不耐烦的情绪来;例如在扮演虚拟女友时会表现出撒娇、吃醋等属于人类的情绪
角色扮演模型的输出更具画面感和沉浸感,当我们与通用模型交互时,体感上更像是阅读一本「工具书」,是机械的、没有情感的;而角色扮演模型更像是一个真实的人在隔着屏幕与用户聊天,用户可以想象出到对方的动作、想法和情绪等
角色扮演模型具备更强的交互性:传统的通用模型本质上是一个问答机器人,用户与AI采取一问一答的形式;而角色扮演模型可以给用户主动预设一个场景或情节背景,用户和AI一起交流来演绎并推动剧情的发展。在这当中,角色扮演模型不会简单回答用户问题,更具有主动提问、主动推动剧情发展的能力
假如说通用问答大模型如GPT等是一个assistant助手,那角色扮演大模型的定位就是一个「演员」。通用模型更偏向是「工具」,而角色扮演模型更偏向「产品」属性。角色扮演模型比通用模型更贴近「图灵测试」的目标,即具备「以假乱真」的能力。当用户与角色扮演模型进行交互时,会激发出更多交流欲望。
用一个类比来聊聊我对「角色扮演」的认知