加载失败,
2024 年,基于大模型的 Agent 如何在企业落地?
2024 年,基于大模型的 Agent 如何在企业落地?
2024年7月17日修改
2024年6月24日创建
如果说去年一年是自媒体的狂欢,还可以利用信息差赚知识付费和咨询费,那今年在技术普及已经差不多的情况下,就要面对落地的挑战了,否则大多数人该怀疑这又是一场泡沫了,最近一个月,我自己的身份也从纯研发角色侧重为产品,虽然代码还在写,但关注重点不一样了,这篇文章我将从这一个月来的实践和调研的情况出发,尝试从个人角度阐述对 AI 产品经理的能力理解,以及对当下 toC 和 toB AI 产品落地现状的一些思考,欢迎大家一起探讨
AI 产品经理
AI 产品的定义
在展开之前,有必要澄清下当下大家经常听到的 AI 产品的概念,我对它的定义是基于生成式 AI 技术构建的软硬件产品,而生成式 AI 是人工智能的一个分支,其核心是能够生成随机内容的计算机模型,常见的生成式 AI 模型包括生成式对抗网络 (GAN),变分自动编码器 (VAE),大型语言模型 (LLM)等,基于生成式 AI 技术的应用示例有 ChatGPT、DALL-E、Google Bard、Midjourney、Adobe Firefly 和 Stable Diffusion 等。
值得一提的是传统的搜索、广告、推荐系统其实也都算是使用机器学习算法的 AI 产品。
产品经理能力
虽然我过往的工作经历并非产品经理,但是从我的合作经验来看,传统产品经理主要关注编写文档、描述功能、定义需求和设计产品结构,工作内容往往侧重于用确定的业务规则来规划产品的每个步骤,并通过产品市场适应性 (PMF) (由用户数量和市场反馈等指标组成)来评估产品是否满足市场需求,注重用户增长和用户满意度数据。
但通过我一个月的实践,AI 产品经理优先考虑的应该是将用户需求转化为有效的测试集,确保产品 demo 版本测试集和用户需求分布一致,分布合理的测试集才是产品阶段性成功的关键标志,然后在满足内部指标要求的基础上对测试集进行迭代,最后才是传统产品中用户满意等指标达成。其次就是对行业的理解程度决定你设计的产品给用户带来的“惊喜感”程度,比如做的是 toB 的分析工具,不应该是传统的冷冰冰的数据分析看板工具,而是一个更像人的应用,是人它就有优点(大模型分析能力),也有缺点(对应大模型的幻觉),透过数据能给建议,可行的建议,建议执行后的模拟结果,这应该是提供建议前都想好的。
一定要了解技术,因为我自己做技术出身的,也算是自带优势,最好亲自在各大模型厂商提供的 Playgrond 中多多调试提示词,相同的提示词遇到不同家的模型效果千差万别,了解模型的能力边界,做 AI 产品的前提起码自己得是一个优秀的提示词工程师。其次是要读论文的,比如 Transform 架构的多头注意力机制能够提升信息捕捉能力,学习复杂的表示为下游任务提供了一个丰富而综合的信息集合,比如Reason and Act([1]) (ReAct) 框架,通过推理确定下一步行动,生成相应命令,然后执行。ReAct 范式会在一个循环中重复这个过程,直到任务完成,比如 Self-Ask([2])、Chain of Thought Prompting([3]) (CoT) 以及 Plan-and-solve Prompting([4]),这些技术通常会先制定一个计划,以便把复杂任务分解成更简单的子任务,最后要是能借助 ChatGPT 能写一点代码来进行 POC(概念验证)就最好了。
再谈谈交互,自然语言交互是一件成本很高,对用户要求很高的事情,让用户输入文字直接描述自己的意图真的太难了,那产品的解法就是(1)引导话题,限定范围,AI 单次输出内容少,但是输出频度高;(2)干脆只给选择题(A,B,C,D),甚至简单到给 yes or no 来推进对话,这里推荐一本语音交互的书《语音界面冲击》([5]),特别是第 3 章和第 7 章,对我来说还是比较受用的;(3) 做 toB,其实没有那么激进,触摸操作和自然语言交互五五开进行互补才是更好的方式。
最后聊聊以终为始思考问题,如果你想集成 AI 能力或者从 0 到 1 做 AI 产品,一定要思考好你的产品阶段性状态是什么样的,最终目标状态是什么样的,然后倒退回来一步步往前迭代,以我正在做的 toB 产品 AI 改造路径为例,可以分为三个阶段:
1.
第一阶段:帮助用户从复杂的后台中抽离出来,快速理解的系统,能够快速找到想要的功能。
a.
单个功能:对单个功能的作用定义清楚,转化为提示词
b.
子工作流:对局部几个关系紧密的功能,交互流程进行提炼,转换为提示词
c.
整体工作流:整合所有子工作流,转换为编排流
2.
第二阶段:工作流 Copilot ,既能理解系统的功能,也能从业务的最佳实践出发,根据用户的具体情况,进行推理分析,综合各种因素给出用户行动建议。