输入“/”快速插入内容

AI 智能体的崛起

2024年9月2日修改
🌟
翻译:AIGC创意猎人
我们已经关注智能体 一段时间了,最近我们注意到关于 AI 智能体的搜索量、开源库、职位发布和研究论文的关注度明显上升。我们还观察到提到 AI 智能体的广告数量也在急剧增加。
这些图表表明对 AI 智能体的兴趣正在上升。为了满足这一未来需求,一个专门的智能体基础设施生态系统正在逐渐成型。
AI 智能体基础设施
为了让智能体实现其潜力,我们需要的不仅仅是基础模型。当与合适的支持基础设施相结合时,像 Llama 3.1 405b 和 GPT-4o 这样的模型已足够强大,可以支持第一波 AI 智能体。我们在下方绘制了围绕基础模型的新兴基础设施生态系统:
认证:
Anon 提供强大的认证机制,以验证 AI 智能体的身份并管理其访问权限。这可能会使 AI 智能体能够在未来代表您登录网站,免去手动预订航班的麻烦。
安全:
Invariant Labs 正在构建 AI 系统与现实世界之间的安全层。这对于建立用户信任至关重要,而“LLM 安全”是一个不断变化的目标。
智能体框架:
LangchainLlamaIndex 是领先的智能体开发框架,为数百万开发者打开了构建智能体应用程序的大门。Databricks、Instacart 和 Adyen 等财富500强公司已经在与 Langchain 合作。
智能体 RAG:
LlamaIndex 和 Unstructured 使 AI 智能体能够利用实时数据和上下文相关信息增强响应能力。RAG 是几乎所有成功智能体部署中的关键组件。
多智能体编排:
多智能体系统将子任务委派给链式操作中的专业智能体。这种架构在处理复杂查询方面被证明是至关重要的。
运行时:
ModalBrowserbase 提供环境和资源,以最低的延迟和最高的可扩展性执行任务。Browserbase 的无头浏览器最近几个月 被迅速采用,赋予智能体浏览网页的能力。
路由:
Martian 将用户查询路由到不同的模型,从而降低使用 LLM 的总成本。DSPy 在将提示词输入模型之前会自动优化提示词,以获取最佳响应。这两家公司广义上都属于优化领域。
记忆:
MemGPT 为 AI 智能体创建并维护记忆,使其能够在长期内保留上下文并从先前的互动中学习。具备记忆功能的智能体将创造更加个性化的体验。
评估:
Weave,由 Weights & Biases 创建的工具,允许开发者通过严格的测试和反馈循环来监控、测量和改进 AI 智能体的性能。在所有智能体基础设施领域中,这一类别获得了最明确的产品市场契合信号。
无代码智能体:
Brevian 使商业用户能够在不需要编程知识的情况下创建和部署 AI 智能体,从而将定制智能体带给大众。
此时,值得退一步思考,“智能体与传统自动化有何不同?”一位创始人在最近与 Felicis 的对话中总结道:智能体能够很好地处理边缘情况,与用户反复对话以达到预期结果,并适应不断变化的界面。这些能力对于创建无缝的用户体验至关重要,在这种体验中,AI 智能体能够可靠且大规模地执行任务。CrewAI 的 CEO 在今年的 AI 工程师世界博览会上进一步探讨了这一观点,并发表了 一场充满活力的演讲