加载失败,
- 奇绩大模型日报(9月 18日)
- 资讯
- 机器人NEO世界模型登场
- 加州州长纽瑟姆对人工智能法案SB 1047的看法: “我无法解决所有问题”
- Mistral发布新举措
- Triton开发者大会
- Multimodal RAG在LlamaCloud中的应用
- LLaMA3.1-70B模型AQLM-PV压缩版发布
- Nyris & Qdrant:向量如何成为视觉搜索的未来
- 智源推出下一代检索增强大模型框架MemoRAG
- 推特
- ZML:高性能的AI推理框架,能够并行化并在多种硬件上运行深度学习系统
- 帅Otto!让你可以在表格中使用 AI 代理,在几分钟内自动化处理数小时的手动研究工作
- 通过使用自生成数据改进大型语言模型的推理:强化学习和验证器
- Pixtral 12B:由 MistralAI 推出的首款多模态模型
- YC创始人Friedman:垂直大型语言模型agent是新的垂直SaaS
- 论文
- 自注意力机制限制基于Transformer模型的工作记忆容量
- 模型自我指引注意力方向:忠实性与自动注意力引导的结合
- 调查大型语言模型中的上下文忠实性:记忆强度与证据风格的作用
- Less is More: 一种简单而有效的令牌减少方法以提升多模态大型语言模型的效率
- 对量化指令调优大型语言模型的全面评估:405B规模的实验分析
- Unveiling Induction Heads:Transformer中的可证训练动态与特征学习
- Eureka:评估与理解大型基础模型
- 产品
- 字节跳动推出 Seed-Music
- Supademo 3.0
- HuggingFace&Github
奇绩大模型日报(9月 18日)
奇绩大模型日报(9月 18日)
2024年9月18日修改
资讯
机器人NEO世界模型登场
OpenAI月初投资的人形机器人初创公司1X发布了NEO的官宣视频,吸引了广泛关注。NEO不仅外形酷似“穿西装的人”,其能力也相当全面,能够帮助处理家务如拎包和做饭,旨在完成各种人类不愿意做的任务。
1X随后介绍了NEO背后的“世界模型”,这个虚拟世界模拟器能够预测物体间的互动,生成各种环境中的视频。它帮助NEO进行自我反思,尽管自我意识尚未觉醒。世界模型的应用使得NEO能够精确交互,包括处理刚体和可变形物体。
在构建通用机器人时,世界模型解决了评估的问题,特别是在动态环境中对机器人性能的验证。1X创始人表示,这一进展推动了Scaling Law的应用,提升了机器人的学习能力。
世界模型本质上是一个程序,能够模拟智能体行为对世界的影响。通过数百万场景的评估,1X创建的模型可以生成视频并预测未来场景,极大增强了机器人的泛化能力。1X团队在过去一年收集了超过5000小时的数据,训练出能进行多样化输出的强大模型。
不过,1X的世界模型仍存在问题,例如物体在交互过程中可能无法保持一致性,并不完全理解物理法则。此外,模型的自我认知能力尚未成熟,表现为无法同步镜中动作。
总体而言,1X的世界模型为实现通用机器人提供了新方向,但仍需克服技术挑战。
附件不支持打印
加载失败,