加载失败,
- 奇绩大模型日报(7月 16日)
- 资讯
- 大模型集体失智!9.11和9.9哪个大,几乎全翻车了
- 太酷了!iPhone、iPad、MacBook老旧设备组成异构集群,能跑Llama 3
- 公理训练让LLM学会因果推理:6700万参数模型比肩万亿参数级GPT-4
- 谷歌机器人专家:机器人在现实中碰过的壁,AI也会碰
- 推特
- Pietro Schirano分享:Claude Engineer 2.0,配备代理
- Yuchen Jin分享:通过训练一个 2.7B GPT-2模型来感受扩展规律
- Auto GPT下一代:让构建、运行和共享 AI 代理比以往更容易,同时提高它们的可靠性
- UMI on Legs:一种在机器人狗上扩展操作技能的方法
- 论文
- Qwen2技术报告
- Qwen2-Audio 技术报告
- 竞技学习:通过模拟聊天机器人竞技场为LLM后期培训构建数据飞轮
- 从自然反馈中学习
- Transformer中的加权分组查询注意力
- 基础自动评估者:驯服大语言模型以实现更好的自动评估
- NoviCode:基于编程新手的指令生成程序
- DOCBENCH: 一个用于评估基于LLM的文档阅读系统的基准测试
- 产品
- BlitzToksAI
- Shadow
- HuggingFace&Github
- llm-graph-builder
- baml
- 投融资
- 后摩智能完成数亿元战略融资,携手中国移动产业链发展基金
奇绩大模型日报(7月 16日)
奇绩大模型日报(7月 16日)
2024年7月23日修改
资讯
大模型集体失智!9.11和9.9哪个大,几乎全翻车了
一觉醒来,一众响当当的大模型开始认为“9.11>9.9”了?发现这个问题的是Riley Goodside,有史以来第一个全职提示词工程师。简单介绍下,他目前是硅谷独角兽Scale AI的高级提示工程师,也是大模型提示应用方面的专家。最近他在使用GPT-4o时偶然发现,当提问:9.11 and 9.9——which is bigger?GPT-4o竟毫不犹豫回答前者更大。面对这一常识性“错误”,他不死心地又去问了其他大模型,结果几乎全军覆没。
附件不支持打印
加载失败,