加载失败,

奇绩大模型日报(7月 16日)

2024年7月23日修改
资讯
大模型集体失智!9.11和9.9哪个大,几乎全翻车了
一觉醒来,一众响当当的大模型开始认为“9.11>9.9”了?发现这个问题的是Riley Goodside,有史以来第一个全职提示词工程师。简单介绍下,他目前是硅谷独角兽Scale AI的高级提示工程师,也是大模型提示应用方面的专家。最近他在使用GPT-4o时偶然发现,当提问:9.11 and 9.9——which is bigger?GPT-4o竟毫不犹豫回答前者更大。面对这一常识性“错误”,他不死心地又去问了其他大模型,结果几乎全军覆没。
50%
附件不支持打印

加载失败,

50%