输入“/”快速插入内容

奇绩大模型日报(9月 13日)

2024年9月15日修改
资讯
OpenAI o1比博士还“聪明”,全球11位AI大咖怎么看?
“好评”阵营:
Sam Altman(OpenAI CEO):认为OpenAI o1是迄今为止最强大的模型,尽管仍有缺陷,但其推理能力开创了AI的新范式。
Greg Brockman(OpenAI总裁):强调o1是通过强化学习训练的模型,改进了推理质量和解释性,虽然技术仍处早期,但展现了巨大潜力。
Jason Wei(OpenAI研究员):指出o1的思维链机制能够自适应地进行推理,在科学问题上表现出色,并重新定义了深度学习领域。
Jim Fan(英伟达高级科学家):认为这是自Chinchilla缩放定律以来最重要的进展,o1突破了推理瓶颈,是AI领域的一大飞跃。
James Campbell(卡内基梅隆大学博士生):展示了o1在数学比赛中的出色表现,并认为它显著超越了GPT-4。
“中差评”阵营:
Clement Delangue(HuggingFace CEO):批评称o1并不具备真正的“思考”能力,认为OpenAI夸大了它的智能,实际上是预测系统而非人类智能。
Gary Marcus(纽约大学教授):虽然认可o1的进展,但指出它距离AGI还很遥远,且没有完全取代GPT-4的表现,夸大了部分结果。
Ethan Mollick(沃顿商学院教授):认为o1在规划复杂问题上表现出色,但其智能仍依赖于GPT-4,存在错误和局限性。
Aravind Srinivas(Perplexity CEO):认为单纯依赖大语言模型的推理不够可靠,建议结合代码执行和知识图谱来提升模型的实用性。
50%
50%
Reflection开源大模型造假风波
质疑主要集中在测试成绩和模型来源。第三方机构Artificial Analysis测试发现,Reflection在多个基准测试(如MMLU、GPQA、MATH)中的成绩无法复现,表现甚至不如Llama 3.1-70B。官方辩解称发布的版本有误,但后续的测试成绩依旧未达到官方宣称的高度。同时,有人对Reflection的各层进行了分析,认为它是由Llama 3改造而来,而非官方声称的Llama 3.1。
更严重的指控是Reflection被认为套壳Claude。多个迹象显示,Reflection与Claude 3.5 Sonnet的输出高度相似,并且在特定情况下模型会承认自己是Claude。对此,Reflection的数据供应商Glaive AI创始人Sahil Chaudhary回应称,模型并未套壳,目前正在整理相关证据。
事件的幕后细节也被披露。Reflection发布前曾寻求Hyperbolic平台的托管支持,但测试发现该模型的成绩与宣传不符,官方后来提供了更新版本,仍未达预期。最终,托管平台决定下线Reflection的API。
50%
50%
国产GPU独角兽启动IPO
9月11日,中国证监会公布上海壁仞科技股份有限公司的IPO辅导备案,辅导券商为国泰君安。壁仞科技是一家专注于通用计算体系研发的GPGPU独角兽,成立于2019年,注册资本3291.64万元。该公司在AI训练和推理领域致力于突破国产高端智能计算芯片,2022年推出的首款通用GPU产品“壁砺系列”已量产,并广泛应用于大模型和生成式AI等场景。
截至目前,壁仞科技已完成超过50亿元人民币的B轮融资,投资方包括珠海大横琴集团、格力创投、中国平安等知名机构。根据2024年胡润全球独角兽榜,壁仞科技估值155亿元,位列第495名。主要股东包括壁仞科技创始人张文(持股12.48%)、QM120 Limited(5.58%)等。
50%
50%
边缘智能的新时代:端侧大模型的研究进展综述
近年来,随着Transformer架构的发展,LLMs如OpenAI的GPT和Meta的LLaMA系列引领了自然语言处理领域的变革。然而,这些模型主要部署在云端,导致网络延迟、数据安全等问题。为此,边缘设备上的LLMs部署应运而生。
部署LLMs在边缘设备上的主要技术挑战包括计算能力和内存的限制。通过模型压缩技术如量化、剪枝和知识蒸馏,研究人员有效地降低了模型大小,提升了运行效率。此外,硬件加速技术如NVIDIA的Tensor Cores、Google的TPU,以及边缘云协同计算框架(如EdgeShard)等,使得LLMs在边缘设备上的推理速度和内存利用率显著提升。
50%
50%