输入“/”快速插入内容

奇绩大模型日报（9月 13日）

2024年9月15日修改

资讯

OpenAI o1比博士还“聪明”，全球11位AI大咖怎么看？

https://mp.weixin.qq.com/s/w9chmnT1MTxMeuiTslBdxQ

“好评”阵营：

•
Sam Altman（OpenAI CEO）：认为OpenAI o1是迄今为止最强大的模型，尽管仍有缺陷，但其推理能力开创了AI的新范式。​

•
Greg Brockman（OpenAI总裁）：强调o1是通过强化学习训练的模型，改进了推理质量和解释性，虽然技术仍处早期，但展现了巨大潜力。​

•
Jason Wei（OpenAI研究员）：指出o1的思维链机制能够自适应地进行推理，在科学问题上表现出色，并重新定义了深度学习领域。​

•
Jim Fan（英伟达高级科学家）：认为这是自Chinchilla缩放定律以来最重要的进展，o1突破了推理瓶颈，是AI领域的一大飞跃。​

•
James Campbell（卡内基梅隆大学博士生）：展示了o1在数学比赛中的出色表现，并认为它显著超越了GPT-4。​

“中差评”阵营：

•
Clement Delangue（HuggingFace CEO）：批评称o1并不具备真正的“思考”能力，认为OpenAI夸大了它的智能，实际上是预测系统而非人类智能。​

•
Gary Marcus（纽约大学教授）：虽然认可o1的进展，但指出它距离AGI还很遥远，且没有完全取代GPT-4的表现，夸大了部分结果。​

•
Ethan Mollick（沃顿商学院教授）：认为o1在规划复杂问题上表现出色，但其智能仍依赖于GPT-4，存在错误和局限性。​

•
Aravind Srinivas（Perplexity CEO）：认为单纯依赖大语言模型的推理不够可靠，建议结合代码执行和知识图谱来提升模型的实用性。​

50%

common.docs_name - LarkCCM_Docs_Menu_Image

50%

Reflection开源大模型造假风波

https://mp.weixin.qq.com/s/nFZ80XOukks7f6V-TXV7lg

质疑主要集中在测试成绩和模型来源。第三方机构Artificial Analysis测试发现，Reflection在多个基准测试（如MMLU、GPQA、MATH）中的成绩无法复现，表现甚至不如Llama 3.1-70B。官方辩解称发布的版本有误，但后续的测试成绩依旧未达到官方宣称的高度。同时，有人对Reflection的各层进行了分析，认为它是由Llama 3改造而来，而非官方声称的Llama 3.1。​

更严重的指控是Reflection被认为套壳Claude。多个迹象显示，Reflection与Claude 3.5 Sonnet的输出高度相似，并且在特定情况下模型会承认自己是Claude。对此，Reflection的数据供应商Glaive AI创始人Sahil Chaudhary回应称，模型并未套壳，目前正在整理相关证据。​

事件的幕后细节也被披露。Reflection发布前曾寻求Hyperbolic平台的托管支持，但测试发现该模型的成绩与宣传不符，官方后来提供了更新版本，仍未达预期。最终，托管平台决定下线Reflection的API。​

50%

国产GPU独角兽启动IPO

https://mp.weixin.qq.com/s/E63ZOdSJ-8IJI7bGzS6WIQ

9月11日，中国证监会公布上海壁仞科技股份有限公司的IPO辅导备案，辅导券商为国泰君安。壁仞科技是一家专注于通用计算体系研发的GPGPU独角兽，成立于2019年，注册资本3291.64万元。该公司在AI训练和推理领域致力于突破国产高端智能计算芯片，2022年推出的首款通用GPU产品“壁砺系列”已量产，并广泛应用于大模型和生成式AI等场景。​

截至目前，壁仞科技已完成超过50亿元人民币的B轮融资，投资方包括珠海大横琴集团、格力创投、中国平安等知名机构。根据2024年胡润全球独角兽榜，壁仞科技估值155亿元，位列第495名。主要股东包括壁仞科技创始人张文（持股12.48%）、QM120 Limited（5.58%）等。​

50%

边缘智能的新时代：端侧大模型的研究进展综述

https://mp.weixin.qq.com/s/eUw8bjgDCKeo60EQhM22ow

近年来，随着Transformer架构的发展，LLMs如OpenAI的GPT和Meta的LLaMA系列引领了自然语言处理领域的变革。然而，这些模型主要部署在云端，导致网络延迟、数据安全等问题。为此，边缘设备上的LLMs部署应运而生。​

部署LLMs在边缘设备上的主要技术挑战包括计算能力和内存的限制。通过模型压缩技术如量化、剪枝和知识蒸馏，研究人员有效地降低了模型大小，提升了运行效率。此外，硬件加速技术如NVIDIA的Tensor Cores、Google的TPU，以及边缘云协同计算框架（如EdgeShard）等，使得LLMs在边缘设备上的推理速度和内存利用率显著提升。​

50%

奇绩大模型日报（9月 13日） ​

奇绩大模型日报（9月 13日）