加载失败,
- 奇绩大模型日报(8月 1日)
- 资讯
- 谷歌开源Gemma 2 2B
- Neura展示仿人机器人4NE-1
- 斯坦福alphaXiv讨论平台上线
- 英伟达股价又迎大涨,单日市值暴增3290亿美元再创纪录
- AI 收入激增881%,AMD 想当另一个英伟达
- 浪潮CPU通用服务器运行千亿参数大模型
- Ampere Arm CPU最新路线图,配备 512 个核心和 AI 加速器的芯片将亮相
- 推特
- Karpathy分享从一个晶体管到1个小型GPU的旅程
- Friend:将数字朋友无缝融入你的生活
- Shunyu Yao官宣加入OpenAI
- 奥特曼谈OpenAI安全性的几项快速更新
- Deeplearning AI:《嵌入模型:从架构到实现》
- 论文
- 大语言模型:通过重复采样扩展推断计算
- 衡量重要性:内在距离保持作为嵌入质量的稳健度量
- 大规模协作学习
- 具有泛化值函数逼近的可处理且可证明高效的分布式强化学习
- 通过滑动生成和自洽性提高大语言模型在总结中的忠实度
- LLMs的经济有效幻觉检测
- 适应性大语言模型的预训练数据检测:通过意外的token
- 产品
- Outlit
- Simple Draw
- HuggingFace&Github
- ComfyUI-segment-anything-2
奇绩大模型日报(8月 1日)
奇绩大模型日报(8月 1日)
2024年8月2日修改
资讯
谷歌开源Gemma 2 2B
谷歌最近开源了一系列端侧小模型 Gemma 2,其中 Gemma 2 2B 版本在 LMSYS Chatbot Arena 中的表现超越了参数更多的 GPT-3.5-Turbo 和 Mixtral-8x7b,仅凭 20 亿参数就获得了 1130 分的评分。这一成就标志着 Gemma 2 2B 在端侧模型领域的优势。苹果的机器学习研究团队展示了 Gemma 2 2B 在 iPhone 15 Pro 上的运行速度,证明了其适合移动设备应用。此外,谷歌还构建了一个安全内容分类器模型 ShieldGemma 和一个模型可解释性工具 Gemma Scope,以提高模型的安全性和透明度。ShieldGemma 用于过滤 AI 模型的输入和输出,确保用户安全;而 Gemma Scope 则提供了对模型内部工作原理的深入洞察。这些新成果体现了谷歌在负责任 AI 领域的持续探索,并可能引领 AI 发展趋势,从追求模型规模的扩大转向更小、更高效的模型。
附件不支持打印
加载失败,