加载失败,
- 奇绩大模型日报(7月 17日)
- 资讯
- Mistral AI两连发:7B数学推理专用、Mamba2架构代码大模型
- 无损加速最高5x,EAGLE-2让RTX 3060的生成速度超过A100
- 快手开源LivePortrait,GitHub 6.6K Star,实现表情姿态极速迁移
- 哈佛华人创业者创办的 AI 搜索平台 Exa 获英伟达、YC 以及 Lightspeed 1700 万美元融资
- 推特
- Karpathy创业!Eureka Labs,AI+教育
- Llama 3 Groq Tool Use 8B和70B模型:Llama 3的开源工具使用完全微调版本
- 手写简单AI数学:线性层 - 练习10
- Maxime Labonne宣布新书:《LLM工程师手册》
- SmolLM:一系列新的SOTA模型,包括135M、360M和1.7B,完美适用于设备端部署
- 产品
- Riffo.ai
- Blaze
- HuggingFace&Github
- Praison AI
- OpsPilot
- 投融资
- 星海图获得新一轮融资
- World Labs获得新一轮融资
- Anysphere获OpenAI支持,完成4亿美元新一轮融资
- Exa获得1700万美元融资,由Lightspeed、NVIDIA和Y Combinator领投
- Adaptive完成1900万美元A轮融资以利用AI和自动化变革建筑金融
- Mira完成由BITKRAFT Ventures和Framework Ventures领投的900万美元种子轮融资
- Vectara获得2500万美元A轮融资以推进Retrieval-Augmented Generation的可信度
- 学习
- 由GQA性能数据异常引发的对MHA,GQA,MQA 在GPU上的感性分析
奇绩大模型日报(7月 17日)
奇绩大模型日报(7月 17日)
2024年7月18日修改
资讯
Mistral AI两连发:7B数学推理专用、Mamba2架构代码大模型
昨天,AI圈竟然被「9.11和9.9谁大」这样简单的问题攻陷了,包括OpenAI GPT-4o、Google Gemini等在内的大语言模型都翻了车。这让我们看到,大语言模型在处理一些数字问题时并不能像人类那样理解并给出正确的答案。
对于数字以及复杂的数学问题,专用模型更术业有专攻。今天,法国大模型独角兽 Mistral AI发布了一个专注于数学推理和科学发现的7B大模型「Mathstral」,来解决需要复杂、多步骤逻辑推理的高级数学问题。该模型基于 Mistral 7B 构建,支持的上下文窗口长度为32k,遵循的开源协议为Apache 2.0 license。Mathstral在构建时追求出色的性能与速度权衡,这是 Mistral AI积极推广的一种开发理念,尤其是微调功能。
附件不支持打印
无损加速最高5x,EAGLE-2让RTX 3060的生成速度超过A100