输入“/”快速插入内容

奇绩大模型日报(7月 17日)

2024年7月18日修改
资讯
Mistral AI两连发:7B数学推理专用、Mamba2架构代码大模型
昨天,AI圈竟然被「9.11和9.9谁大」这样简单的问题攻陷了,包括OpenAI GPT-4o、Google Gemini等在内的大语言模型都翻了车。这让我们看到,大语言模型在处理一些数字问题时并不能像人类那样理解并给出正确的答案。
对于数字以及复杂的数学问题,专用模型更术业有专攻。今天,法国大模型独角兽 Mistral AI发布了一个专注于数学推理和科学发现的7B大模型「Mathstral」,来解决需要复杂、多步骤逻辑推理的高级数学问题。该模型基于 Mistral 7B 构建,支持的上下文窗口长度为32k,遵循的开源协议为Apache 2.0 license。Mathstral在构建时追求出色的性能与速度权衡,这是 Mistral AI积极推广的一种开发理念,尤其是微调功能。
50%
50%
无损加速最高5x,EAGLE-2让RTX 3060的生成速度超过A100
自回归解码已经成为了大语言模型(LLMs)的事实标准,大语言模型每次前向计算需要访问它全部的参数,但只能得到一个token,导致其生成昂贵且缓慢。今日,一篇题为《EAGLE-2: Faster Inference of Language Models with Dynamic Draft Trees》的论文提出了动态草稿树投机采样,依据草稿模型的置信度动态调整草稿树的结构,最高可以将大语言模型的推理速度提高5倍,同时不改变大语言模型的输出分布,确保无损。
50%
50%
快手开源LivePortrait,GitHub 6.6K Star,实现表情姿态极速迁移
近日,快手可灵大模型团队开源了名为LivePortrait的可控人像视频生成框架,该框架能够准确、实时地将驱动视频的表情、姿态迁移到静态或动态人像视频上,生成极具表现力的视频结果。
50%
50%
哈佛华人创业者创办的 AI 搜索平台 Exa 获英伟达、YC 以及 Lightspeed 1700 万美元融资
致力于开发 AI 原生搜索引擎的初创公司 Exa 宣布,完成由 Lightspeed() 领投的 1700 万美元 A 轮融资,其他投资者还包括 Nvidia 风险投资部门 NVentures 和 Y Combinator()
据悉,Exa 目标是为 AI 平台提供高效、准确的信息检索服务。此前,Exa 已筹集了 500 万美元的种子轮融资,总融资额达到 2200 万美元。
50%
50%
推特
Karpathy创业!Eureka Labs,AI+教育