输入“/”快速插入内容

2024 年 AI 领域重大事件一览

3月3日修改
1.
智谱 AI 发布新一代基座大模型 GLM-4
时间:2024 年 1 月 16 日
产品名称:GLM-4
产品亮点:支持更长的上下文,具备多模态能力,长文本理解,自主理解复杂指令和个性化智能体定制功能,整体性能相比上一代大幅提升,逼近 GPT-4。
影响:GLM-4 的发布推动了中文 AI 模型的发展,提供了无需编程基础即可便捷开发大模型的新途径,降低了大模型的使用门槛,为 AI 技术的普及和应用提供了新的可能性。
2.
OpenAI 发布视频生成模型 Sora
时间:2024 年 2 月 16 日
产品名称:Sora
产品亮点:用户输入一段文字即可生成长达一分钟的高清视频,具有场景切换流畅、细节呈现清晰、情感表达准确的特征。
影响:这一突破将 AIGC 推向大众视野,预示着 AIGC 在游戏、影视、出版、金融、数字人等多个应用场景中的潜力和价值。
3.
Suno AI 发布音乐生成模型 V3
时间:2024 年 2 月 23 日
产品名称:Suno V3
产品亮点:Suno V3 能够在几秒内创作出长达 2 分钟的完整歌曲,支持多种音乐风格,如古典、爵士、Hiphop 和电子等,并且提供广播级音乐质量。
影响:Suno V3 的发布预示着 AI 音乐生成技术的重大进步,推动了音乐创作的普及和创新,同时引入的 AI 音乐水印系统保护了创作者的作品版权。
4.
Anthropic 发布 Claude 3 系列模型
时间:2024 年 3 月 4 日
产品名称:Claude 3
产品亮点:Claude 3 系列包括 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus 三个子模型,提供不同层次的智能、速度和成本选择。Claude 3 Opus 在多项性能基准测试中全面领先,具备强大的多模态视觉能力和 200k 超长上下文支持。
影响:Claude 3 系列模型的发布,为 AI 领域带来了显著的性能提升,特别是在需要复杂推理和长文本处理的应用场景中。
5.
KimiChat 发布支持 200 万上下文的语言模型
时间:2024 年 3 月 15 日
产品名称:KimiChat 200w
产品亮点:KimiChat 推出的新模型能够处理高达 200 万字符的上下文信息,显著提升了对话系统的理解和生成能力,为复杂的对话场景提供了更深层次的语言处理技术。
影响:此技术的发布引发了市场上对人工智能概念股的热潮,显示出投资者对于高上下文处理能力 AI 技术的高度认可和期待,推动了 AI 语言模型技术在金融、教育、医疗等多个行业的潜在应用和发展。
6.
谷歌发布 Gemini 1.5 Pro AI 模型
时间:2024 年 4 月 10 日
产品名称:Gemini 1.5 Pro
产品亮点:提供本地音频(语音)理解功能,处理上下文从 12.8 万个 token 增加到 100 万个 token,相当于 70 万单词或 3 万行代码。
影响:作为谷歌面向企业的 AI 开发平台,Gemini 1.5 Pro 的更新强化了谷歌在 AI 领域的竞争力,特别是在处理大规模语言模型方面。
7.
Udio 发布 AI 音乐生成工具
时间:2024 年 4 月 10 日
产品名称:Udio
产品亮点:Udio 是一款 AI 音乐创作工具,能够根据文本描述生成多种风格的高保真音乐,包括流行、说唱、福音、蓝调等,支持生成人声及纯音乐。
影响:Udio 的发布推动了 AI 音乐生成技术的普及,为音乐创作提供了新的可能性,对音乐产业和创意领域产生了积极的影响。
8.
Meta 发布 Llama 3
时间:2024 年 4 月 18 日
产品名称:Llama 3
产品亮点:包含 8B 和 70B 参数版本,经过 15T token 的预训练,性能在多个基准测试中领先,采用改进的 Transformer 架构和分组查询注意力技术。
影响:作为开源模型,Llama 3 的发布提升了 AI 技术的开放性和可访问性,推动了 AI 领域的发展,同时展示了 Meta 在 AI 和芯片技术方面的实力。
9.
DeepSeek 开源其全新第二代 MoE 大模型
时间:2024 年 5 月 7 日