输入“/”快速插入内容

全球AI 大模型全栈技术研究报告 2024

2024年4月18日修改
🎨
经过大规模预训练的大模型,能够在各种任务中达到更高的准确性、降低应用的开发门槛、增强模型泛化能力等,是AI 领域的一项重大进步。大模型最早的关注度源于 NLP 领域,随着多模态能力的演进,CV 领域及多模态通用大模型也逐渐成为市场发展主流。政企的极大关注带动了行业领域大模型的高速发展,逐渐形成了多模态基模型为底座的领域大模型和行业大模型共同发展的局面。
伴随基于大模型发展的各类应用的爆发,尤其是生成式 AI,为用户提供突破性的创新机会,打破了创造和艺术是人类专属领域的局面。AI 不再仅仅是“分类”,而且开始进行“生成”,促使大模型带来的价值进一步升级到人类生产力工具的颠覆式革新。同时,数据规模和参数规模的有机提升,让大模型拥有了不断学习和成长的基因,开始具备涌现能力(Emergent Ability),逐渐拉开了通用人工智能(AGI)的发展序幕。
过去几年,国内外的 AI 厂商均在大模型领域有所布局。OpenAI 在 2019 年发布了GPT-2 大模型,国内互联网科技厂商也集中在 2020-2022 三年期间相继发布了自己的大模型。ChatGPT 的发布,掀起一波发展热潮,原有厂商基于自身大模型开始推出一系列生成式 AI 应用,并对外提供 API 接口。更多的创业公司、科研机构和新的科技厂商涌入该市场,发布相关的产品服务。
过去几年,国内外的 AI 厂商均在大模型领域有所布局。OpenAI 在 2019 年发布了GPT-2 大模型,国内互联网科技厂商也集中在 2020-2022 三年期间相继发布了自己的大模型。ChatGPT 的发布,掀起了一波发展热潮,原有厂商基于自身大模型开始推出一系列生成式 AI 应用,并对外提供 API 接口。更多的创业公司、科研机构和新的科技厂商涌入该市场,发布相关的产品服务。
大模型人气高涨,吸引了用户的关注,不仅是 CIO、CTO 等技术决策人员,CEO、CFO 等业务决策人员也同样希望发挥此类模型在业务用例中的潜力。用户关注度的跃升成为对厂商自身能力的考验,前期已具备全栈大模型构建能力的厂商开始显现积累优势。为帮助用户了解国内大模型市场的发展情况、厂商格局和竞争地位,我们研究团队通过详实的访谈调研,对中国市场提供大模型产品服务的厂商进行了深入的分析和评估。
全球知名大模型发布时间节点
关键发现点
AI 大模型的高速发展离不开底层技术支持和应用场景迭代。大模型作为 AGI 时代的曙光,相关厂商也将迎来广阔的发展空间。本报告将呈现从发展现状、驱动因素洞察 AI 大模型厂商竞争与发展关键点,并推演竞争格局的逻辑分析过程:
• 前瞻洞察:通向 AGI 的技术路径具有多元性,目前大模型是最佳实现方式。大模型具有强大的泛化性、通用性和实用性,能够降低 AI 开发门槛、提高模型精度和泛化能力、提高内容生成质量和效率等多种价值,实现了对传统 AI 技术的突破,并成为 AGI的重要起点。进而将 AI 发展由数据飞轮升级到智慧飞轮,最终迈向人机共智。大模型和 人类反馈的强化学习( RLHF )的结合,进一步重构了AI 开发范式,进入大模型主导的软件 2.0 时代。另一方面,AI 开发则形成新的“二八定律”,开发者的生产力将得到极大释放。
• 驱动因素:大模型“基础设施 - 底层技术 - 基础通用 - 垂直应用”发展路线逐渐清晰,国内各厂商加速战略布局,加大资金和技术投入,迎头赶上全球大模型产业化浪潮,本土化大模型迎来发展新机遇。整体上,行业驱动因素主要包含三个层面:
(1)政策端:政策环境持续优化,赋能AI 大模型市场高速发展。
(2)供给端: 下一代 AI 基础设施等快速发展,助力大模型应用落地。
(3)需求端:AI 市场高景气,大模型下游行业需求旺盛。
• 行业观点:大模型未来发展将趋于通用化与专用化并行 平台化与简易化并进。同时,MaaS 模式将成为 AI 应用的全新形式且快速发展,重构 AI 产业的商业化结构生态,激发新的产业链分工和商业模式。未来,大模型将深入应用于用户生活和企业生产模式,释放创造力和生产力,活跃创造思维 、重塑工作模式,助力企业的组织变革和经营效率,赋能产业变革。
• 关键成功因素:大模型面临算力需求大、训练和推理成本高、数据质量不佳等挑战。一个可对外商业化输出的大模型的成功,要求其厂商拥有全栈大模型训练与研发能力、业务场景落地经验、AI 安全治理举措、以及生态开放性 4 大核心优势,才能保证其在竞争中突出重围。其中,全栈大模型训练与研发能力还包括数据管理经验,AI 基础设施建设与运营,以及大模型系统和算法设计 3 个关键要素。
• 竞争格局:在竞争格局渐趋明晰的过程中,相关厂商需跨越技术、人才、资金等壁垒,在产品技术能力、战略愿景能力、生态开放能力三大维度上展开角逐。通过遴选,报告选择了 5家大模型厂商,分别为商汤、百度、阿里巴巴、华为、腾讯,评价模型包含 15 个一级指标、56 个二级指标,对厂商大模型的各个能力进行评估。
• 用户建议通过此报告能够了解大模型厂商的竞争态势,关注领先厂商,内部创建大模型战略文件,明确其优势、带来的风险和机遇,以及部署路线图,针对具体的用例,权衡模型的优势和风险,并选择合适场景试点、评估大模型的应用价值
章节一
AI大模型掀起时代浪潮,加速通用人工智能(AGI)时代的来临
关键发现
• 以 ChatGPT 的发布为里程碑事件,AI 的发展进入到了继突破工业红线之后的,以 AGI 为发展目标的全新通用智能时代。
• 大模型是通向 AGI 时代的最佳技术路径,并开始在以自动驾驶为代表的场景下所体现。同时,大模型也带来了全新的 AI 开发范式,基模型 + 人工反馈闭环的模式给开发者带来了新的“二八定律”。
• 生成式 AI 成为大模型能力应用的爆发点,以文生文、文生图等内容生成为代表的大模型应用快速增长,并逐渐成为日益完善的生产力工具。
AI 大模型是人工智能预训练大模型的简称,包含了“预训练”和“大模型”两层含义,二者结合产生了新的人工智能模式,即模型在大规模数据集上完成预训练后,仅需少量数据的微调甚至无需微调,就能直接支撑各类应用。这些模型通常具有多层神经网络结构,并使用高级的优化算法和计算资源进行训练,具有强大的泛化性、通用性和实用性,可以在自然语言处理、计算机视觉、智能语音等多个领域实现突破性性能提升。
AI 大模型是人工智能迈向通用人工智能的里程碑技术。以目前热门的 ChatGPT为例,ChatGPT 的最大贡献在于基本实现了理想 LLM 的接口层,能够使 LLM自主适配人的习惯命令表达方式,由此增加了 LLM 的易用性,提升了用户体验。InstructGPT/ChatGPT 首先意识到这个问题,并给出了相应解决方案,较之前 fewshot prompting 方案更符合人类表达习惯。
AI 大模型的内涵与特征
人工智能发展进入以 AGI 为代表的新里程碑阶段
人工智能近年来高速发展,现已经进入了以 AGI 为代表的新里程碑阶段。随着AI 基础设施逐步完善,深度学习技术不断进步,人工智能应用场景逐渐增多,过去模型参数规模和数据量也实现了大幅度增长,为 NLP、CV 等领域带来更强大的表达能力和性能。人工智能发展历程中主要有两大里程碑:
里程碑一:2012 年 CNN 获得 ImageNet第一,标志着机器视觉识别能力开始逐渐超越人眼识别准确率,开启了人工智能革命。随着深度学习技术不断突破,诞生了一批“AI+场景应用”的专属模型,但是整体研发成本比较高、研发时间比较长。
里程碑二:2022 年 ChatGPT 的出现,掀起了又一波人工智能发展热潮,以大模型 + RLHF 为核心的技术落地意味着人工智能开启 AI 新范式。人工智能相关产业开始基于强大的基模型进行发展,通过人类反馈和强化学习不断解锁基模型的能力,以解决海量开放式任务,带来了新的研究范式。
人工智能的发展历程