适合小白的Llama3部署和微调教程
适合小白的Llama3部署和微调教程
3月7日修改
本文的核心代码全部参考如下开源项目:
一、引言
一个致力于使用 AI 技术将自己打造为超级个体的程序员。
作为一名程序员,我对大模型技术是非常向往的,但是因为是非科班出身,一直迟迟没有动手。
在 Llama3 出来之后,我萌生了微调的想法,我的目的很简单,不是为了学习多么高深的知识,而是让自己先入门。
入门最好的方式就是直接上手实操,这是也是之前的一系列教程中所强调的理念。
由于市面上没有找到专门针对我们纯小白的教程,所以这篇教程就来啦!
这篇教程的亮点
•
教你如何购买算力,不再为本地电脑的配置不够而发愁
•
手把手教你下载并部署 Llama3 模型,以前都是玩别人部署的,这次咱们玩自己的!)
•
使用甄嬛数据集微调 Llama3 模型,并且针对微调后的模型进行实验
•
了解微调的意义和概念
但是这篇教程不会讲解微调的技术性原理以及文中会用到的 Python 代码。
原因很简单,因为我是一位 Java 开发工程师,里面的代码我都是靠 GPT4.0 帮我读的
另外这篇教程需要你充值 50 块钱,不过不是给我哦,是购买算力的预充值。
我不想因为 50 块钱把你劝退,所以这里我要多说一句,免费的才是最贵的。看完我的教程,你绝对会认为这 50 块钱花的很值
OK,都交代清楚,大家按照决定是否要继续享用,废话不多少,我们直接开始
二、大模型微调
微调的概念和意义
在人工智能领域,我们通常会根据应用领域将大模型分为两类
•
通用大模型
•
领域特定模型。