适合小白的Llama3部署和微调教程

3月7日修改
一、引言
一个致力于使用 AI 技术将自己打造为超级个体的程序员。
作为一名程序员,我对大模型技术是非常向往的,但是因为是非科班出身,一直迟迟没有动手。
在 Llama3 出来之后,我萌生了微调的想法,我的目的很简单,不是为了学习多么高深的知识,而是让自己先入门。
入门最好的方式就是直接上手实操,这是也是之前的一系列教程中所强调的理念。
由于市面上没有找到专门针对我们纯小白的教程,所以这篇教程就来啦!
这篇教程的亮点
教你如何购买算力,不再为本地电脑的配置不够而发愁
手把手教你下载并部署 Llama3 模型,以前都是玩别人部署的,这次咱们玩自己的!)
使用甄嬛数据集微调 Llama3 模型,并且针对微调后的模型进行实验
了解微调的意义和概念
但是这篇教程不会讲解微调的技术性原理以及文中会用到的 Python 代码。
原因很简单,因为我是一位 Java 开发工程师,里面的代码我都是靠 GPT4.0 帮我读的
另外这篇教程需要你充值 50 块钱,不过不是给我哦,是购买算力的预充值。
我不想因为 50 块钱把你劝退,所以这里我要多说一句,免费的才是最贵的。看完我的教程,你绝对会认为这 50 块钱花的很值
OK,都交代清楚,大家按照决定是否要继续享用,废话不多少,我们直接开始
二、大模型微调
微调的概念和意义
在人工智能领域,我们通常会根据应用领域将大模型分为两类
通用大模型
领域特定模型。