python3 -m lmdeploy.lite.apis.calibrate \
--model $HF_MODEL \ # huggingface 模型位置
--calib_dataset 'c4' \ # 校准数据集,支持 c4, ptb, wikitext2, pileval
--calib_samples 128 \ # 校准集的样本数,如果显存不够,可以适当调小
--calib_seqlen 2048 \ # 单条的文本长度,如果显存不够,可以适当调小
--work_dir $WORK_DIR \ # 保存 Pytorch 格式量化统计参数和量化后权重的文件夹
python3 -m lmdeploy.lite.apis.auto_awq \
--model $HF_MODEL \ # huggingface 模型位置
--w_bits 4 \ # 权重量化的 bit 数
--w_group_size 128 \ # 权重量化分组统计尺寸
--work_dir $WORK_DIR \ # 上一条命令保存参数的目录