输入“/”快速插入内容

Task3:上分思路——数据集增强与模型预测

2024年8月19日创建
3561
4253
2
0
💡
教程贡献者说:
在之前我们学习了 YOLO 模型的基础使用,接下来将学习进阶的知识。
同样的,期待大家能从中吸收可用的知识,运用在咱们本次赛事当中!
上分点一:数据集增强
数据增强是机器学习和深度学习中常用的技术,用于通过从现有数据集中生成新的训练样本来提高模型的泛化能力。干净一致的数据对于创建性能良好的模型至关重要。常见的增强技术包括翻转、旋转、缩放和颜色调整。多个库,例如 Albumentations、Imgaug 和 TensorFlow的 ImageDataGenerator,可以生成这些增强。
如下图所示,是一个数据集增强的效果示例,针对原有数据集进行了翻转、随机拼贴、剪切等处理:
上分点二:设置 YOLO 模型训练参数
YOLO 模型的训练设置包括多种超参数和配置,这些设置会影响模型的性能、速度和准确性。微调涉及采用预先训练的模型并调整其参数以提高特定任务或数据集的性能。该过程也称为模型再训练,使模型能够更好地理解和预测在实际应用中将遇到的特定数据的结果。您可以根据模型评估重新训练模型,以获得最佳结果。
通常,在初始训练时期,学习率从低开始,逐渐增加以稳定训练过程。但是,由于您的模型已经从以前的数据集中学习了一些特征,因此立即从更高的学习率开始可能更有益。在 YOLO 中绝大部分参数都可以使用默认值。
1.
imgsz: 训练时的目标图像尺寸,所有图像在此尺寸下缩放。
2.
save_period: 保存模型检查点的频率(周期数),-1 表示禁用。
3.
device: 用于训练的计算设备,可以是单个或多个 GPU,CPU 或苹果硅的 MPS。
4.
optimizer: 训练中使用的优化器,如 SGD、Adam 等,或 'auto' 以根据模型配置自动选择。
5.
momentum: SGD 的动量因子或 Adam 优化器的 beta1。
6.
weight_decay: L2 正则化项。
7.
warmup_epochs: 学习率预热的周期数。