输入“/”快速插入内容

信鑫：基于大模型 + 知识库的 Code Review 实践

2024年3月1日修改

📗

作者：信鑫

抛砖引玉，作者对大模型 LLMs 认知有限，有不当之处望大家指正！​

背景

想法源于在一次 Code Review 时，向 Claude 询问哪种写法代码更优雅得来。当时就想能不能让 AI 帮我们辅助做 Code Review？​

痛点

•

安全合规问题：公司内代码直接调 ChatGPT / Claude 会有安全/合规问题，为了使用 ChatGPT / Claude 需要对代码脱敏，只提供抽象逻辑，这往往更花时间。

◦

•
低质量代码耗费时间：达人业务每天至少 10~20 个 MR 需要 CR，虽然提交时 MR 经过 单测 + Lint 过滤了一些低级错误，但还有些问题（代码合理性、经验、MR 相关业务逻辑等）需要花费大量时间，最后可以先经过一轮自动化 CR，再进行人工 CR，可大大提升 CR 效率！​

•
团队 Code Review 规范缺少执行：大部分团队的 Code Review 停留在文档纸面上，成员之间口口相传，并没有一个工具根据规范来严格执行。​

介绍

一句话介绍就是：基于开源大模型 + 知识库的 Code Review 实践，类似一个代码评审助手（CR Copilot）。​

特性

符合公司安全规范，所有代码数据不出内网，所有推理过程均在内网完成​

•
开箱即用：基于 Gitlab CI，仅 10 几行配置完成接入，即可对 MR 进行 CR。​

•
数据安全：基于开源大模型做私有化部署，隔离外网访问，确保代码 CR 过程仅在内网环境下完成。​

•
♾ 无调用次数限制：部署在内部平台，只有 GPU 租用成本。​

信鑫：基于大模型 + 知识库的 Code Review 实践​