输入“/”快速插入内容

信鑫:基于大模型 + 知识库的 Code Review 实践

2024年3月1日修改
📗
作者:信鑫
抛砖引玉,作者对大模型 LLMs 认知有限,有不当之处望大家指正!
背景
想法源于在一次 Code Review 时,向 Claude 询问哪种写法代码更优雅得来。当时就想能不能让 AI 帮我们辅助做 Code Review?
痛点
安全合规问题:公司内代码直接调 ChatGPT / Claude 会有安全/合规问题,为了使用 ChatGPT / Claude 需要对代码脱敏,只提供抽象逻辑,这往往更花时间。
低质量代码耗费时间:达人业务每天至少 10~20 个 MR 需要 CR,虽然提交时 MR 经过 单测 + Lint 过滤了一些低级错误,但还有些问题(代码合理性、经验、MR 相关业务逻辑等)需要花费大量时间,最后可以先经过一轮自动化 CR,再进行人工 CR,可大大提升 CR 效率!
团队 Code Review 规范缺少执行:大部分团队的 Code Review 停留在文档纸面上,成员之间口口相传,并没有一个工具根据规范来严格执行。
介绍
一句话介绍就是:基于开源大模型 + 知识库的 Code Review 实践,类似一个代码评审助手(CR Copilot)。
特性
符合公司安全规范,所有代码数据不出内网,所有推理过程均在内网完成
开箱即用:基于 Gitlab CI,仅 10 几行配置完成接入,即可对 MR 进行 CR。
数据安全:基于开源大模型做私有化部署,隔离外网访问,确保代码 CR 过程仅在内网环境下完成。
♾ 无调用次数限制:部署在内部平台,只有 GPU 租用成本。