加载失败,
是时候解决大模型的信任问题了
是时候解决大模型的信任问题了
2024年8月12日修改
附件不支持打印
加载失败,
胡晓萌 陈力源 刘正源
以ChatGPT为代表AI大语言模型 (LLMs) 是一项具有革命性的技术。它不仅可以像之前的人工智能一样进行分类或预测,还可以通过自然语言与人类对话,生成文本、图像、视频、可执行代码等各种形式的内容,这将对人们的生产生活和社会发展产生深远影响。但是人工智能开发和应用阶段的任何错误都可能是灾难性的。 [1] 现在大语言模型已经面临诸多信任挑战,比如人们越来越无法分辨区分出ChatGPT生成的内容与人类生成的内容;大语言模型存在幻觉问题,会生成错误、具有诱导性的内容,那么人们该如何分辨并信任大语言模型生成的内容;大语言模型还存在偏见、歧视、隐私侵犯、有害言论等多方面伦理风险,继而带来一系列信任危机,甚至遭到业界的抵制和封杀。信任是人工智能发展的一个核心问题,人与技术之间信任关系更是技术发展趋势与人类未来的一个核心问题。 [2] DeepMind首席运营官Lila Ibrahim表示,AI大模型是一种变革性技术,但它只有在得到信任的情况下才能充分发挥潜力。
过去人工智能科学家和科技企业提出可信人工智能的技术框架并开展了大量研发实践。然而,即使科技企业认为他们的人工智能系统是值得信赖的,个人或团体是否愿意冒险并给予它们信任仍然悬而未决。可见从可信到信任,仍然存在较大鸿沟。AI大语言模型正在引领通用人工智能,甚至超人工智能的到来,但是信任问题正在阻碍大语言模型的技术创新与应用。 [3] IBM调研全球近1000名企业高管,研究表明阻碍其企业部署应用AI大模型的主要因素是信任问题。 [4] 因此,建立信任,已经成为AI大语言模型创新发展与应用的必要前提。
一、从可信AI到信任AI:需要跨越的鸿沟
为了应对AI的信任危机,业内积极开展可信AI的探索,旨在确保AI系统的安全性、可解释性、公平性和隐私保护。但是可信AI的理念和大量实践仍然无法使人们信任AI,也就是说从可信AI到信任AI存在一个一个需要跨越的鸿沟。这里需要厘清信任与可信任的关系,并且回到技术本身,从其技术特性和人机关系来寻找建立大语言模型信任的入口。