加载失败,
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
2024年8月12日修改
本工作由 清华大学 朱军 教授领衔的基础理论创新团队发起。长期以来,团队着眼于目前 人工智能 发展的瓶颈问题,探索原创性 人工智能 理论和关键技术,在智能算法的对抗安全理论和方法研究中处于国际领先水平,深入研究 深度学习 的对抗鲁棒性和数据利用效率等基础共性问题。相关工作获吴文俊 人工智能 自然科学一等奖,发表CCF A类论文100余篇,研制开源的ARES对抗攻防算法平台(https://github.com/thu-ml/ares),并实现部分专利产学研转化落地应用。
以GPT-4o为代表的多模态大 语言模型 (MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域,掀起了一场技术革命。
然而,多模态大模型是否安全可靠呢?
附件不支持打印
如图1所示,通过对抗攻击修改图像像素,GPT-4o将新加坡的鱼尾狮雕像,错误识别为巴黎的埃菲尔铁塔或是伦敦的大本钟。这样的错误目标内容可以随意定制,甚至超出模型应用的安全界限。
附件不支持打印