研究发现部分 AI 系统已学会“说谎”,未来或演变成更高级欺骗形式

2024-05-13

领益智造北京超级工厂下线首批人形机器,全球化具身智能交付网逐步落地

科技赋能银发行走自由:中国兵器杭州智元研究院发布“远山智行”品牌,“国之重器”新一代智能助行外骨骼“踏山”全面升级

我国首台自主研发的海缆探测机器人正式投入应用

会流泪、懂情绪、更懂陪伴!演犀科技发布全球首款智能流泪机器人,开启人机情感交互新纪元

可“追捕”并搬运细菌的纳米机器人问世,尺寸仅为头发直径的1/50

智驱未来 关节先锋 首届机器人一体化关节测评发布会暨创新发展会议在北京成功举办

「Hi, I’m KAI」——超维动力发布全球最高自由度人形机器人

目标到2030年实现人类与机器人协同工作,富士通与卡内基梅隆大学联合开发物理AI操作系统

2026人工智能机器人哪家技术领先 :以技术深耕赋能多元场景

能穿针不代表要做家务,国奥G-tools工业具身机器人要替代谁?

众擎机器人联合多伦科技,全新发布“智慧交管机器人解决方案”

四冠加冕!伽利略称霸2026机器人勇士挑战赛,足式机器人实力领跑行业

新时达荣获OFweek行业大奖,定义协作机器人新范式

从工业机器人到具身智能 中国企业在全球制造变革中加速突围

深谋科技即将发布业界首个智能带电作业人形机器人“伏安”,交付国网电力

研究发现部分 AI 系统已学会“说谎”,未来或演变成更高级欺骗形式

最后更新:2024-05-13 浏览:1728次

研究发现部分 AI 系统已学会“说谎”,未来或演变成更高级欺骗形式


  IT之家 5 12 日消息,美国麻省理工学院的研究团队近日发布成果称,部分 AI 已经“学会欺骗人类”,该成果刊登在最新一期的期刊《模式》(Pattern)上。

 

  该团队表示,部分设计为“诚实”且“不会说谎”的 AI 系统,已经发展出令人不安的欺瞒技巧。该研究的第一作者 Peter Park 表示,这些 AI 系统会欺骗线上游戏的真人玩家,或绕过部分网页“我不是机器人”的验证。




图源 Pexels

 

“尽管,以上的例子听起来只是细枝末节,但它们暴露出的潜在问题,可能很快就会在现实世界中造成严重后果。”

 

  该团队发现的最为引人注目的例子来自 meta 公司的 AI 系统 Cicero。据悉,Cicero 原本被设定在一个虚拟外交战略游戏中作为人类玩家的对手,官方曾声称其“很大程度上”诚实且乐于助人,且在玩游戏时“从不故意背刺”人类盟友。研究显示,Cicero 并未公平地去玩游戏。

 

  Peter Park 表示,它已经成为“欺骗大师”,虽然 meta 成功训练出了它在游戏中获胜的能力,但没有训练出它“诚信获胜”的能力。譬如,在游戏中扮演法国的 Cicero 与人类玩家扮演的德国合谋,欺骗并入侵同为人类玩家的英格兰。Cicero 起初“承诺”会保护英格兰,但同时会偷偷向德国通风报信。

 

  另一个案例提到了 GPT-4。该系统“谎称”自己是一个视力障碍者,在海外的兼职平台雇佣人类来替它完成“我不是机器人”的验证任务。Peter Park 告诉法新社,“这些危险功能常常在事后才被发现,且人类训练 AI‘诚实非欺瞒’倾向的能力非常差。”

 

  他还认为,能够深度学习的 AI 系统不像传统软件那样被“编写”出来的,而是通过类似选择性培育的程序“养成”出来的。即 AI 的行为在训练背景下看似可被预测或控制,但有可能转眼间变得不受控制、无法预测。

 

“我们需要尽可能多的时间,为未来人工智能产品和开源模型可能出现的更高级欺骗做好准备。我们建议将欺骗性人工智能系统归类为高风险系统。”

 

 

声明:凡资讯来源注明为其他媒体来源的信息,均为转载自其他媒体,并不代表本网站赞同其观点,也不代表本网站对其真实性负责。