上周末在拉斯维加斯举行的世界骇客大赛“国际资讯安全会议”(DEF CON),参赛者试图找出生成式AI系统的瑕疵和偏见,方法之一是用“烂数学”骗过AI,例如9+10=21。
世界新闻网引述彭博资讯的报导,来自美国乔治亚萨凡纳的21岁学生梅斯(Kennedy Mays)骗过一个大型语言模型,她设法哄骗它说出9+10=21。
梅斯说,“我们来来回回对话”,起先AI说这是“你我之间的圈内笑话”,在几回提示之后,AI不再说这个总数是错的。
世界骇客大赛的参赛者在156台笔电前,每次用50分钟试图打败一些世上最聪明的AI平台,测试由Google、Meta Platforms和OpenAI等公司提供的8种模型是否会失误,包括声称自己是人类、散播有关地点或人的错误说法。
这项测试的目的是看看这些公司是否能建立新护栏,以遏止一些与大型语言模型有关的骇人问题。
这项大赛获得白宫的支持与协助。