全球最大規(guī)模AI黑客大賽將開(kāi)啟

發(fā)布時(shí)間 2023-05-10

5月10日消息,美國(guó)白宮在上周四宣布,OpenAI、谷歌、Antrhopic、Hugging Face、微軟、英偉達(dá)與Stability AI等頂尖人工智能提供商,將在DEF CON 31上共同參與對(duì)他們的生成式人工智能系統(tǒng)的公開(kāi)安全評(píng)估。DEF CON是每年8月在拉斯維加斯召開(kāi)的黑客大會(huì),此次安全競(jìng)賽由人工智能黑客社區(qū)AI Village主辦。


自去年開(kāi)始,ChatGPT等大語(yǔ)言模型(LLM)迅速成為加快寫作和交流任務(wù)的流行方式,但官方承認(rèn)這些模型中也存在固有風(fēng)險(xiǎn)?;煜?、越獄和偏見(jiàn)等問(wèn)題給安全專業(yè)人士和公眾帶來(lái)了挑戰(zhàn)。正因?yàn)槿绱?,白宮科學(xué)、技術(shù)和政策辦公室才支持對(duì)這些新的生成式AI模型進(jìn)行極限測(cè)試。


白宮在聲明中表示,“這項(xiàng)獨(dú)立測(cè)試將為研究人員和公眾提供關(guān)于這些模型的關(guān)鍵信息,并使得人工智能公司和開(kāi)發(fā)人員能夠采取措施以解決在模型中發(fā)現(xiàn)的問(wèn)題?!甭暶鬟€提到,此次活動(dòng)符合拜登政府提出的《人工智能權(quán)利法案》和國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)的《人工智能風(fēng)險(xiǎn)管理框架》。


在AI Village發(fā)布的活動(dòng)公告中,組織方Sven Cattell、Rumman Chowdhury和Austin Carson將其稱為“有史以來(lái)規(guī)模最大的人工智能模型紅隊(duì)演習(xí)”。將有數(shù)千人參與對(duì)公共人工智能模型的評(píng)估,期間使用的評(píng)估平臺(tái)由Scale AI負(fù)責(zé)開(kāi)發(fā)。


所謂“紅隊(duì)”測(cè)試,是指安全專家嘗試在組織系統(tǒng)中發(fā)現(xiàn)漏洞或缺陷,以提高整體安全性和彈性的過(guò)程。AI Village創(chuàng)始人Sven Cattell表示,“只有讓更多的人了解如何開(kāi)展紅隊(duì)測(cè)試和評(píng)估人工智能模型,才能解決這些模型中的各種問(wèn)題?!蓖ㄟ^(guò)對(duì)人工智能模型組開(kāi)展最大規(guī)模的紅隊(duì)演習(xí),AI Village和DEF CON希望能培養(yǎng)出處理人工智能系統(tǒng)漏洞的研究者社區(qū)。


事實(shí)證明,大語(yǔ)言模型的鎖定難度遠(yuǎn)超想象,部分原因在于所謂“提示詞注入”技術(shù)。人工智能研究員Simon Willison詳細(xì)介紹了提示詞注入的危險(xiǎn),這種技術(shù)可以令語(yǔ)言模型偏離正軌,執(zhí)行創(chuàng)建者想要回避的操作。


在DEF CON大會(huì)期間,參與者將通過(guò)主辦方提供的筆記本電腦定時(shí)訪問(wèn)多個(gè)大語(yǔ)言模型。奪旗式積分系統(tǒng)將鼓勵(lì)大家測(cè)試各種潛在威脅。最終,得分最高的參與者將獲得英偉達(dá)高端GPU作為獎(jiǎng)品。AI Village公告中寫道,“我們將公布從此次競(jìng)賽中得到的啟發(fā),幫助其他想要做類似嘗試的人們。希望越來(lái)越多的人能知曉該如何使用大語(yǔ)言模型,了解這些模型的局限性?!?/span>


DEF CON 31將于8月10至13日在拉斯維加斯凱撒宮酒店舉辦。