日韩aaa久久蜜桃av,玖玖玖国产精品,成人爱爱网址,国产精品9999久久久久仙踪林

深圳熱線

幫助大模型提升自身安全性 科研團隊發(fā)布AI安全平臺

2023-07-10 11:09:02 來源:中國新聞網(wǎng)


(相關(guān)資料圖)

中新網(wǎng)北京7月9日電 (記者 張素)以ChatGPT為代表的生成式人工智能廣受關(guān)注,大模型亦在加速發(fā)展。科研團隊近日發(fā)布新的AI安全平臺,以期為大模型系好“安全帶”、把好“方向盤”。

據(jù)介紹,人工智能安全平臺RealSafe3.0版本由清華大學(xué)人工智能研究院孵化企業(yè)瑞萊智慧RealAI發(fā)布。該平臺能夠提供端到端的模型安全性測評解決方案,旨在解決當(dāng)前通用大模型安全風(fēng)險難以審計的“痛點”。

“大模型‘落地難’的本質(zhì)在于,當(dāng)前還沒有找到場景、風(fēng)險和規(guī)范三者之間的平衡點?!比鹑R智慧聯(lián)合創(chuàng)始人、算法科學(xué)家蕭子豪在受訪時說,而在探尋這一平衡點的過程中缺少易用和標準化的工具。換言之,亟須在技術(shù)層面找到有力抓手,幫助人們科學(xué)評判大模型在場景中能否同時滿足規(guī)范和低風(fēng)險,助力大模型上線運行。

據(jù)知,相較上一版本,RealSafe3.0新增了對通用大模型的評測。該平臺覆蓋數(shù)據(jù)安全、認知任務(wù)、通用模型特有漏洞、濫用場景等近70個評測維度,可以全方位、多維度地評測通用大模型的性能,未來還會持續(xù)擴增測評維度的數(shù)量。

蕭子豪介紹說,RealSafe3.0內(nèi)部集成了多個自研模型和專家論證高質(zhì)量數(shù)據(jù)集,來幫助用戶修復(fù)模型中的問題。例如,對黑盒不可解釋的通用大模型,自研紅隊對抗模型取代人工設(shè)計問題,顯著提升攻擊成功率和樣本多樣性。

再如,教練模型通過對被測大模型進行多輪次的“提問—回答訓(xùn)練”,并以訓(xùn)練好的評分模型對問答結(jié)果進行評分,再將評分結(jié)果反饋給大模型,使其不斷強化學(xué)習(xí)到好壞答案的要點及區(qū)別,直至問答能力逐步迭代至最優(yōu)。

值得一提的是,瑞萊智慧科研團隊還研發(fā)出能夠防范生成式人工智能惡意濫用的DeepReal2.0,即“生成式人工智能內(nèi)容檢測平臺”。該平臺支持對圖像、視頻、音頻、文本進行是否偽造的檢測,應(yīng)用場景包括打擊網(wǎng)絡(luò)詐騙和聲譽侵害行為、檢測網(wǎng)絡(luò)內(nèi)容合規(guī)性、檢測音視頻物證真實性等。

“我們將持續(xù)迭代技術(shù)、打磨產(chǎn)品,以確保在這場人工智能安全‘攻防戰(zhàn)’中始終立于不敗之地,將人工智能的兩面性這一‘關(guān)鍵變量’,轉(zhuǎn)化為高質(zhì)量發(fā)展的‘最大增量’。”蕭子豪說。

關(guān)鍵詞:

熱門推薦

日韩aaa久久蜜桃av,玖玖玖国产精品,成人爱爱网址,国产精品9999久久久久仙踪林
主站蜘蛛池模板: 久久精品国产亚洲夜色av网站| 欧美最新另类人妖| 亚洲国产日韩av| 国产精品久久久久久久一区探花| 日本不卡免费一区| 欧美一区二区三区在线| 精品久久久久久乱码天堂 | 久久久久国产精品www| 欧美顶级大胆免费视频| 色综合色综合| 久久蜜桃一区二区| 99精品视频网| 亚洲国产精品久久| 亚洲欧美日韩电影| 在线亚洲成人| 国产精品女上位| 精品成人国产在线观看男人呻吟| 国产午夜精品久久久久久久| 国产无一区二区| 欧美日韩在线精品一区二区三区激情 | 国产综合视频在线观看| 欧美精品国产一区二区| av一区二区在线观看| 欧美无乱码久久久免费午夜一区| 日本不卡一区二区三区| 99久久视频| 亚洲一区二区日韩| 国产日韩欧美影视| 日韩国产一区二区三区| 99精品视频在线观看播放| 欧美精品综合| 日韩理论电影院| 日本精品一区二区三区在线播放视频 | 亚洲国产一区二区三区| 亚洲精品乱码久久久久久久久| 亚洲黄色大片| 国产a∨精品一区二区三区不卡| 九九热精品在线| 精品久久久久久国产| 日韩伦理视频| 久久精品视频免费播放|