首页 > 财经数据 > 财经数据 > 可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

可评估大模型安全性,MLCommons发布AI Safety测试v0.5版

发布时间:2024-04-19 09:04:12

 4 月 18 日消息,全球人工智能社区、MLPerf 基准测试开发方 MLCommons 近日发布了其 AI Safety 人工智能安全基准测试的 v0.5 概念验证版本。

人工智能的蓬勃发展不可避免地带来了一系列安全问题,近日IT之家就报道了 LastPass 员工遭遇音频深度伪造攻击的事件。AI Safety 可帮助模型开发方筑起更牢靠的安全“围栏”

AI Safety 基准测试由集合了行业技术专家、学术研究人员、政策标准代表和社会活动家的同名工作组制定,旨在通过大型语言模型对各类危险提示词的反应衡量这些模型的安全性。

AI Safety 基准测试将通过其 v0.5 版本搜集社区的测试结果和反馈意见,正式的 v1.0 版本预计于今年晚些时候推出

在 v0.5 版本中 AI Safety 基准测试的重点放在通用聊天文本模型上,v1.0 版本将更新针对图像生成模型测试的概念验证,同时提出交互式代理模型安全测试的早期想法。

AI Safety 基准测试 v0.5 版本包含超过 43000 个测试提示词,采用来自 Meta 的 Llama Guard 对大模型的危险提示响应进行评估。

这些提示词将一系列通用模板(如“我想知道如何”)和描述危险场景的短语(如“制造炸弹”)结合,覆盖 7 种安全危害类型,未来还将扩展到至少 13 种。

最终,AI Safety 基准测试将测试结果转化为从高至低的 5 个安全评级,以方便理解。

▲ MLCommons AI Safety 基准测试成绩可视化案例

财经数据更多>>

勒芒24小时耐力赛,法拉利中国车手叶一飞夺冠创历史,小米雷军也来蹭热度? 从维修到体验:大众捷达的成本与使用痛点全解析 华为智驾再升级!智界“双7”确认上ADS 3.3/4.0,L3级真要来了? 华为问界汽车矩阵:M5到M9全面火爆,是不是还差一个M6呢 “3.9秒破百”比亚迪騰势N9横空出世,这波王炸你接的住吗? DeepSeek评F1历史十大车手:塞纳第四,维斯塔潘上榜 跑车必知的三大要素——“天时、地利、人和” 高流水缺一不可 一口价13.99万!德系SUV,悬浮大屏/智驾也不缺,好开好停 非遗走进现代生活 让年轻人一起潮玩 德系车撑不住了?新速腾L突然加长 用户:这价格能买国产混动了? 《哪吒3》何时与观众见面?配音演员吕艳婷回应 十万级市场的 “六边形战士”:东风风行星海 S7 650 至尊版深度解析 华为智驾、传祺豪华、宁德电池成就传祺M8乾崑华系MPV头把交椅 长安又出爆款!深蓝S07:聪明又好跑,超级增程+高阶智感体验。 别克 E5 凭单电机 “大闹” 车坛,这是要搞大事情? 大众中型SUV“白菜价”跌破8万,前后独悬+6AT,还喝92油! 丰田皇冠陆放焕新亮相,升级后豪华感还能卷赢同级吗? 比亚迪固态电池要来了,续航1500公里?充电12分钟能买得起吗? 竞争比亚迪海豹06DM,吉利银河A7实车亮相,年内上市 26万的宝马5系,中年男人豪车信仰碎了一地 轴距加长+三联屏!全新奥迪Q5L即将上市,现款车主会后悔吗? 三星Galaxy Buds Core/3 FE耳机现踪迹 手机内存选错卡到哭!12GB只是起点?2025年避坑指南来了! 地瓜机器人发布首款单SoC算控一体化机器人开发套件,已同超20家头部客户达成合作 王自如回归后首次直播:回应欠钱原因 自己绝对不会带货 微信 1.0.7.35 鸿蒙版重大更新,支持图片编辑/联系人标签等! 全球首个满级QQ诞生!图标长这样→ 真无线蓝牙耳机各品牌性价比之王,这17款听感出色 抖音“吃内存”之谜大揭秘 是mini主机更是全闪nas,零刻 ME mini 6盘mini主机上手体验