自对齐能否驾驭“狂奔”的AI 天天视点

2023-05-23 06:10:30 来源: 科技日报

◎本报记者 翟冬冬

自Open AI推出ChatGPT大模型以来,AI大模型进入到公众视野,探讨热度飙升,百度、腾讯、阿里等互联网巨头也纷纷公布了其对AI大模型的投资与布局路线图。

然而,在一片火热中,也有不少科技巨头表达了对AI大模型的担忧。利用人工智能写论文、制作虚假图片……在给人类带来便利的同时,“稚嫩”的人工智能技术也暴露出许多安全隐患问题。据媒体报道,被誉为“人工智能教父”的杰弗里·辛顿已从谷歌辞职,只为完全自由地谈论AI大模型等人工智能技术所带来的危险。


(资料图片)

狂野生长的AI大模型,真的管不住了吗?来自美国卡内基梅隆大学语言技术研究所、国际商业机器公司研究院等机构的研究人员提出了一种全新的方法——自对齐。该方法结合了原则驱动式推理和大模型的生成能力,从而使用极少的人类监督便能实现AI大模型的“自我监管”。

和人类价值观“对齐”

目前,即便是最先进的AI大模型,也无法实现自我监管,仍需要依赖人类指令以及注释进行相应的调整。

“生成式人工智能可以被看作一个预测工具,它主要依靠大量数据样本来预测正确答案。”清华大学交叉信息研究院助理教授、人工智能国际学术交流项目主任于洋表示,所有基于数据统计的人工智能模型,对于“答案”的预测都必然有一定的随机性,而这种随机性所产生的偏差一旦与人类价值观、伦理观、道德观以及法律法规等相悖,就需要对该模型进行监管、完善。计算科学工作者致力于消除这类偏差,尽量使之与人类的价值观、伦理、法律、公序良俗等相符,这被称为“对齐”。

然而,从统计学的角度看,AI大模型一定会“犯错”。因此,AI模型对齐的监管,不应追求获得一个不犯错的完美AI大模型,而是要管理AI大模型产生违规错误的风险。“例如,对话类AI大模型在其对话中,是否会大量出现针对某个地区的地域歧视。”于洋举例道,对于AI大模型的监管,就是为了避免这类内容出现的概率过高、避免模型的答案系统性发生整体倾向这类偏误。

然而,如果AI大模型严重依赖人类监督,会造成成本过高、可靠性不足、存在偏向性等问题。因此,以最少的人类监督实现AI大模型的自我监督成为构建AI大模型的关键。

为了解决这一难题,研究人员提出了一种自对齐的新方法,仅需一个人工定义的小型原则集(规则),便能引导AI大模型生成答复的正确导向,且能显著减少对人类监督的需求,使其几乎无需任何额外注释。AI大模型可以自对齐的设计目标是开发出有用、可靠且符合人类道德观念的AI大模型,包括在生成答案时可以反对用户的有害询问,并且为表示反对的背后原因提供解释。

值得一提的是,此前一些AI大模型至少需要5万条注释,而整个自对齐过程所需的注释量少于300行,监督效率非常高,极大地降低了AI大模型对人类监管工作的需求。

把“打骂”变为“讲道理”

那么,未来AI大模型是否可以实现完全的自我监管?于洋表示,AI大模型监管的主要方式必然是自动化、机器化、算法化的,因为AI大模型依赖海量数据支撑,仅凭人工监管是不现实的。但完全的自我监督不太可能实现,这是因为即使AI学会了相应的人类规则,但它和人类所掌握的规则数量仍然无法比较。同时,人类的思维以及逻辑推理过程具有极高的复杂性,也是AI大模型难以真正“理解”人类的原因之一。

于洋举了个例子,现在的AI大模型监管就好比教育孩子,现有的人工对齐技术方案,其实都是在“打骂”孩子,也就是用奖励和惩罚的方式训练AI什么能做、什么不能做。而真正的教育,是要对孩子讲道理,了解为什么有些事情不能做,即要让AI理解背后的逻辑,理解人类的评判标准。这是一件很难的事情,目前大多数的AI大模型的训练和对齐技术的开发,还停留在“打骂”阶段,要从“打骂”变成“讲道理”,还有很长的路要走。

“除了技术人员开发教育AI合规的技术外,监管当局也必须制度化、系统化地从社会合规和社会影响等方面对AI大模型进行多维度的审计和监管。”于洋进一步解释道,相关行业及管理部门,需要对AI大模型违背人类价值的概率,有一个系统化的评估,并根据AI大模型相关产业的发展现状,调整监管手段,有针对性地提出监管方案,建立动态、敏捷响应技术前沿变化的监管体系。企业也要建立专门针对AI大模型的监管部门,来审核AI大模型中是否包含自我监管机制,以及具体到每一个模块将带来哪些影响,以此尽量降低AI模型的违规风险。

此外,于洋还建议,人工智能的治理,也需要大量的公众参与,因为和训练模型寻找漏洞相比,在大量应用实践中去发现漏洞、完善AI大模型,显然更加高效,也能显著降低AI大模型开发成本,推动AI大模型在各行各业的广泛应用。

关键词:

精选 导读

草原上的小木屋好词好句好短语_草原上的小木屋好词好句|全球

1、草原上的小木屋好句:草也开端发黄了,目之所及都是在刺眼的阳光下升沉的绿色和金黄色草浪。2、2、冬季

发布时间: 2023-05-23 05:40
要闻   2023-05-23

券商自营怎能轻易割舍

证券时报记者王蕊  刚刚过去的周末,一则某券商解散自营团队的传闻搅动了市场。尽管这一消息被迅速证伪,

发布时间: 2023-05-23 03:56
要闻   2023-05-23

双胞胎是怎么形成的_双卵胎的成长历程

1、双胞胎怀孕的时候是双胞胎,子宫腔里有两个孩子。这叫双胞胎。双胞胎分为同卵双胞胎和同卵双胞胎。2、双

发布时间: 2023-05-23 01:05
要闻   2023-05-23

全球快资讯丨2023年创业策划案(实用8篇)

人的记忆力会随着岁月的流逝而衰退,写作可以弥补记忆的不足,将曾经的人生经历和感悟记录下来,也便于保存

发布时间: 2023-05-22 22:46
要闻   2023-05-22

新鲜胡萝卜如何保存 新鲜胡萝卜怎么保存

1、分切冷藏保存:保存期限:3~4天。胡萝卜分切后,切口容易蒸发水分,容易流失水分、变形,因此切过的胡

发布时间: 2023-05-22 21:45
要闻   2023-05-22

热点 推荐

自对齐能否驾驭“狂奔”的AI 天天视点

自OpenAI推出ChatGPT大模型以来,AI大模型进入到公众视野,探讨热度飙升,百度、腾讯、阿里等互联网巨头也

发布时间: 2023-05-23 06:10
科技   2023-05-23

广州影豹足球俱乐部于5月20日正式成立

[本站资讯]5月20日,广州影豹足球俱乐部在广州天河体育中心正式成立。广州影豹足球俱乐部由广汽集团牵头,

发布时间: 2023-05-23 06:15
汽车   2023-05-23

风行T5 EVO狂飚版将于5月26日正式上市_全球最新

[本站资讯]日前,我们从东风风行官方获悉,风行T5EVO狂飚版将于5月26日正式上市。新车拥有五款配置,在外观

发布时间: 2023-05-23 06:12
汽车   2023-05-23

焦点热文:日产ARIYA艾睿雅新车型将于三季度上市

[本站资讯]5月22日,东风日产超混电驱奇骏上市活动上,我们从官方了解到,该车未来并不会推出两驱版本车型

发布时间: 2023-05-23 06:09
汽车   2023-05-23

草原上的小木屋好词好句好短语_草原上的小木屋好词好句|全球

1、草原上的小木屋好句:草也开端发黄了,目之所及都是在刺眼的阳光下升沉的绿色和金黄色草浪。2、2、冬季

发布时间: 2023-05-23 05:40
要闻   2023-05-23

环球短讯!男生多大可以领结婚证 多大可以领结婚证

今天来聊聊关于男生多大可以领结婚证,多大可以领结婚证的文章,现在就为大家来简单介绍下男生多大可以领结

发布时间: 2023-05-23 05:00
IT   2023-05-23

按份责任和连带责任举例_按份责任和连带责任的区别 环球新

1、连带责任与按份责任有何区别连带责任与按份责任作为多数人责任中两个相对应的民事责任承担方式,两者之

发布时间: 2023-05-23 05:07
国内   2023-05-23

创富首选凯程,品质无双动力强!长安凯程GDI双车获点赞!

自上市以来,长安凯程的GDI动力双车一直备受关注,凭借出色的产品力,让其在高手如云的商用车市场中,获得

发布时间: 2023-05-23 05:08
科技   2023-05-23

券商自营怎能轻易割舍

证券时报记者王蕊  刚刚过去的周末,一则某券商解散自营团队的传闻搅动了市场。尽管这一消息被迅速证伪,

发布时间: 2023-05-23 03:56
要闻   2023-05-23

今明两年不买房,究竟是明智还是糊涂,李嘉诚一句话“近乎明

如今,国内房地产市场一片低迷,老百姓的买房欲望不断降低。尽管现阶段的房价相比于三四年前而言已经出现了

发布时间: 2023-05-23 03:06
IT   2023-05-23

滚动:爱玛极客x8多少钱_爱玛极客x8

1、充电器具有这样的功能。2、充满就会停充。本文到此分享完毕,希望对大家有所帮助。

发布时间: 2023-05-23 02:55
国内   2023-05-23

虚拟化cna 请问uac虚拟化是什么意思有什么作用

今天来聊聊关于虚拟化cna,请问uac虚拟化是什么意思有什么作用的文章,现在就为大家来简单介绍下虚拟化cna

发布时间: 2023-05-23 02:11
科技   2023-05-23

双胞胎是怎么形成的_双卵胎的成长历程

1、双胞胎怀孕的时候是双胞胎,子宫腔里有两个孩子。这叫双胞胎。双胞胎分为同卵双胞胎和同卵双胞胎。2、双

发布时间: 2023-05-23 01:05
要闻   2023-05-23

恋爱两年花了200万,分手后能要回来吗?

情侣分手起诉对方还200万法院支持 山东烟台 徐女士是一位高挑美丽的女子,她与比自己大11岁的俞先生确定

发布时间: 2023-05-22 23:58
IT   2023-05-22

青年男中音孔祥沣米兰威尔第音乐之家演唱“咏叹调”引瞩目_

中国青年男中⾳孔祥沣近日在意⼤利⽶兰威尔第⾳乐之家与Orpheus交响乐团合作,演唱歌剧《清教徒》中的咏叹

发布时间: 2023-05-23 00:04
国内   2023-05-23

孝昌:兑换残币解民忧 贴心服务暖人心 环球视点

孝昌:兑换残币解民忧贴心服务暖人心---“太感谢你们了,钱都碎成了这样,家人都说兑换不了,我想着来农商

发布时间: 2023-05-22 23:46
科技   2023-05-22

全球快资讯丨2023年创业策划案(实用8篇)

人的记忆力会随着岁月的流逝而衰退,写作可以弥补记忆的不足,将曾经的人生经历和感悟记录下来,也便于保存

发布时间: 2023-05-22 22:46
要闻   2023-05-22

当前播报:【国际3分钟】中国-中亚峰会成功举办 成果清单让

近日,中国-中亚峰会在中国西安成功举行。峰会期间,中国同中亚五国达成系列合作共识,通过《中国-中亚峰

发布时间: 2023-05-22 22:17
IT   2023-05-22

资讯:今日00532最近股票会涨吗?

00532最近股票会涨吗?很多人还不知道,现在让我们一起来看看吧!1、最近半个月走势弱于指数-6 43%;从当日

发布时间: 2023-05-22 22:24
国内   2023-05-22

今头条!5月24日首发 阿斯顿·马丁新DB系列预告

[本站资讯]阿斯顿・马丁全新DB系列车型将于5月24日正式发布,近日官方再次发布了新车的预告视频,展现更多

发布时间: 2023-05-22 22:03
汽车   2023-05-22