全球首届AI安全峰会,监管与创新的博弈场
2023-11-03 15:56

全球首届AI安全峰会,监管与创新的博弈场

本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究,原文标题:《在图灵显灵的花园,以AI安全的名义》,题图来自:视觉中国(峰会期间英国首相苏纳克会见美国副总统哈里斯)

文章摘要
本文介绍了第一届全球人工智能安全峰会在英国举行的情况,讨论了人工智能安全的重要性和挑战,以及各国在监管和创新之间的博弈。

• 全球29个经济体签署了《布莱切利宣言》,首次就人工智能风险监管做出正式声明。

• 英国和美国试图在人工智能安全领域取得领导地位,分别建立了AI安全研究所。

• 各国在人工智能监管方面存在差异,欧盟走在前列,美国仍然依赖行政命令和指引原则。

假座布莱切利公园,英国举办了第一届全球人工智能安全峰会。这里是人工智能之父图灵(Alan Turing)显灵的地方。


二战期间,盟国最聪明的大脑,数学家、密码学家们汇聚于此,破解纳粹德国的号称“不可破解”的密码,图灵发明的用于破解的图灵机,成为现代计算机的前身,也启发了后来标志机器是否具备人类智能的图灵测试。


当时的先进算法,不仅催生了计算机和人工智能,而且号称让二战“提前结束”,捍卫了人类安全。如今图灵测试在ChatGPT面前已如小儿科一般,但乱真已经开始威胁人类安全。一天天聪明起来的人工智能,不仅让人担忧社会是否已经准备好全面接纳它,甚至深度学习之父、图灵奖获得者辛顿(Geoffrey Hinton)也发出警告,“通用人工智能”很快实现,可能对人类造成“生存性威胁”(existential threat)


政治家、企业家、科学家,还有最广泛地受其影响的消费者,都觉得要先把它管起来再说。尽管在人工智能领域是竞争激烈的对手,中国与美国都签署了《布莱切利宣言》。这意味着全球29个经济体,首次就人工智能风险监管的必要性和迫切性做出正式声明。


安全峰会将以气候变化政府间专门委员会(IPCC)为蓝本,由参加峰会的28个国家的代表组成。英国政府表示将为其提供秘书处支持。


图灵奖获得者本吉奥(Yoshua Bengio)将牵头带领一个专家组,编写有关前沿人工智能风险和能力的“科学状况”报告。该报告不会提出政策建议,但旨在为国际和国家政策制定提供信息。该报告将在明年上半年韩国举行的下一届安全峰会之前发布。


澳大利亚、加拿大、欧盟、法国、德国、意大利、日本、韩国、新加坡、美国和英国签署了一份不具约束性的文件,将测试领先公司的人工智能模型。中国没有签署。


自愿签署这一文件的人工智能公司包括亚马逊(AWS)、Anthropic、谷歌、Google DeepMind、Inflection AI、Meta、微软、Mistral AI 和 OpenAI。除了法国的初创公司Mistral AI之外,全部是美国科技巨头和初创企业。


英国为了主导AI安全国际规则的制定进程,已经成立了一个前沿项目工作组(Frontier Project Taskforce),设在科技创新部。并且还试图以此为基础,建立一个服务于峰会的AI安全研究所,进行安全标准的研究,并且打算采购上千块H100,弥补上算力差距。但美国提出要建立自己的安全研究所,研究最前沿的人工智能安全问题,并且为测试制定风险标准。


各家都对如何监管有自己的盘算。今年以来,各国陆续出台监管文件,民间也频繁公开致信。这周的布莱切利公园,成为了最激烈的博弈场所。



来自全球的100多个民间社会团体,联名上书英国首相苏纳克,警告那些将被人工智能从根本上改变生活、教育与工作方式的“社区与工人已被峰会边缘化”。它关乎上层的AI精英与底层的“无用之人”之间的公平。


另一位图灵奖获得者杨立昆(Yann LeCun)指责OpenAI 首席行政官奥特曼(Sam Altman)等自私的游说,代表了最先进而又最不透明的大模型公司,散布人类生存恐惧以游说政府,将导致有利于既得利益企业的“监管捕获”,高昂而不必要的合规成本,将阻碍后来者的创新。


美国总统拜登抢在峰会开幕前,签署了长达111页的总统令,然后派副总统哈里斯前往布莱切利公园表达美国立场。正如人工智能终将无处不在一样,这份总统令几乎触及了美国关心的一切:安全、隐私、公平,创新与人才,以及全球领导力。


美国国家标准与技术研究所(NIST)将制定的“红队(red-teaming)”标准,那些正在研发或有意研发军民两用(dual-use)基础模型的开发者,要根据《国防生产法》的要求,来识别缺陷和漏洞,并持续定期提交评估结果与缓解措施。


红队报告有其可取之处,但区别在于监管研发,还是监管应用。人类拥有的核弹头数量超过了核电站,“奥本海默时刻”发生在应用上。监管就意味着大量的财力人力投入,将监管前置到研发的成本会更高,削弱了追赶者的创新与竞争能力,也削弱了在创新中解决问题的机会。人工智能面临的很多对齐问题,正需要在研发中解决。


中国参与首届峰会,成为一大亮点。中国正在一步步探索对生成式人工智能的监管,优先保障“境内公众”接受的生成式人工智能服务都是“正能量”。今年7月施行的“管理暂行办法”,打消了行业对技术研发阶段以及企业应用场景的合规顾虑。10月开始征求意见的“安全基本要求”,进一步明确在“服务上线的备案申请前”完成安全评估并提交材料。英国《促进创新的人工智能监管方法》的方向也在于“使用”而非“技术”。


美国的总统令也体现出卡住算力脖子的惯性思路,要求那些在高于指定算力下训练的大模型,都要纳入红队监管;收购、开发或拥有门槛以上算力的公司、个人或其他组织或实体,需要报告它的位置与总算力。美国还要求算力基础设施厂商穿透披露它们的海外客户信息。


人工智能科学家和创业者吴恩达认为这匪夷所思,眼下的超级计算机,很快就会成为口袋里的手表,随着人工智能迅速发展,更多初创企业将被挡在算力门槛之外。尽管政府可以调整算力门槛,但创新会消弭在繁文缛节之中。


美国想保持人工智能的“领导力”,建立在其垄断技术和算力的基础上。拜登下令,要将人工智能风险管理框架的原则、指导方针和最佳实践,纳入美国境外的社会、技术、经济、治理、人权和安全状况。他还想发布《全球人工智能研究议程》。重担压给了商务部,部长雷蒙多也去了峰会,宣布将成立美国人工智能安全研究所,即她所称的“制定一流标准的中立第三方”。


在缺乏透明性的前提下,无法谈论监管中立。美国的监管框架目前缺乏对透明度的要求,无论是预训练数据、微调数据、注释,还是下游影响,与微软/OpenAI、谷歌/Anthropic 等全球领先的人工智能企业日益封闭的操作如出一辙。它们认为,先进的闭源基础模型远优于开源模型,而闭源正是为了商业竞争和防止 “恶意获取” AI技术。


这与同日发布《七国集团领导人关于广岛人工智能进程的声明》形成对比。七国集团同时发布的“国际指导原则”与“国际行为准则”,在一定程度上强调了透明度。欧盟要求生成式公司披露受版权保护的材料。中国则称宜具备“公开训练语料中涉及知识产权部分的摘要信息”的措施。


基础模型透明度指数

来源:HAI、CRFM


建立全球监管框架的一个必要前提,是各成员方之间要有基本的透明度。按斯坦福大学的研究,目前主要基础模型开发商及其旗舰模型,在100分中仅取得了37分的平均成绩,开源的Llama2得分最高,也不及格。


人工智能系统的“互操作”也成为国际安全合作中的一个重要议题。但中美两个大国之间在人工智能技术领域的激烈竞争,还彼此严加防范着跨境数据的流动,加上地缘政治竞争,让“互操作”听起来有些超现实。中国官方在“一带一路”国际合作高峰论坛发布了《全球人工智能治理倡议》,批评了技术垄断和单边强制措施,也显示出中国在国际上建立起自己的“互操作生态”的可能性。


与欧盟与中国相比,美国的监管基础,仍然是援引相关法律的行政策命令,以及行政部门和国会出台的一些指引原则,目前还看不到任何全国性的数据隐私保护或人工智能立法的前景。在立法上,欧盟走得最快最远,《人工智能法案》预计在今年底正式通过,将是全球首部综合性人工智能监管法律。基于风险管理的原则,欧盟试图规避因技术短板所暴露的风险。


以马斯克为代表的人工智能业界也在发问:监管方在出台政策之前,是否真的对人工智能有洞察。对人工智能创新的骚动正在平息下来,监管让生成式人工智能变得很现实。未来感十足的技术,背后是国家间的现实政治,企业之间的激烈竞争,以及各利益集团的博弈。


监管与研究、应用一起,共同塑造着生成式人工智能的发展。2024年,在中美两国主导的竞争格局下,人工智能的安全意义将会强化,它的商业应用想象维度也在收敛,但成为国家间竞争的利器,并不会缺乏资源。与此同时,各国政府与人工智能企业仍然会坚持对话,寻找全球监管的最大公约数,探索“无害利用”人工智能,寻求监管与创新的平衡,在应用落地的过程中,定义最佳实践。


本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP