为什么在AI领域,不开源会被骂?
2019-02-23 08:26

为什么在AI领域,不开源会被骂?

元宵一过 ,年就算正式过完了。没曾想OpenAI和马斯克,居然抓住了春节的小尾巴,携手为全球人民贡献出一个大瓜。


事情是这样的,上周OpenAI推出了一个号称“史上最强通用NLP模型”的新算法GPT-2.0,却没有按照惯例开放该模型和数据集。


研究人员们的溢美之词还没来得及说完,立马被OpenAI这波操作气得怒从心头起,纷纷斥责它全忘初心、恶意炒作。


有人吐槽它应该改名叫“ClosedAI”,还有人把怒火烧到了OPENAI的资助者之一的埃隆·马斯克身上。后者却立马甩锅,表示“没有参与 OpenAI 公司事务已超过一年”,“早就理念不合”,正式发推要求“和平分手”……



不但惹了众怒,还把创始人兼金主爸爸给玩跑了,OpenAI这是摊上大事,顺手承包了一个瓜田啊。


从技术斗士到众矢之的:OpenAI是如何打错一手好牌的?


甩出一个“怕被恶意用来制造假新闻”的说辞,自然说服不了经历过大风大浪的人民群众。假视频都见识过了,机器人代笔写点新闻算什么呢,何况也就是小学生水平,至于“敝帚自珍”吗?


同业们开始口诛笔伐,马斯克走得是潇洒无比。细数一下,OpenAI为之诟病的三宗罪:


违背了开放的行业“潜规则”


今日的互联网,开源文化早已枝繁叶茂,在AI领域,开放更是默认选项了。


底层技术的更新换代,需要更广泛的生态系统、更多的顶尖技术人员、更多的机构参与才能做好,开放合作显然能最快地催生出更多尖端的创新。


正是因此,绝大多数研究成果及源码,都可以通过博客、会议、社区等公开形式获取,这样做的另一个好处是,避免研究资源被浪费,最大限度地保证研究的合理性和真实性。OPENAI的闭源显然违背了这一基本规则。



惯性炒作带来的“晕轮效应”


心理学上有个规律,叫“晕轮效应”,当认知者对一个人的某种特征形成固定印象后,还会再从这个判断推论其他方面的特征。OPENAI就很不幸地背上了一个“欺骗性炒作”前科的“光环”,并成功引发了大家的联想。


之前在一对一DOTA2中打败顶级人类玩家 “Dendi”,OPENAI就发出了诸如“攻陷DOTA2”“AI完虐人类”“碾压AlphaGo”等宣言,就被指过于浮夸。


过度夸大、诱导媒体报道的事情OPENAI实在没少干。目光回到GPT-2,普遍观点是,为了避免造假风险而不开放,既对安全毫无帮助,也对技术进步无益。


面对非要采用过气模型的固执,和“碾压人类作者”的语气,大家立马从熟悉的套路中嗅到了“同样的配方和味道”。那点可取之处,也被既往炒作“AI焦虑”的后遗症所反噬了。



助长AI集权的真实阴影


如果说上述指责都难免带点理想主义情绪的话,那么GPT-2私有化带来的实实在在的影响,恐怕才是点燃大众恐慌的真正导火索。


作为“新的石油”,数据资源早就显示出封闭的迹象。谷歌、亚马逊、Facebook这些科技巨头手里积累了大量的数据财富,并且越来越强大。各国都将AI成果视为国家战略资源,德法等已经开始对数据收集及使用征税。


而以GPT-2为代表的无监督学习趋势,又意味着技术进步与创新愈加依赖于更大容量的模型和超大规模的数据集支持。



也就是说,一旦大公司不愿意开放源码和数据集,财力不足的学府和中小开发者极有可能就会被请出牌桌。


当初说要“为全人类 AI 技术保驾护航”的OpenAI都搞起了私有化,显然令开源文化“腹背受敌”,起到了很恶劣的示范作用,怎么怼都不冤。


不过,只是一味指责,咱们这瓜就吃的太没有技术含量了。关键要搞清楚,为什么明知会被喷,OpenAI还非要这么干呢?


开源和私有化:算法公司的商业困境


OpenAI选择技术私有化,虽然有着种种的不合情,在知识产权归属上却并没有什么可指摘的地方。而逼得它不得不违背理想的根本原因,或许才是AI和全人类真正的敌人。


简单来说,正是算法公司们集体商业化失守。


美国当代技术哲学家芬伯格(Andrew Feenberg)在上个世纪90年代就曾经提出过,技术的开放是为了提高全社会的技术福利,而非打击技术的商业价值。但直到今天,算法的商业化之路依然道阻且长。


在高昂的数据及研发成本下,算法公司想要支撑长期的研究,主要有三种方式:


1. 售卖专利。算法研发可算是AI产业链中最上游、最具价值的业务,但即便算法公司手握专利,在更深层次的软硬件应用方案不成熟的大环境下,也很难养活自己。


2. 开源,从其他业务获益。借鉴互联网“羊毛出在猪身上”的商业模式,算法的价值可以通过其他业务的补充来实现。


比如Facebook一直致力于开放其所有代码和技术架构的源代码,吸引来不少优秀的开发者,品牌和口碑也借此大涨。但前提是,Facebook不靠售卖软件盈利,开源不会冲击自有业务。对于单纯的算法公司来说,显然不可行。


3.找金主“包养”。目前看来,寻找一个大型商业机构得到资助,几乎是算法公司最好的归宿了,比如谷歌之于Deepmind,特斯拉之于OpenAI。但受制于人的日子显然也并不好过。


两者结合的结果就是,一边需要满足投资人追求回报的愿望;一边还要提防着主业务受创耽搁自己搞技术。此次马斯克退出董事会,OpenAI的未来顿时就不明朗起来。



总而言之,OpenAI的开源困境背后,也暴露出一种纯技术公司的集体无奈:你得开源,要不然没法维持技术生态;又不能啥都开源,捧着金碗要饭。这个度真的是很难把握。


不难意识到,随着数据封闭的浪潮,AI开源的未来不容乐观已是既定事实,OpenAI只不过是加了一把火而已,私有化的锅它一个可背不动。


要解决这个问题,靠的不是道德绑架或者祈求大机构的仁慈,口水战可以休矣。而是集全社会之力,更快催熟完善的产业链体系,激活更多元的商业模式和应用场景。


算法的商业化价值初现曙光的时候,才是科技企业有力量承担社会责任的时候。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定