-
对话|应对卡脖子,开源是中国大模型安全的最优解?
-
张广凯13764468101
最后更新: 2025-01-23 16:49:09开源的好时代还在后面
观察者网:大模型的开源方式,跟Linux这样的传统开源方式也有很大区别。
林旅强:完全不一样,现在的开源大模型并没有把关键素材开放出来。
Open Source的基本逻辑,第一是透明,第二是可复现。但大部分开源模型的tech report都不够透明,比如用了什么样的数据集,这是各家的秘方,是不可能拿出来的。
传统的开源软件,所有代码都会公开在GitHub上,你能够完全去复现这套软件,并且做出进一步贡献。比如你发现一个bug,可以去提交修复。但所谓的开源大模型,仍然是一个黑盒子,我无法去修改这个黑盒子,无法改善它,只能够基于它去做后训练。所以它更像是开源和闭源之间的一个中间态。
真正开源的大模型,其实Hugging Face上也是有的,比如BigScience项目,可以给出完全开源的数据集和训练代码,但是大部分开源模型做不到这一点,我认为把它们叫做开放模型更合适。
观察者网:真正意义上Open Source的开源模型团队有哪些,主要在国外吗?
王铁震:这是一个很有意思的现象,国内做开源的主要是大公司,或者能拿到国家资助的学术机构,而在海外有很多自发的组织,他们可能只是依靠一些捐赠,或者就是几个学生做着玩,然后得到一些企业帮助。
据我了解,国内真正满足开源标准的团队,主要有两个。一个是RWKV(元始智能),他们最早用Stable Diffusion的几百张卡一直在默默做预训练,现在也逐渐开始寻求商业转化。另一个是MAP,他们是一个虚拟的在线组织,成员主要是国内大厂的研发人员,会进行一些跨机构的合作,发布过真开源的模型MAP-NEO,以及春运数据集等等。
海外的开源大模型团队大家可能更熟悉,除了Hugging Face的项目,还有艾伦AI研究院(Allen Institute for AI),后者得到了盖茨基金会的支持。
观察者网:真开源项目少,是不是大模型的训练成本过高造成的?因为即使开放出来也很少有人能去复现。大模型领域不太可能产生类似开源软件的生态?
林旅强:对,我们回过头看Linux生态是怎么长出来的,一个重要原因是个人电脑很便宜。
最早发起自由软件运动的人,理查德·斯托曼,当时在MIT的人工智能实验室任职。他认为软件应该是自由开源的,可是当时的电脑太贵,他在实验室里想要做软件编译,都得排队去申请使用电脑,就像今天的大模型研究者排队求分配显卡,这种资源稀缺的情况是无法做开源的。
到Linux出来的时候,PC已经便宜到让野生开发者都能够在自己家里面写代码,这是摩尔定律带来的算力民主化。
所以我认为当下的 AI大模型,还处在当年的实验室阶段。等到算力成本继续降低,AIPC能够让每一个人在自己家里就能跑得起大模型,或者训练一些小模型,开源的百花齐放就会来临。
观察者网:摩尔定律在GPU领域还能继续有效吗?
王铁震:讨论摩尔定律,一方面我们可以期待下一个世代的硬件进步,甚至量子计算有怎样的前景。另一方面,软件或许也有一些办法能够让摩尔定律延续,比如MiniMax、RWKV尝试的Linear Attention(线性注意力机制),就是降低算力成本的另一条途径。
其实芯片领域的摩尔定律之所以一直能延续,不是因为最早的技术能一直延续,而是行业在不停地变换技术栈,寻找摩尔定律的新的解释方式。我觉得AI行业肯定也能做到这一点,比如用更小的模型就能获得现在很大模型的效果,或者用超越传统Transformer的架构来取得对算力需求的数量级下降。甚至未来是不是可能专门为大模型设计一种ASIC,效率远远超越通用GPU。
所以我们不用太悲观,至少现在英伟达的GPU还在快速进步,未来也有很多替代路线可以探索。
开源是一场标准之争
观察者网:即使解决了成本问题,做开源模型的回报在哪里?一些大厂,比如阿里云、字节,可以用其他业务变现。但是像“六小虎”这样的企业,为什么要开源?
林旅强:每一个企业做开源,一定是符合商业理性的,一定要能促成他的商业逻辑闭环。我不认为开源只是靠情怀。
扎克伯格当初写了一篇文章,解释为什么要把Llama开源。文章标题是Open Source AI Is the Path Forward,开源是未来之道。
扎克伯格表达了两个观点:一是开源能够避免重复造轮子,把自己的一些成功拿出来给大家用,能够降低整个行业的研发成本;二是开源也有助于形成行业标准。
我想大企业做开源,真正的动机肯定不只是第一点,帮别人省钱。而是这个钱省了之后,他就会落入到我的生态系统,他的根就在我这边,我在这个生态系统里拥有绝对影响力。那么以后这个行业的基础设施和技术路线,都是要跟我挂钩的。
从商业的角度来讲,标准等于垄断,制定标准的人赚最多钱。
我曾经在华为从事开源项目,华为为什么做那么多开源?第一他不想被卡脖子,第二他也希望能定出标准。华为的开源项目是放在产业与标准部门里的。过去在通信领域,像3G、4G、5G,或者蓝牙这样的通信协议,是有行业联盟来制定标准的。但是到了软件领域,华为发现没办法做联盟,开源形成的事实上的标准,把联盟垄断的路子都给断了,搞标准只能从开源切入。
观察者网:零一为什么要做开源?
林旅强:对一些企业来说,做开源也有秀肌肉的作用。通过一个很厉害的产品,让市场认识一家公司,这是后进者能够让自己传播的一种方式。
还有很多企业,会同时做开源免费版和商业收费版两种产品。通过开源的方式,能更快得到客户,然后只要开源免费版的基础够大,我也可以通过一些产品设计,满足更多的商业诉求,变成付费版本。
在国内主流的大模型公司里,零一已经算是入局比较晚的,所以必须开源。但我加入零一,首先是因为他们的模型足够强,因为开源生态非常依赖于产品强不强。
零一选择了开源闭源并进的策略,认为最强的模型必须是闭源的,同时也去建设开源生态。但这未必是大模型开源的唯一解,有时也会让客户感到矛盾。通义千问全部做开源,其实也是很好的思路。
观察者网:对客户来说,开源的安全性会是个问题吗?
林旅强:包括央国企在内的大模型招标,通常不会在标书上要求是开源还是闭源。开源完全能够满足安全性的要求。因为安全性主要不取决于开源闭源,它们都是黑盒子,没有区别。安全性主要靠大量的测试,比如做各种渗透测试,或者红军蓝军对抗。
王铁震:其实从安全的角度上来讲,开源模型反而能允许你做更多的测试,而且这些攻击行为不会被泄露到第三方。从这个角度上来讲,开源模型实际上更安全。
林旅强:没错,很多白帽黑客可以自己去拿开源模型做攻击测试,把结果在行业中交流,让大家知道如何防范。但是你不能去攻击一个闭源模型,这是违法的。
开源圈内有句话,只要眼球足够多,所有bug都现形,对大模型也是适用的。
- 责任编辑: 张广凯 
-
基金季报揭示神秘资金力挺A股:耗资千亿增持,至今一股未卖
2025-01-23 16:43 观网财经-金融 -
国产“足球巨星”机器人来了
2025-01-23 16:27 人工智能 -
一箭18星!长六改火箭成功发射千帆极轨06组卫星
2025-01-23 16:00 观网财经-科创 -
字节启动AGI长期研究计划,代号Seed Edge
2025-01-23 11:34 观网财经-互联网 -
1月136款游戏获批,王者荣耀衍生作品拿下版号
2025-01-23 11:15 观网财经-互联网 -
高端餐饮年度观察|西餐日料承压,中餐持续走强,高处不胜寒
2025-01-23 11:04 观网财经-消费 -
B站上线“小店”业务,谋求商业化新机会
2025-01-23 10:01 观网财经-互联网 -
吴清:力争大型国有险企,每年新增保费的30%用于投资A股
2025-01-23 09:20 金融观察 -
对抗OpenAI,谷歌向Anthropic追投10亿美元
2025-01-22 17:17 人工智能 -
上线小程序,广告反内卷,B站找到了商业化新蓝海
2025-01-22 16:50 观网财经-互联网 -
出售与辉同行后东方甄选亏近亿元,新东方股价暴跌24%
2025-01-22 16:19 大公司 -
12306重申加价抢票是忽悠,购票平台为何还在卖“加速包”?
2025-01-22 15:22 -
华为数字能源多位高层变更,年营收超500亿
2025-01-22 15:12 观网财经-科创 -
特朗普都提名了哪些人来管理五角大楼?
2025-01-22 14:42 特朗普 -
超越协和,国产的超音速客机要来了?
2025-01-22 10:10 观网财经-科创 -
国补后苹果手机跌破3000元,iPhone16价格成全球最低
2025-01-22 09:44 观网财经-科创 -
寒武纪遭前CTO诉讼索赔42.87亿
2025-01-21 22:35 观网财经-科创 -
万亿券商合并新进展:海通证券、国泰君安宣布2月6日起停牌
2025-01-21 21:14 金融观察 -
DeepSeek又有重大突破?一款未公开大模型展现惊人能力
2025-01-21 18:13 人工智能 -
饿了么推出九项举措:让“算法”成为骑手的“办法”
2025-01-21 18:04 大公司
相关推荐 -
-
伊朗港口大爆炸已致28死,与导弹燃料有关? 评论 41美国电商哀叹:关税不能这么高下去,太多人撑不过去 评论 104欧盟高层想让她走人?“上梁不正下梁歪” 评论 173见完泽连斯基,特朗普:普京也许只是在敷衍我 评论 308最新闻 Hot
-
超越DeepSeek,中国开源“集团军”重塑全球AI生态
-
“巴基斯坦已向中方提出请求”
-
“若勒庞被禁止参选,那么我上”
-
美国LNG行业明说了:我们无法遵守特朗普政府新规
-
又炒作:想赢中国,这件事至关重要
-
中日友好医院:开除肖某党籍,解除聘用关系
-
日本下一代战机要命名为“烈风”?
-
印巴再交火,印度未事先通知突然开闸放水
-
伊朗港口大爆炸已致28死,与导弹燃料有关?
-
“最美通缉犯”出狱直播当网红?抖音:已封禁
-
美国电商哀叹:关税不能这么高下去,太多人撑不过去
-
智方被曝阻挠中方天文台项目,“这不自相矛盾吗?”
-
欧盟高层想让她走人?“上梁不正下梁歪”
-
“美国人,包括一些共和党人越来越不满意特朗普”
-
世博会又出岔子了……“飞行汽车”表演时掉零件,被长期禁飞
-
“萝莉岛”关键证人,曾说不会自杀的她“自杀”了...
-