-
熊节、塞尔吉奥·阿马德乌:DeepSeek为什么要开源?这可能与人工智能的领导权息息相关
DEEPSEEK R1对强化学习的押注
“DeepSeek-R1-Zero选择了一条前所未有的路径,即‘纯’强化学习路径,完全放弃了预定义的思维链(CoT)模型和监督微调(SFT),仅依靠简单的奖励和惩罚信号来优化模型的行为。”[9]
在腾讯团队对DeepSeek R1模型的分析中,他们提出可能需要重新思考监督学习在AI发展中的作用。或许他们过于专注于让AI模仿人类的思维方式,而不是更多地押注于强化学习系统本身的解决问题能力[10]。在强化学习中,奖励和惩罚以数学方式表达在模型中。代理(可以是算法或系统)根据策略做出决策,该策略旨在最大化随时间累积的奖励。奖励是代理在环境给定状态下执行操作所获得的数值。
机器学习是人工智能的一个领域,它使计算机能够识别模式并根据数据做出决策,而无需明确编程[11]。机器学习依赖于从大量数据中提取模式并调整其参数以随时间提高预测能力的算法。这些算法可以分为三大类:监督学习(模型从标记数据中学习)、无监督学习(模型在没有预定义标签的情况下识别模式)和强化学习(模型通过试错学习,根据其行为获得奖励或惩罚)。深度学习是机器学习的一个子集,它使用具有多层的人工神经网络以分层和复杂的方式处理数据[12]。
由于这些创新,DeepSeek R1的训练成本大幅降低,仅为ChatGPT成本的1/10到1/20。当OpenAI的模型花费20美元时,DeepSeek仅用1美元就完成了相同的任务。2025年1月,DeepSeek模型的成本仅为每百万token 16元人民币,而ChatGPT的成本高达438元人民币——相差27倍![13] 这意味着组织可以以更低的成本使用DeepSeek的模型,同时实现更高的效率。
不同AI模型的Token输入/输出价格(美元/每百万Tokens),可以看到DeepSeek的价格远低于其他AI模型Reddit
计算能力与AI的地缘政治
英伟达和其他科技巨头股价的暴跌被许多人视为美国在AI领域领导地位的终结,这似乎并不准确。这家强大的GPU制造商的股价大幅下跌是由于在DeepSeek成功开发出成本仅为OpenAI 10%的大型语言模型的消息传出后,大量股票被抛售。这可能会改变AI的发展轨迹。对高处理能力芯片的依赖可能会发生变化。基于这种推理和恐惧,投机者趁机抛售了他们在英伟达和其他公司的股票。
然而,对尖端芯片的依赖并没有因为中国的创新而结束。小于2纳米的芯片代表了人工智能的关键进步,它们确保了更高的处理能力和更低的能耗。随着AI模型变得越来越复杂,需要数十亿甚至数万亿的参数,计算效率仍然是一个关键因素。更小的芯片允许更高的晶体管密度,提高计算速度和能源效率,降低运营成本和冷却需求。这一演进对于AI的大规模实施至关重要,从数据中心到移动设备,包括军事应用。
值得注意的是,纳米芯片扩展了设备中的嵌入式应用,并促进了它们在物联网、医疗保健、机器人和自动驾驶汽车中的使用。另一个承诺是,随着芯片变得更先进、体积更小,AI模型可以在本地运行,减少对云的依赖,并确保更快、更安全的响应。在地缘政治背景下,对更小芯片的竞争加剧了美国和中国等大国之间的技术争端,因为对这一技术的控制定义了数字经济和网络安全领域的竞争力。
美国通过技术主导、战略投资和供应链控制的结合,保持了在芯片和半导体开发和制造领域的领导地位。英伟达、英特尔、AMD和高通等美国公司引领着先进芯片的设计。美国政府通过补贴和激励措施(如《芯片与科学法案》[14])加强其地位,该法案拨款数十亿美元用于加强国内半导体生产,减少对亚洲的依赖。
除了技术优势外,美国还利用制裁和出口管制来限制战略竞争对手(如中国)获取关键技术。商务部对先进半导体制造设备(如ASML的机器和Cadence、Synopsys的芯片设计软件)的出口实施严格限制。这些限制使中国难以开发自己的先进芯片,并巩固了美国在该领域的地位。同时,华盛顿投资于战略联盟,如“芯片四方联盟”(与日本、韩国和中国台湾地区),确保其盟友遵循美国的指导方针,限制技术转让给被视为竞争对手的国家。这一综合战略使美国能够保持其在半导体行业的霸权,这对数字经济和国家安全至关重要。[15]
尽管美国正在尽一切努力限制中国获取先进芯片(7纳米以下)及其生产能力,但中国正在不断发展其独立制造这些高端芯片的能力。中芯国际(SMIC)已经展示了生产7纳米芯片的能力,并被认为很可能能够生产5纳米芯片[16]。上海微电子装备(SMEE)等公司正在积极开发极紫外(EUV)光刻技术,以取代ASML垄断的光刻机[17],这些光刻机已被限制向中国销售。
另一方面,在汽车和工业领域使用的成熟工艺芯片(技术并非最尖端但需求显著更高)方面,中国的芯片产业已经建立了大规模且完整的产业链。2024年,中国芯片出口总额超过1万亿元人民币(约合1390亿美元)[18]。可以预见,一旦中国公司在先进工艺上取得技术突破,其现有的供应链优势将显著降低高端芯片的价格。此外,芯片工艺受到物理极限的限制,无法无限改进。中国赶上美国只是时间问题。
美国前总统乔·拜登于2022年8月9日签署2022年《芯片法案》路透社
结论
“英伟达的领导地位不仅仅是一家公司努力的结果,而是整个西方技术社区和行业共同努力的结果。他们能够看到下一代技术趋势,并拥有路线图。中国的AI发展也需要这样的生态系统。许多国内芯片由于缺乏支持技术社区和二手信息而无法发展,因此中国需要站在技术前沿的人。”(梁文峰,2024)[19]
DeepSeek的创始人梁文峰表示:“我们面临的问题从来不是资金,而是对尖端芯片的禁令。”[20] 即使数据集中化和对计算能力需求(需要越来越复杂的芯片)的趋势发生变化并失去动力,国际资本主义似乎也不会改变其根本的不对称性。毫无疑问,中国的技术科学发展使技术依赖美国的国家能够构建有利于其发展的战略。拥有主权、可控的世界级大型语言模型曾经是美国和中国以外的国家——尤其是全球南方国家——无法企及的。现在,DeepSeek已经民主化了这项技术,为全球南方国家在这一领域开辟了新的可能性。同时,这也为这些国家的政府提出了新的任务和挑战。
DeepSeek现象所指向的是开源对于加强国际协作链的重要性,这种协作链可以减少不平等和巨大的知识不对称。然而,开源并不能解决建设主权基础设施的问题,这些基础设施对于地方和国家发展至关重要。因此,寻求改善其技术经济地位的国家需要减少科技巨头的权力,控制AI的基本输入——尤其是来自其人口的数据——并投资于减少自动化系统在资本主义国家中产生的环境影响和劳动力不稳定的解决方案。押注于青年优质教育需要鼓励技术多样性,并将各民族的文化活力转化为技术表达。
【本文葡萄牙语版收录于即将在巴西出版的《人工智能,社会与阶级》(AI, Society and Class)一书】
注释:
[1]Winner, L. (2020). The whale and the reactor: A search for limits in an age of high technology. University of Chicago Press.
[2]https://startups.com.br/negocios/inteligencia-artificial/stargate-trump-anuncia-investimento-de-us-500-bi-em-projeto-de-ia/
[3] Idem.
[4]https://a-mp-weixin-qq-com.observersnews.com/s/r9zZaEgqAa_lml_fOEZmjg
[5]https://a-mp-weixin-qq-com.observersnews.com/s/r9zZaEgqAa_lml_fOEZmjg
[6]Idem.
[7]https://a-mp-weixin-qq-com.observersnews.com/s/r9zZaEgqAa_lml_fOEZmjg
[8]https://www.lowyinstitute.org/the-interpreter/deepseek-diplomacy-disruption-dominance-data
[9]郝博阳. (2025, 23 de janeiro). 一文读懂|DeepSeek新模型大揭秘,为何它能震动全球AI圈.腾讯科技.
Link:https://a-mp-weixin-qq-com.observersnews.com/s/cp4rQx09wygE9uHBadI7RA
[10] Idem.
[11] Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press.
[12] Idem.
[13]https://a-mp-weixin-qq-com.observersnews.com/s/GG7l2P9ZveZjsHbS0AJ7Rg
[14]https://www.congress.gov/bill/117th-congress/house-bill/4346
[15] Sutter, K. M., Sargent Jr, J. F., & Singh, M. (2023). Semiconductors and the CHIPS Act: The Global Context. Congressional Research Service (CRS) Reports and Issue Briefs.
[16]https://www.dw.com/zh/%E7%BE%8E%E5%9B%BD%E5%88%B6%E8%A3%81%E4%B8%8B-%E5%8D%8E%E4%B8%BA%E7%AA%81%E5%9B%B4%E7%9A%84%E7%A7%98%E5%AF%86%E6%AD%A6%E5%99%A8%E6%98%AF%E4%BB%80%E4%B9%88/a-67530706
[17]https://www.dw.com/zh/%E7%94%B3%E8%AF%B7%E4%B8%93%E5%88%A9%E4%B8%AD%E5%9B%BD7%E7%BA%B3%E7%B1%B3%E8%8A%AF%E7%89%87%E5%85%89%E5%88%BB%E6%8A%80%E6%9C%AF%E5%8F%96%E5%BE%97%E7%AA%81%E7%A0%B4/a-70227975
[18] http://politics.people.com.cn/n1/2024/1205/c1001-40376144.html
[19]https://a-mp-weixin-qq-com.observersnews.com/s/r9zZaEgqAa_lml_fOEZmjg
[20] Idem.
-
本文仅代表作者个人观点。
- 责任编辑: 郑乐欢 
-
锂电池“打一针”就能“重生”!《自然》刊登我国科研团队新发现
2025-02-13 06:42 -
从四个角度全面驳斥美方对DeepSeek的质疑和污蔑
2025-02-12 07:34 心智观察所 -
我国成功发射卫星互联网低轨卫星
2025-02-11 19:20 航空航天 -
蹭热度?ai.com重定向至DeepSeek
2025-02-10 14:35 人工智能 -
中国半导体产业要长远发展,这个问题必须解决好
2025-02-10 13:57 心智观察所 -
“中国物理学研究领先世界,美国机构被挤出前十”
2025-02-09 09:14 科技前沿 -
撬开日本海关的口:日本半导体设备对华依赖度有多高?
2025-02-06 08:06 心智观察所 -
中国平台,集中上线
2025-02-04 21:12 -
“人造太阳”再创纪录,是中国式科研方法论又一次胜利
2025-02-04 13:05 心智观察所 -
“大洋一号”功勋船舶将升级改造
2025-02-02 15:35 -
“霸榜全球140个市场”,拉新最多的是…
2025-02-01 22:06 观察者头条 -
突破70多年来的传统认知!他们发现距地球16万公里的“太空合声”
2025-02-01 16:53 天文 -
中国光子毫米波雷达技术取得突破性进展
2025-01-31 22:54 科技前沿 -
果然,台当局又跳了出来
2025-01-31 22:01 台湾 -
英伟达平台上线DeepSeek
2025-01-31 18:18 -
阿斯麦CEO:DeepSeek,好消息
2025-01-30 09:34 -
20光年外,科学家又发现“超级地球”
2025-01-29 19:03 -
DeepSeek超越ChatGPT,登顶美国区免费APP榜单
2025-01-27 09:02 观网财经-科创 -
理解DeepSeek的中国式创新,要先回顾深度学习的历史
2025-01-27 08:03 心智观察所 -
探索宇宙线起源之谜再添“观天”利器
2025-01-21 20:09 天文
相关推荐 -
“特朗普执意破坏全球规则,中国会打败我们” 评论 24关税风暴下,日德巨头“对中国投下信任票” 评论 61“特朗普误判啊,中国未来几十年都将是硬核玩家” 评论 118印度断水、停签、赶人,巴基斯坦“以牙还牙” 评论 149“特朗普已经输掉了对华贸易战” 评论 221最新闻 Hot
-
“特朗普执意破坏全球规则,中国会打败我们”
-
关税风暴下,日德巨头“对中国投下信任票”
-
日本也不跟,“拟抵制特朗普联手遏华贸易的计划”
-
特朗普:俄罗斯没占领整个乌克兰,让步很大啦
-
日本:中国不买美国大豆,要么我们买?
-
“特朗普发现美国不再不可或缺”
-
特朗普再提“第51州”?加拿大总理:的确说了,但他称我为总理
-
法国高中发生持刀袭击事件致1死3伤,嫌疑人为15岁学生
-
“特朗普这伙人,别砸了‘美国’这块‘金字招牌’”
-
纽森宣布:加州已超日本,成为全球第4大经济体
-
中国田协通报:涉事10人禁赛3年
-
97岁航空发动机泰斗温俊峰逝世,曾参与研制歼7、歼8系列发动机
-
“每天睁眼就焦虑,得做心理建设才敢点开手机”
-
马哈蒂尔:特朗普的高关税撑不了3个月
-
“特朗普误判啊,中国未来几十年都将是硬核玩家”
-
印度断水、停签、赶人,巴基斯坦“以牙还牙”
-