-
独家对话|戴兰·帕特尔:谁真正低估了Deepseek?
DeepSeek如何以颠覆性训练策略重构大型参数模型的成本公式?
1月底,美国知名半导体咨询机构SemiAnalysis发布的一篇主题围绕“给Deepseek算经济账”的文章,一时间成为全球爆款。近日,心智观察所就全球LLM模型竞争生态,如何穿透算力军备竞赛的表象,剖析大模型博弈中数据、算法、资本的三重角力等问题连线了SemiAnalysis。本次对话由心智观察所与SemiAnalysis总裁Dylan Patel,资深分析师AJ Kourabi和David Wolfson共同完成。
心智观察所:SemiAnalysis早在去年五月就发现了DeepSeek在MoE、RoPE、Attention等领域的创新贡献,你们是如何敏锐地捕捉到DeepSeek为AI模型带来的突破性?当时行业是否低估了DeepSeek从V2到V3迭代的能力?
SemiAnalysis:我们一直密切关注AI领域的创新和进展,对DeepSeek取得的进步印象深刻。绝大多数领先的AI实验室并没有忽视DeepSeek——Anthropic的CEO公开表示,他们从V2甚至更早的时候就开始跟踪DeepSeek的发展。我们认为,大多数实验室都预计到了从V2到V3会有这种程度的改进,除了Meta。
早在2024年5月,SemiAnalysis就发现了DeepSeek V2相比同行的性价比优势
心智观察所:TCO模型(总计算成本)的搭建是一个非常复杂的项目,涉及服务器资本支出(CapEx)、员工工资等。SemiAnalysis是否有特定的计算参数模型,或者是否收到来自相关企业关于计算TCO方法的反馈?
SemiAnalysis:我们开发了自己独有的解决方案,并与多家公司合作,提供咨询服务以支持他们的集群建设(注:可参见https://www.semianalysis.com/p/ai-cloud-tco-model)。
心智观察所:根据你们的分析,与OpenAI相比,Meta和Google能够更直接地接触C端消费者。Meta AI是否可能对Google搜索造成不小的冲击?“中国的Google”——百度搜索,是否也会遇到类似的问题?
SemiAnalysis:Meta拥有直接接触数十亿日活跃用户的能力,使他们能够立即将大量用户群体调用于他们引入的任何AI功能。
心智观察所:未来DeepSeek将会继续增强其多模态能力,你们如何评估他们与OpenAI(ChatGPT)、Google(Gemini)、Meta(Llama)和Anthropic(Claude)的竞争态势?
SemiAnalysis:我们预计OpenAI在可预见的未来,凭借其在人才、基础设施和资本方面的卓越资源,将保持对DeepSeek的领先地位。DeepSeek正在利用一种新范式,通过瞄准低垂果实实现快速且成本效益高的进展。然而,随着格局的演变,保持这种势头将变得越来越具有挑战性。同样,我们也预计Google将保持领先地位。
在竞争格局内部,Anthropic拥有显著优于DeepSeek的模型,我们预计他们将在不久的将来会公开发布这些模型。另一方面,Meta处于更具挑战性的位置,因为它是唯一一个致力于开源其模型的主要实验室。据我们了解,他们正在开发一个新模型,预计其性能将超过DeepSeek,但改进的程度是否足以证明推迟发布是合理的,这一点仍不确定。我们在下面这个链接中更详细地探讨了DeepSeek的进展:
https://semianalysis.com/2025/01/31/deepseek-debates/
心智观察所:DeepSeek的崛起促使行业重新考虑Scale Law和“算力”的概念。你认为这将对英伟达H200的销售预期产生什么影响?
SemiAnalysis:DeepSeek推动了AI扩展的创新,证明了战略性优化可以带来有竞争力的结果。他们的进展增加了对AI基础设施和计算资源的需求,同时加剧了顶级实验室之间的竞争,进一步加速了该领域的进展。
心智观察所:推理成本的下降是AI进步的一个标志。从训练到推理,总体而言,像GPT、Gemini和Claude这样的产品如何应对持续降低推理成本的挑战,以及他们如何调整其API定价策略?“杰文斯悖论”是否被过度炒作?
SemiAnalysis:许多顶级AI实验室正在积极开发针对降低成本的创新,这些AI实验室往往从这些创新中受益最多。当竞争对手提供更低的价格时,供应商不得不通过调整定价来应对。通常,API定价策略会根据市场压力和推动成本下降的内部进展进行调整。然而,在某些情况下,供应商并没有降低价格,而是扩大了对替代性模型的访问——例如OpenAI在DeepSeek取得突破后不久发布了o3-mini。我们认为“杰文斯悖论”并没有被低估,并且我们之前的研究已经广泛覆盖了这个话题。
心智观察所:你如何评估由OpenAI领导的“Stargate”计划?该计划需要动员大量人力和物力资源。这个计划能否与“芯片法案”这样的计划形成联动?
SemiAnalysis:OpenAI的“Stargate”计划与芯片法案完全独立,因为它专注于扩展AI基础设施,而不是对半导体制造端的激励。虽然两者都涉及大量资源动员,但Stargate是一项私有部门的努力,旨在构建先进的AI系统,而芯片法案是一项政府计划,旨在提升国内芯片产量。两者之间没有直接联系。
DeepSeek-V3竞争性分析
心智观察所:SemiAnalysis正在吸引越来越多来自中国产业部门的关注,近来几乎每篇文章都会引发广泛讨论。能否谈谈SemiAnalysis在市场研究和行业观察方面是否有一套独特的方法论?能否介绍一下你们团队的规模和盈利模式?
SemiAnalysis:我们的方法并不是什么“秘密配方”——而是对制造业、供应链、技术部署以及AI基础设施战略进行严格研究的结果。这项工作需要一个高度敬业的团队,他们对技术和分析充满热情。随着我们服务的扩展,我们的团队也在不断壮大,从最初的几个人发展到全球约25名分析师,目前分布于北美、欧洲和亚洲等区域。
SemiAnalysis没有“中央办公室”,我们的盈利模式基于销售行业和金融研究。我们的客户范围覆盖从初创公司到全球财富100强公司,技术公司和投资公司各占一半。我们的业务范围包括从简单的新闻通讯订阅到与专门分析师进行为期数月的咨询服务等。
本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。
标签 心智观察所-
本文仅代表作者个人观点。
- 责任编辑: 李昊
-
韩国报告:韩半导体关键技术两年内全面落后中国
2025-02-23 21:49 三八线之南 -
我国最新成果!量子直接通信有望进入实际应用
2025-02-22 22:04 科技前沿 -
我国成功发射中星10R卫星
2025-02-22 21:19 航空航天 -
“中美同日宣布新突破,高下立判”
2025-02-21 22:45 观察者头条 -
日本喊疼:很难遵守中方出口管制,这不止针对美国啊…
2025-02-21 17:37 日本 -
我国自主研制AS700D载人飞艇完成首次科研试飞
2025-02-21 13:21 科技前沿 -
填补关键技术空白!我国量子科技研究迎突破性进展
2025-02-20 13:30 科技前沿 -
多地政务服务系统接入DeepSeek大模型
2025-02-20 06:46 -
虞仁荣的亮相,窥见中国经济更深处的变革
2025-02-19 17:37 心智观察所 -
“搞一堆新名词,十有八九是骗子”,项目能不能落地,问三个问题
2025-02-18 22:42 -
国际首个!我国脑机接口取得新突破
2025-02-18 10:03 科技前沿 -
事关高温超导,中国科学家有突破性发现!
2025-02-18 09:46 科技前沿 -
百度搜索:将全面接入DeepSeek及文心大模型深度搜索功能
2025-02-16 21:42 大公司 -
马斯克宣布:即将发布新AI模型,地球上最聪明
2025-02-16 19:55 -
“中国科技飞跃,未来已来!”
2025-02-14 23:04 观察者头条 -
OpenAI奥特曼:GPT-5标准版将免费无限使用
2025-02-13 10:48 人工智能 -
首尔大学屏蔽DeepSeek,称有“安全隐患”
2025-02-13 09:20 三八线之南 -
看了这个游戏中的古建筑设定,想到林徽因说的“乾隆taste”
2025-02-13 09:08 心智观察所 -
锂电池“打一针”就能“重生”!《自然》刊登我国科研团队新发现
2025-02-13 06:42 -
从四个角度全面驳斥美方对DeepSeek的质疑和污蔑
2025-02-12 07:34 心智观察所
相关推荐 -
“长期来看,特朗普关税或将增强中国国内经济” 评论 46“眼下是美国痛感更强、压力更大,想重回谈判桌” 评论 153“华裔科学家五年前在美坠亡,与美方调查有关?” 评论 140义乌有信心挺过去,心疼美国一秒:他们上哪儿找袜子? 评论 205恐遭监视,欧盟为赴美出差高官发放一次性手机 评论 217最新闻 Hot