-
张维为《这就是中国》第274期| DeepSeek震撼
最后更新: 2025-03-16 14:11:02“一个巨大的变化,就是一个产品出现之后,它带来的是整个外部世界对中国看法的改变。”
“到了人工智能时代,这个情况发生了很大的逆转,为什么中文在人工智能中存在这样的一个技术优势呢?”
前段时间DeepSeek是火爆出圈了,不仅在科技界引起了广泛的震动,很多普通人现在也开始在使用DeepSeek,甚至有的政府机构也开始在应用上引入了DeepSeek。大家可能很好奇,为什么中国在人工智能时代会不断地有火爆的产品,中国的整个科创生态到底有什么样的优势?
在东方卫视3月11日播出的274期的《这就是中国》节目中,复旦大学中国研究院院长张维为教授和复旦大学中国研究院特邀研究员汪涛老师,对DeepSeek的火爆出圈进行了深入观察和分析。
汪涛:
我今天演讲的主题是——中文在人工智能时代的优势。DeepSeek之所以爆火,主要并不是它技术上获得了突破性的进展,而是其效率获得了数量级的提升,从而使得它在相同性能的情况下,成本可以下降将近二十多倍。
不同AI模型的Token输入/输出价格(美元/每百万Tokens),可以看到DeepSeek的价格远低于其他AI模型Reddit
之所以如此,是因为研发团队几乎是将各种可能提升效率的技术都充分地进行了挖掘,比如说更多地采用底层编码的语言PTX。一般来说,越是底层的编程语言,它的效率就会越高,但是编程的难度也会越大。
另外,还有适当地降低精度,比如采用一个字节的8比特浮点运算,而不是32比特,从而能成倍地减少存储量和运算量,这在人工智能里面有一个专业的术语叫量化。
还有蒸馏的方法,同样可以极大地减少参数的数量,除此之外还有混合专家架构(MoE)、多头潜在注意力技术(MLA)等等。这些技术本身并不完全是DeepSeek独创的,原来在美国人工智能产业界的专业人员都知道这些技术,但为什么DeepSeek把这些技术充分利用了呢?
今天就谈一个大家比较容易理解,也非常有意思的话题:中文在人工智能时代的技术优势。DeepSeek充分利用了中文的优势,所以在它爆火之后,很多人开始关注到这个问题。
如果我们回顾一下两百多年来的历史,中文在现代科技中的作用,其实经历过一个变化的过程。
在中国古代的时期,中国对周边国家在文化上有压倒性的优势。其他地区对中国也有着非常仰慕的心态。但随着中国在近代的落后,尤其是甲午战争失败以后,导致很多中国知识阶层开始反思自身。首先反思的就是我们的文化,也包括我们自己的语言文字。这种反思很快就发展到了极端,甚至有人认为汉字阻碍了中国进入现代科技文明。也有人认为中国应当放弃中文这种象形文字形态,应该改成像拼音这样的字母文字。
随着以电子计算机为代表的信息技术出现以后,中文在计算机键盘输入上存在一定的困难。因为计算机键盘来自英文的打字机,所以输入英文当然是最简单方便的。因此,过去曾经认为中文阻碍了中国进入现代科技文明的观点和思潮,在信息技术时代又再一次沉渣泛起。但是, 二十世纪八十年代,中国科技界在汉字输入上做了大量的工作,在当时被称为叫“万码奔腾”。
这些汉字输入的工作在很大程度上降低了中文电脑输入的困难。其中比较著名和主流的有五笔字型输入法,也叫王码,是王永民先生发明的。那么另外一个常用的输入法是拼音输入法。虽然客观上说,直到今天中文还是比英文等字母文字的键盘输入稍微麻烦那么一点点。但是这些中文输入法,在很大程度上,已经有效解决了中文在计算机上的输入问题。在五笔字型输入法的基础上,充分采用词组输入以后,它的输入效率甚至还可以超过英文的输入。
到了人工智能时代,这个情况发生了很大的逆转,为什么中文在人工智能中存在技术优势呢?主要有以下这些原因:
首先,汉字非常规整,或者说非常整齐。无论是书写的大小尺寸还是发音的长短尺寸,都是一样的,非常整齐。这种规整对于计算机的处理而言,是非常方便的。比如要进行语音识别,中文每个字的发音都是声母加韵母,发音的长度一样,这样就会相对比较容易区分出一句话中,每一个字的发音。
相比之下,英文单词的长度,从一个字母到十几个字母的都有,这样的字母文字,每个单词它发音的长度可能都是不一样的。像英文里面的“祝贺”,是“Congratulations”,这就有15个字母。我们可能会好奇,那最长的英文单词会有多少个字母呢?如果我们到网上去搜索的话,可能会发现很多不一样的答案。
还有一个问题是很多英文的句子,它的发音会有连读的情况,比如说"what’s your name",那么这就更加难以区分出每个单词。虽然现在这些问题在人工智能的语音识别中都已经解决了,但是它解决的技术难度,确实要比中文困难很多,需要更大的运算量,而且几乎所有的字母文字都存在这个问题。
第二,汉字的信息密度一般比字母文字要高,这体现在很多方面。汉字是一个表意文字,内涵很丰富,可以用词组、成语等很少的汉字表达相当丰富的含义。尤其像文言文,它的信息密度就更高了。对于人工智能来说,最终它体现的是,相同含义的一段语言或文字,在计算机中需要有多少存储量和计算量。一般来说,中文的存储量和计算量都是最少的。如果我们对比一下相同内容的中英文,中文一般页数或者篇幅是最少的。
但我们要注意,这并不是完全绝对的,因为英文也有自身的优点,比如说它相对比较严谨,所以比较严谨的一些论文或法律文书里面,英文的信息密度与中文的差异就没有那么大了。但是由于绝大多数情况下,中文的信息密度的确是比较高的,所以在人工智能的训练中,相同内容的情况下,中文训练的存储量和计算量就会比较少。这是中文效率优势的第二个体现。
第三,是中文的稳定性。汉字是相对比较稳定的一种语言,我们今天使用的汉字与几千年前的甲骨文其实挺接近的。对于新出现的事物,汉字是通过常用的一些字去建立新的词组从而适应。并且,这样的词组天然地会存在有规律的分类特性,比如机器的“机”,可以组成拖拉机、播种机、飞机、纺织机、发动机、蒸汽机、计算机,如此之多的机器汉字都可以用“机”这个形成词组来表达。
汉字的稳定性对人工智能带来的好处是训练参数可以更少,有效的重复训练可以更多,那么准确性就会更高。
相比之下,英文每年都会增加大量的新词,常用的单词都可能会发生变化。当然我们提到中文在人工智能时代的技术优势,并不是要把它过度地拔高,只是从以上不同技术时代,中文技术优劣势的变化过程中,希望我们能更客观地看待我们中国自己的文化。在进入人工智能时代,我们更应该发挥中文的优势,使得中国在人工智能时代可以获得更快的发展,并且有更好的经济效益。
从我们长久以来对自己语言的态度变化中,可以获得一些启示:那就是如何用科学的态度去看待自己的文化。所谓利弊或优劣,它永远是相对特定的要求来说的。我们不能因为遇到了某种劣势就简单地去否定自己的文化,也不能遇到优势就自我膨胀。
科学的态度就是实事求是,如果它是劣势,我们就应该想办法改进,去消除或者减少这种劣势。如果是优势,我们就应该想办法去充分地开发利用它。因为即使是潜在的优势,如果不去充分地开发利用,它也不会自动地体现出来。谢谢大家。
-
本文仅代表作者个人观点。
- 责任编辑: 郑乐欢 
-
5%恐惧症:美国对华半导体301调查真正的“故事背景”
2025-03-16 08:40 心智观察所 -
这一技术仅五个国家掌握!我国刷新纪录
2025-03-14 09:34 科技前沿 -
我国在三维世界造出二维金属材料
2025-03-13 10:16 科技前沿 -
-
中国下一代“人造太阳”关键系统验收
2025-03-10 18:55 能源战略 -
大圆柱电池产业化再加速,云山动力一期量产示范线正式量产
2025-03-10 14:29 -
《纽约时报》急问为什么小米可以造电动车,苹果却不能?
2025-03-10 08:06 心智观察所 -
全球首个!我国团队成功绘制
2025-03-08 21:44 -
特斯拉FSD入华,深度回顾中美智驾竞争的关键变量
2025-03-08 09:30 心智观察所 -
“下一个颠覆者,也可能来自中国”
2025-03-07 21:41 人工智能 -
被90后女生王虹证明的挂谷猜想究竟是什么?
2025-03-07 08:21 -
教育部部长:DeepSeek和机器人是教育重大机遇
2025-03-05 11:34 2025两会 -
政府工作报告:培育生物制造、量子科技、具身智能、6G等未来产业
2025-03-05 09:38 2025两会 -
用不用DeepSeek?娄勤俭:我是计算机专业,我对人工智能有偏爱
2025-03-04 15:16 2025两会 -
打破纪录、最高水准!中国成功研制“祖冲之三号”量子计算原型机
2025-03-04 07:13 科技前沿 -
2030年中国斜爆轰飞机真能一小时到全球?专家发声
2025-03-03 17:53 航空航天 -
若前方无路,便踏出一条路:中国数据库产业迎来“哪吒时刻”
2025-03-03 08:02 心智观察所 -
独家对话|苹果在中国的发展会继续承受压力
2025-03-01 09:23 心智观察所 -
“中国又一个DeepSeek时刻?”
2025-02-28 22:27 人工智能 -
“即使我们对手的产品免费,我们还是比他们便宜”
2025-02-28 14:06 心智观察所
相关推荐 -
关键时刻,外贸大省如何突围? 评论 26“特朗普会输,‘用谈判孤立中国’行不通” 评论 89“中国代表团访问巴西,探讨两洋铁路” 评论 192直播:如何应对特朗普贸易战——来自毛泽东的智慧 评论 30最新闻 Hot
-
“特朗普认为欧盟在占美国便宜,别指望梅洛尼能谈成”
-
“为防止被美国偷窥,连英国也支棱起来了”
-
特朗普:鲍威尔赶紧下台,总是迟、总是错
-
“中国有韧性美国则不然,特朗普已经搞砸了”
-
关键时刻,外贸大省如何突围?
-
“中国代表团访问巴西,探讨两洋铁路”
-
“世界贸易将围绕中美运转,美国如此笨拙…”
-
“中国将缺席,英国遭受打击”
-
“美国设下陷阱,韩国主动入局,要重现广场协议?”
-
美媒感慨:2小时→1分钟,中国又一壮举
-
“英伟达对中国客户隐瞒了…”
-
美国土安全部长放狠话:哈佛如果不从命,就别想再招外国学生
-
武契奇:天塌下来,我也不改主意
-
特朗普突然现身美日关税谈判,“背后是市场压力”
-
沙利文猛批特朗普:中国可不会像苏联那样崩溃
-
美国“吃货”欲哭无泪:特朗普逼着中餐馆换料,味儿不对了
-