-
潘禺:在这迷人又壮美的科学领域,“中国玩家”能奋起直追吗?
最后更新: 2024-10-10 08:34:47在贾姆珀的领导下,AlphaFold被更新重建了,DeepMind设计了一种新型的Transformer架构,神经网络调整了其连接的强度,以创建更准确的蛋白质进化和结构数据表示。
AlphaFold2的预测效率和准确性有了巨大提高。DeepMind找了大约50篇发表在《科学》、《自然》和《细胞》等高端期刊上的论文,这些论文都是实验主义者的辛勤工作成果,描述新的蛋白质结构和功能,将AlphaFold2的预测结果与之对照,可以继续打磨改进。
在2020年的CASP比赛中,评估员将预测的蛋白质结构与经过验证的实验结构进行比较来打分,100分即模型和现实在原子层面上完全匹配。AlphaFold2的大多数结构都达到或超过了90分。大多数情况下,算法都有效。
DeepMind已经解决了蛋白质折叠问题中的结构预测部分。AlphaFold2能够准确地根据其氨基酸序列预测蛋白质的结构。对于因疫情封锁在家,通过Zoom参加CASP会议看到AlphaFold2演示的科学家们来说,这个小小震撼意味着,蛋白质科学的世界已经永远改变了。
设计蛋白质:逆蛋白质折叠问题
长期以来,实验生物学家对计算持怀疑态度,AlphaFold2的成功无疑改变了这一点,但如果说“改变一切”,就有些夸大其词。
AlphaFold2并不等于结构生物学家的失业。
当然,失业总会存在。一些细胞生物学家和生物化学家过去常常与结构生物学家合作,现在他们已经用AlphaFold2来取代。尽管,训练AlphaFold的数据,是结构生物学家过去用一个个实验精心确定的。
结构生物学的技术,除了前面说的X射线晶体学,还有冷冻电镜、NMR 波谱、双偏振干涉测量等技术。
而中国公众可能对冷冻电镜比较熟悉。这一昂贵的设备(Cryo-EM,冷冻电子显微镜),其原理是快速冷冻生物样品并用电子束轰击它们。X射线晶体学需要蛋白质结晶,而冷冻电镜能够处理非晶态样品。X射线晶体学在高分辨率原子级结构方面有优势,而冷冻电镜在解析大型复合物和动态过程中更为强大。过去十年中,冷冻电镜发展迅速,成为解析复杂生物大分子结构的重要工具之一。广为公众熟知的中国科学家施一公、颜宁等人,都是用冷冻电镜解析蛋白质结构的专家。
结构生物学家颜宁
如果结构生物学家仅仅研究蛋白质结构,那他们当然失业了。但结构生物学家的目标是发现蛋白质的功能。有了AlphaFold2,他们就有了一个更好的工具,可以在几分钟内创建一个假设,而不是等待几个月甚至几年通过实验来确定一个结构。
结构生物学家的角色不仅仅是获取结构数据,还包括解释这些数据、设计实验验证假设,并理解蛋白质功能和与疾病相关的机制。这个问题就像AIGC会不会让创作者失业。ChatGPT能告诉你的答案也许准确度已经很高,但未必完美,对AI大模型生成的内容,每一个创作者都还需要仔细甄别、验证,并理解这些内容的真正意义,用这些内容为自己和社会创造价值。
AlphaFold2的不完美在于,在预测简单的小型蛋白质结构方面,非常出色,但在预测包含多个部分的蛋白质,动态蛋白质(与其他分子相互作用时,形状会发生变化)时,准确性较低。有时,蛋白质需要被特定的离子、盐或金属包围才能正确折叠,自然环境会改变蛋白质的形状,AlphaFold2并不能考虑。
仅仅识别已知蛋白质的结构和功能是不够的。
对于新药研发来说,科学家需要设计那些在自然界中不存在的蛋白质,这就是蛋白质设计,也可以理解为“逆蛋白质折叠问题”。还记得用AI解决蛋白质折叠问题是什么意思吗?无非就是向深度学习算法输入氨基酸序列,要求其输出蛋白质结构。这个问题逆过来,就是设计师将一个蛋白质结构输入算法,并要求其输出氨基酸序列。然后,设计师使用那个氨基酸序列在实验室中构建蛋白质。
宋乐就曾讲过,要设计一段有效的蛋白质,“有20个不同的位置,每个位置有20种不同的选择。这是一个巨大的空间,人的思维很难对这个空间进行整体的筛选或对比,而计算机来做这件事就有巨大优势。”
Foldit游戏的创建者贝克,就做了一个专门用于设计的算法,称为RoseTTAFold diffusion,Foldit游戏本身也更新了设计蛋白质的版本。蛋白质设计并非新鲜事物,但深度学习加速了其发展。以前,训练有素的蛋白质设计师需要花费数周或数月的时间,才能创建新蛋白质的主链。现在他们可以在几天内,甚至一夜之间完成。
AlphaFold3与中国玩家
2022年,谷歌DeepMind发布了全球已知的2.18亿种蛋白质的结构预测,这几乎就是所有。其竞争对手Meta公司也于当年推出了蛋白质结构预测模型ESMFold。
但AlphaFold2仍有缺陷,比如前文提到的无法考虑环境。细胞内部是复杂的生物学环境,充满了各种分子——蛋白质、信号分子、信使RNA、细胞器等,蛋白质不是独立工作,而是不断与其他分子相互作用,这会改变其自身的形式和功能。将细胞分子的景观渲染出来,可视化呈现,你会看到非常壮美的复杂性。
真核细胞的细胞景观横截面,渲染图显示了其复杂而壮美
AlphaFold2的能力限于预测单一蛋白质结构,而要帮助生物学家理解这个复杂原生环境中的蛋白质,就是这一领域现在的发展方向。2024年春,谷歌DeepMind更新算法,发表了AlphaFold3的论文,大卫·贝克则推出了RoseTTAFold All-Atom算法,都致力于能够预测蛋白质互相结合,或与DNA、RNA和其他小分子结合时的结构。
AlphaFold3能预测分子复合物的结构,比如某种在植物真菌中发现的酶。根据业内专家的分析,目前这些算法的准确性仍有待改进,不太可能很快带来新药。一个重要变化是,AlphaFold2的基础代码是开源的,每个人都可以研究算法并为自己的项目重建,但谷歌没有开源AlphaFold3。
中国企业也在加入AI+生命科学的领域。基于AlphaFold2算法改进,华为昇思MindSpore团队,采用自己的昇腾计算平台,在2022年4月一度拿下CAMEO这一蛋白质结构预测竞赛的第一名,这个比赛每周都会在线更新分数和名次。
2020年创立的百图生科,则致力于搭建“xTrimo”生命科学大模型,这是一个雄心勃勃的超大规模多模态模型体系,在底座通用模型上,除了蛋白质生成模型,还有多个下游任务模型共同组成。比如靶点发现,也就是免疫细胞扰动后功能变化预测模型。
当发现了一个疾病靶点后,就要设计一个蛋白质。
如果将疾病相关的靶点想象成一把锁,设计蛋白质就是配钥匙,要打开锁,锁齿和钥匙就要契合,这就需要模型来预测。因此蛋白质生成不仅要预测结构,还要预测蛋白质与靶点的契合度,也就是结合的紧密强弱,然后再对AI生成的许多设计做筛选,将最合适的送去试验。
xTrimo有多个层次,第一层是对单个蛋白质的建模,第二层是对细胞中蛋白质相互作用的建模,第三层是对细胞本身的建模,第四层则是对细胞系统的建模。因而,这个体系不仅能表征单体蛋白质,还能表征蛋白质相互作用、免疫细胞、免疫系统等多层次生物问题,帮助研究者更快发现新的蛋白质、新的细胞形态,发现新的靶点和药物设计方向。
为此,百图生科构建了世界最大的免疫图谱,包含66亿个蛋白,超300亿条蛋白互作关系,1亿个单细胞,以及超6100万条免疫互作关系和6000亿条泛细胞共现关系。
结语
生命体的高度复杂,还远不是AI科学家使用的庞大但依然有限的数据量就能揭示的。
蛋白质折叠问题仍未完全解决。AI能识别出给定氨基酸序列可能的折叠模式,但蛋白质折叠过程中,究竟发生了什么,其中的信息依然是黑箱。对于理解整件事发生的过程,AI并不能给出答案,深度学习算法无法告诉我们基于蛋白质的生命机制和本质,无法告诉我们背后的基本物理原理。如果只有结果,没有过程,这还是科学吗?
无论如何,科学确实在前进。70年前,人们还认为蛋白质只是一种凝胶状物质。但今天,我们看到了蛋白质世界的一个又一个结构。
本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。
标签 心智观察所- 原标题:在这迷人又壮美的科学领域,“中国玩家”能奋起直追吗? 本文仅代表作者个人观点。
- 责任编辑: 袁以衡 
-
我国科技成果转化问题到了必须要解决的地步
2024-10-08 16:58 心智观察所 -
2024年诺贝尔生理学或医学奖揭晓
2024-10-07 17:45 诺贝尔奖 -
跨越7公里!我科学家研究分布式光量子计算获重要进展
2024-10-07 10:00 科技前沿 -
潘建伟:明年计划发射2-3颗低轨卫星,10年内建成量子星座
2024-10-04 09:43 科技前沿 -
国际首次!我国科研团队完成超导太赫兹通信实验
2024-10-03 19:57 科技前沿 -
突破!我科研人员在高温超导研究领域取得新进展
2024-10-03 10:23 科技前沿 -
打破国外垄断!全球最大,成功下线
2024-09-30 11:26 中国精造 -
新突破!自主可控,首试成功
2024-09-27 20:41 科技前沿 -
2024全球创新指数发布:中国居第11
2024-09-27 07:11 -
重要突破!我国科研人员发现能强效抑制艾滋病病毒的纳米抗体
2024-09-26 08:06 科技前沿 -
全球首座!我国海上稠油热采关键技术取得重大突破
2024-09-25 08:34 能源战略 -
一箭五星!力箭一号遥四商业运载火箭发射成功
2024-09-25 08:04 航空航天 -
“蛟龙号”首次搭载外籍科学家进行下潜作业
2024-09-25 07:41 科技前沿 -
中国将在月球上建无线网
2024-09-24 19:44 嫦娥奔月 -
为了美国的“新质生产力”,雷蒙多操碎了心
2024-09-24 12:01 心智观察所 -
月背“土特产”将开放申请!先发给国内科学家研究
2024-09-24 09:06 科技前沿 -
可用上千年!效率最高的辐光伏核电池在我国面世
2024-09-24 07:22 能源战略 -
42.02万高斯!我国打破美国创造的世界纪录
2024-09-22 17:00 科技前沿 -
美国开始重新审视量子计算机,这对中国很重要
2024-09-20 08:45 心智观察所 -
俄罗斯拥抱西方的旧梦:“瓦森纳协定”正走向历史垃圾堆
2024-09-18 07:45 心智观察所
相关推荐 -
“痛苦!关税战被中方拿捏,美国只能二选一” 评论 53“中国人很团结,就连亲美人士都认为必须对抗美国” 评论 187撑不住了?特朗普暗示降低对华关税 评论 366几经波折,美乌要签了? 评论 125“不吃够自己种的苦果,某国就不会放下身段老实谈判” 评论 197最新闻 Hot
-
“痛苦!关税战被中方拿捏,美国只能二选一”
-
“再没进展,我们就撤”
-
“中国人很团结,就连亲美人士都认为必须对抗美国”
-
又一位科学家回国!曾供职美顶尖能源实验室
-
撑不住了?特朗普暗示降低对华关税
-
国家发改委干将龚桢梽,“空降”广东
-
广西东兰干旱“农民求雨”?当地回应:视频系摆拍
-
外媒继续紧盯:中国,70天了…
-
中央巡视组刚进驻吉林,正厅级赵明任上被查
-
“中方把波音飞机退回美国”
-
巴西毛遂自荐:听说中国停了近400家美国牛肉商…
-
“特朗普破产过6次,想用这样的手段吓中国?”
-
“毛主席总讲,既要看到它是‘纸老虎’,又要看到它是‘真老虎’”
-
泽连斯基猛批美国特使:散布“俄罗斯叙事”
-
就因两张超速罚单,日籍博士被美国吊销签证
-
果然,特朗普对中国船只动手了!
-