DeepMind AlphaFold背后的人工智能——及其对未来药物发现的影响

KristófZsolt Szalay
头像

Kristof Zsolt Szalay是Turbine.ai的创始人和首席技术官,仿真驱动的药物发现公司 - emerj人工智能研究的顾客贡献者。金博宝官网克里斯特福克斯托夫培养了Semmelweis大学的分子生物学和生物信息学的博士学位。

DeepMind的Alphafold 950x540后面的AI

这是一个贡献的文章KristófZsolt Szalay。Kristóf是涡轮公司的创始人和首席技术官。他拥有分子生物学和生物信息学博士学位。请联系editorial@www.satan-says.com查询外部专家提供的文章。

你能仅根据零件清单来预测一架飞机是如何飞行的吗?

这-与蛋白质-是本质蛋白质折叠的挑战

两周前,CASP蛋白质折叠挑战赛的组织者刚刚宣布DeepMind的AlphaFold基本上解决了这一挑战——它的预测得分略低于实验误差。

这个事实应该可行的活动已知一段时间 - Live Celler没有装配手册,因此部分代码的部分必须以及程序集的代码。我们甚至可以从Schrödinger的等式而建立——唉,现在即使是地球上所有计算机的综合能力也不足以做到这一点。

DeepMind AlphaFold的成就

对于蛋白质,看起来就是一切。

喜欢与keyholes的搭扣,形状蛋白质定义其互动伙伴,相反地是其在复杂的20,000种不同类型蛋白质的复杂机械中的位置和功能。

对于一些蛋白质,它们的形状可以通过实验来确定——这就是CASP的金标准最初出现的原因。其他的适应性很强,它们并没有明确的形状。虽然有其他的研究方法来弄清楚特定蛋白质是如何运作的,AlphaFold应该能帮助弄清楚人体中有多少蛋白质在运作。在这方面,这一发现意义重大。

但这也可以在没有AlphaFold的情况下实现。尽管20000个蛋白质是一个很大的数字,但我们最终会发现的数量有限。

然而,如果没有像AlphaFold这样的工具,就不可能对大量的蛋白质进行研究。制造正确蛋白质的方法只有一种,但制造错误的方法有很多。这样的突变体蛋白相信许多重要疾病,最值得注意的是,癌症

alphafold及其后续人员可能是只有我们可以弄清楚如何损坏的蛋白质看起来像和毒品靶向。

为了欣赏这一重大突破,《自然》杂志提供了一张图,展示了过去15年蛋白质折叠预测的准确性:

alphafold2.
来源:DeepMind

它基本上停滞在40%左右,直到AlphaFold2出现,并在4年时间里主导了所有其他竞争性的任务方法。

肯定背后突破这种幅度,必须有一些精学的科学洞察力,对吧?

建筑和计算中的优势

这里有一个突破,它刚与之相关蛋白质

alphafold2建立在同一个变压器机器学习建筑另一个突破是生成式预训练变压器3 (GPT-3)- Openai语言模型,在许多案例中生成文本,无法从人类写作中无法区分。

模型大小GPT-3
竞争预先训练的NLP模型的相应模型大小 - 突出了相对庞大的GPT-3,它使用与DeepMind的alphafolf相同的变压器架构。来源:分析方面

变压器设计为减少机器学习培训时间。它不是一种方法,即某种方式从相同数量的参数产生更好或“更智能”。相反,变形金刚确实允许培训模型数十亿个变量与此同时,使用数十万个机器小时。

为此,alphafold2可以被认为比科学第一的工程突破更多。由于DeepMind与Google合并,他们可以使用从基础架构中的资源和方法来支持很多互联网本身。我从多个科学家听到它,如果AlphaFold2释放他们的源代码,它甚至没有重要,只要它刚刚开始“导入谷歌”,这是一个巨大的竞争优势。

IBM的深蓝超级计算机1997年击败了Kasparov有人指责他并没有真正掌握国际象棋,只是简单地将蛮力计算能力用于一系列可能的走法和组合。即使是对人工智能持悲观态度的人也可能会说,这一成就意义重大。

我们可能会对alphafold说同样的说法。它没有“掌握”蛋白质折叠,它简单地汇编了近乎无限的计算能力(尽管以一种显着复杂的方式)来寻找可能已经花费数百万年来计算的组合而没有硬件和深度可以访问的方法。

与深蓝色一样,alphafold没有改变药物发现 - 我变化了科学。我们可以预期,这些工程上的突破将进入科学和工业的其他离散问题,我们很可能会看到AlphaFold或类似gpt -3的应用程序在未来一年出现在其他科学或工业领域。

学术和私营部门研究团队的影响

我相信AlphaFold的主要近期影响将是一系列针对特定突变的新药,从而为患者增加许多额外的寿命。

蛋白质折叠科学家在短短几年内被Deepmind粉碎了他们的领域,但这适用于我们所有人。没有许多研究团队或研究所在一个甚至支付模型的培训的位置,更不用说招聘或保留技术团队这可以改善它。

我们这些没有在谷歌支持的公司工作的人可能仍然需要在科学上聪明,但我们必须建立能够竞争的肌肉。

学术研究不一定是注定的。然而,我也认为它需要改变以保持相关性。我想留下来的人会采用这样的结构c-大量的人致力于相同的目标,共享一个共同的基础设施,只是在上面运行不同的、相关的项目。

讽刺的是,COVID-19可能起到了帮助作用。即便是深入了解如此大规模的遥远科学合作也闻所未闻,但现在我们更习惯于使用Zoom、Slack和它们的伙伴,所以这可能是可能的。我们有办法让成千上万的人远程一起编写代码,只是我们没有为研究建立相同的系统。也许是时候着手解决这些问题了。

编辑注意:

私营部门公司可以从学习由DeepMind(谷歌)和Openai等巨型公司部署的架构,工具和培训方法中获益微软),但它们不可能在计算机领域与之竞争。他们也不太可能争夺原始的ML工程人才。深度和狭窄的主题专业知识将更有可能支持大型科技公司以外的公司的盈利发现和突破。

保持AI曲线的领先地位

发现在未来商业中区分赢家和输家的关键AI趋势和应用。

注册“AI Advantage”时事通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - check your inbox for a confirmation email">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
subscribe-image
走在机器学习曲线的前面

加入超过20,000名专注于AI的商业领袖,每周接收我们最新的AI研究和趋势。

感谢您订阅Emerj的“人工智能优势”通讯,请查看您的电子邮件收件箱确认。