图文引用自:ithome

Profluent、Salesforce研究院和UCSF的科学家,以类似生成文字人工智能的方法,使用模型ProGen设计百万种蛋白质,并且成功找出具有杀菌效果的蛋白质。这个研究实际应用人工智能设计蛋白质,并经测试和证明其具有特定效果,也就是说,同样的方法将能够被用于加速新药制造。

这项研究使用一个由Salesforce研究院所开发的ProGen模型,该模型能够预测人造蛋白质的氨基酸序列。ProGen的运作方式和生成文字的人工智能相似,研究人员将来自19000个家族的2.8亿种蛋白质的氨基酸序列输入到模型中,并添加蛋白质特性控制标签,经过数周的训练,ProGen便学会生成新蛋白质的方法。

研究人员使用5个溶菌酶家族的56000个氨基酸序列,以及有关这些蛋白质的上下文资讯微调ProGen后,该模型迅速产生一百万个氨基酸序列,研究人员根据与天然蛋白质序列相似程度,和潜在氨基酸语法和语义的自然程度,筛选出100个序列并在细胞中实验进行实验,其中有66个和蛋白、唾液里的溶菌酶一样,能够杀死细菌。

研究人员筛选这66个氨基酸序列,制作出5种活性最强的人工酶,将这些酶添加到大肠杆菌样本中,并且和溶菌酶HEWL相比较,发现其中两种人工酶,能够以和HEWL相当的活性分解细菌细胞壁,而这两个人工酶序列仅有18%的相似程度,和已知蛋白质序列的相似度各别为90%和70%。