人工智能驱动的初创公司将蛋白质发现推上了快车道

将定向进化与机器学习相结合的技术有望优化潜在药物。

所产生的

日本政府支持人工智能研究的一项举措正在生物制药领域取得成效。

采取直接的方法

利用进化过程创造新的蛋白质是日本东北大学生物分子工程学教授Mitsuo Umetsu的专长。Umetsu和他的团队在细菌生物工厂的帮助下，通过向基因中引入随机突变和迭代地培养新一代蛋白质，创造出了粘附在塑料或陶瓷等表面的抗体，以及将纤维素转化为糖以生产生物乙醇的酶。

然而，这种“定向进化”方法的一个问题是，它可以生成大量的DNA序列，而它们之间的差异很小。如果DNA文库太大，用实验筛选感兴趣的蛋白质就变得很有挑战性。相反，没有足够序列的库可能不会保存任何相关的变量。

“在定向进化中，成功的概率取决于投资的规模，”Umetsu说。“这就是为什么我觉得机器学习可以引导我们找到最理想的蛋白质，而不受DNA库规模的限制。”

2016年，Umetsu加入了日本最大的国立研究机构理研的先进智能项目中心，与来自全国各地的机器学习专家合作。这种合作关系在典型的蛋白质工程实验中产生了不同的倾向。在创建了DNA库之后，该团队对变异进行了表征，并使用结果训练了一个机器学习模型。然后，新的算法被用于引导后续的基因突变转向目标蛋白质。

通过改变荧光蛋白的发射颜色和增强肽基酶的活性等实验，研究人员发现，机器学习可以显著减少用于定向进化的典型DNA文库的大小。

Umetsu解释说:“当我们仔细地获得高质量的数据时，我们只需要大约100个样本来训练机器学习来提出最佳的蛋白质和酶序列，而传统技术需要大约1万个样本。”

向更好的方向改变

在Umetsu进行机器学习研究时，他遇到了在生物制药领域拥有30多年经验的高管片冈四郎(Shiro Kataoka)。他们一起决定将机器学习技术商业化，并将其应用于优化临床前候选药物。

RevolKa的总裁兼首席执行官片冈说:“在先导优化中，生物活性、结构稳定性和表达等属性应该同时改变，而用大规模的文库很难解决这个问题。”我们的技术可以用最少的训练数据同时解决多个物业问题，这大大减少了寻找解决方案所需的时间和精力。”

Umetsu和Kataoka对RevolKa的计划是让它成为优化生物制药开发的全球领导者。RevolKa的名字来自阿伊努语中的raise (reska)和拉丁语中的evolution(进化)。

Umetsu说:“蛋白质药物已经多样化，有各种特性需要改进。”“我们正在利用最近的一轮融资来发展我们的技术，以满足我们合作伙伴公司的需求，并帮助他们开发创新的生物产品。”

相关文章