跳到主要内容

感谢您访问nature.com。您使用的浏览器版本对CSS的支持有限。为了获得最佳体验,我们建议您使用更最新的浏览器(或关闭Internet Explorer的兼容性模式)。与此同时,为了确保继续支持,我们在显示站点时不使用样式和JavaScript。

  • 广告的功能广告主对本文内容负全部责任

人工智能驱动的初创公司将蛋白质发现推上了快车道

日本东北大学Mitsuo Umetsu的团队已经证明,在大型库的直接进化过程中,机器学习可以大幅减少获得最佳序列所需的实验数据数量(通常从10,000个样本数据集到约100个样本数据集)。©ustas7777777 /伤风

日本政府支持人工智能研究的一项举措正在生物制药领域取得成效。

采取直接的方法

利用进化过程创造新的蛋白质是日本东北大学生物分子工程学教授Mitsuo Umetsu的专长。Umetsu和他的团队在细菌生物工厂的帮助下,通过向基因中引入随机突变和迭代地培养新一代蛋白质,创造出了粘附在塑料或陶瓷等表面的抗体,以及将纤维素转化为糖以生产生物乙醇的酶。

然而,这种“定向进化”方法的一个问题是,它可以生成大量的DNA序列,而它们之间的差异很小。如果DNA文库太大,用实验筛选感兴趣的蛋白质就变得很有挑战性。相反,没有足够序列的库可能不会保存任何相关的变量。

“在定向进化中,成功的概率取决于投资的规模,”Umetsu说。“这就是为什么我觉得机器学习可以引导我们找到最理想的蛋白质,而不受DNA库规模的限制。”

2016年,Umetsu加入了日本最大的国立研究机构理研的先进智能项目中心,与来自全国各地的机器学习专家合作。这种合作关系在典型的蛋白质工程实验中产生了不同的倾向。在创建了DNA库之后,该团队对变异进行了表征,并使用结果训练了一个机器学习模型。然后,新的算法被用于引导后续的基因突变转向目标蛋白质。

RevolKa的aiProtein技术可以增强抗体和酶的活性和理化性质。©RevolKa

通过改变荧光蛋白的发射颜色和增强肽基酶的活性等实验,研究人员发现,机器学习可以显著减少用于定向进化的典型DNA文库的大小。

Umetsu解释说:“当我们仔细地获得高质量的数据时,我们只需要大约100个样本来训练机器学习来提出最佳的蛋白质和酶序列,而传统技术需要大约1万个样本。”

向更好的方向改变

在Umetsu进行机器学习研究时,他遇到了在生物制药领域拥有30多年经验的高管片冈四郎(Shiro Kataoka)。他们一起决定将机器学习技术商业化,并将其应用于优化临床前候选药物。

RevolKa的总裁兼首席执行官片冈说:“在先导优化中,生物活性、结构稳定性和表达等属性应该同时改变,而用大规模的文库很难解决这个问题。”我们的技术可以用最少的训练数据同时解决多个物业问题,这大大减少了寻找解决方案所需的时间和精力。”

Umetsu和Kataoka对RevolKa的计划是让它成为优化生物制药开发的全球领导者。RevolKa的名字来自阿伊努语中的raise (reska)和拉丁语中的evolution(进化)。

Umetsu说:“蛋白质药物已经多样化,有各种特性需要改进。”“我们正在利用最近的一轮融资来发展我们的技术,以满足我们合作伙伴公司的需求,并帮助他们开发创新的生物产品。”

相关文章

搜索

快速链接

Baidu
map