东南教育网您的位置:首页 >机器人 >

机器学习可预测生物回路的行为

导读 杜克大学的生物医学工程师已经设计了一种机器学习方法,可以对工程细菌中复杂变量之间的相互作用进行建模,而这些相互作用原本就很难预测。

杜克大学的生物医学工程师已经设计了一种机器学习方法,可以对工程细菌中复杂变量之间的相互作用进行建模,而这些相互作用原本就很难预测。他们的算法可推广到多种生物系统。

在这项新研究中,研究人员训练了一个神经网络,以预测由嵌入细菌培养物中的生物回路产生的圆形图案。该系统的工作速度比现有的计算模型快30,000倍。

为了进一步提高准确性,该团队设计了一种方法来多次重新训练机器学习模型,以比较他们的答案。然后他们用它来解决第二个生物系统,该系统以不同的方式计算要求很高,这表明该算法可以应对各种挑战。

结果于9月25日在线发表在《自然通讯》杂志上。

杜克大学生物医学工程系教授Lingchong You说:“这项工作的灵感来自Google,表明神经网络可以学习在棋盘游戏Go中击败人类。”

您说:“尽管游戏规则简单,但计算机确定性地计算最佳下一个选项的可能性仍然很大。” “我想知道这种方法在应对我们所面临的生物复杂性的某些方面是否有用。”

您和他的博士后研究员王尚英面临的挑战是确定在基因工程改造后,哪些参数集可以在细菌培养物中产生特定模式。

经过基因编辑以包括基因回路的细菌菌落随着其生长而形成一个紫色环。研究人员正在使用机器学习来发现数十个影响环性能的变量之间的相互作用,例如环的厚度,形成速度和形成环的数量。图片来源:杜灵崇,杜克大学

在先前的工作中,您的实验室对细菌进行了编程,以产生蛋白质,这些蛋白质根据培养物生长的具体情况相互影响而形成环。研究人员发现,通过控制诸如生长环境的大小和提供的养分的数量之类的变量,他们可以控制环的厚度,出现的时间以及其他特征。

通过改变数十个潜在变量,研究人员发现它们可以做更多的事情,例如引起两个甚至三个环的形成。但是由于一次计算机仿真需要五分钟,因此搜索任何大型设计空间以获取特定结果变得不切实际。

对于他们的研究,该系统由13个细菌变量组成,例如生长,扩散,蛋白质降解和细胞运动的速率。仅计算每个参数六个值将花费一台计算机600多年。在具有数百个节点的并行计算机集群上运行它可能会将运行时间缩短到几个月,但是机器学习可以将其减少到几个小时。

尤说:“我们使用的模型很慢,因为它必须以足够小的速率考虑到时间上的中间步骤,” “但是我们并不总是关心中间步骤。我们只是想要某些应用程序的最终结果。如果我们发现最终结果有趣,我们可以(回到)找出中间步骤。”

为了跳到最终结果,Wang转向了一种称为深度神经网络的机器学习模型,该模型可以有效地使预测比原始模型快几个数量级。该网络将模型变量作为其输入,首先分配随机权重和偏差,然后预测细菌菌落将形成哪种模式,从而完全跳过产生最终模式的中间步骤。

尽管最初的结果离正确答案还差得很远,但是每次将新的训练数据输入网络时,权重和偏差都可以进行调整。给定足够大的“训练”集,神经网络最终将几乎每次都学会做出准确的预测。

为了处理机器学习出错的少数情况,You和Wang提出了一种快速检查其工作的方法。对于每个神经网络,学习过程都具有随机性。换句话说,即使接受了相同的答案,它也永远不会两次学习相同的方法。

这些图的每一个代表细菌菌落的横截面。峰值预测了菌落将在哪里产生紫色蛋白质,这些紫色蛋白质由于人工基因回路而形成环。顶部的图形是通过机器学习算法创建的,而底部的图形是通过更全面的仿真创建的。它们匹配得很好-除了最后一个。学分:杜克大学

研究人员训练了四个独立的神经网络,并比较了每个实例的答案。他们发现,当经过训练的神经网络做出相似的预测时,这些预测接近正确的答案。

尤说:“我们发现我们不必使用较慢的标准计算模型来验证每个答案。” “我们基本上使用了'人群的智慧'。”

经过训练和证实的机器学习模型,研究人员着手使用它来发现有关其生物回路的新发现。在最初用于训练神经网络的100,000个数据模拟中,只有一个模拟产生了带有三个环的细菌菌落。但是随着神经网络的速度,You和Wang不仅能够找到更多的三胞胎,而且可以确定哪些变量对产生它们至关重要。

Wang说:“神经网络能够找到原本不可能发现的变量之间的模式和相互作用。”

作为研究的结局,尤和王在随机运行的生物系统上尝试了他们的方法。解决此类系统需要计算机模型多次重复相同的参数,以找到最可能的结果。尽管这是与原始模型相比计算时间长的完全不同的原因,但研究人员发现他们的方法仍然有效,表明该方法可推广到许多不同的复杂生物系统。

研究人员现在正在尝试将其新方法用于更复杂的生物系统。除了在具有更快GPU的计算机上运行该算法外,他们还试图对该算法进行编程以使其尽可能高效。

Wang说:“我们用100,000个数据集训练了神经网络,但这可能是过大了。” “我们正在开发一种算法,其中神经网络可以与仿真实时交互以帮助加快处理速度。”

尤说:“我们的首要目标是建立一个相对简单的系统。” “现在,我们希望改进这些神经网络系统,以便为更复杂的生物回路的基础动力学提供一个窗口。”

免责声明:本文由用户上传,如有侵权请联系删除!