本站公告

  • 版权说明:网站所有内容均来自互联网用户共享内容,不代表易富彩票注册立场,若侵犯您的权益,请与我们联系。

  • 投诉/建议:欢迎与易富彩票注册合作、投诉、建议,意见可以发送详细内容至邮件:15983226@qq.com 。

Google教授人工智能分类猫照片以分析DNA

当MarkDePristo和RyanPoplin开始工作时,谷歌的人工智能对遗传学一无所知。事实上,它是一个为图像识别而创建的神经网络-就像在神经网络中识别上传到谷歌的照片中的猫和狗一样。它有很多值得学习。

但仅仅8个月后,神经网络在FDA竞赛中获得了最高分,准确识别了DNA序列中的突变。在短短一年时间里,AI的表现优于标准的人工编码算法GATK。德普里斯托和波普林会知道;他们是最初创建GATK的团队。

10名科学家组成的团队花了五年时间创建了GATK。谷歌的人工智能只是最好的一个。

“甚至不清楚它是否有可能做得更好,”德普里斯托说。他们在GATK上抛出了所有可能的想法。“我们建造了大量不同的型号。根易富彩票本没有什么能真正触动针头,“他说。随后出现了人工智能。

本周,谷歌将发布最新版本的技术作为DeepVariant。外部研究人员可以使用DeepVariant,甚至修补其代码,该公司已将其作为开源软件发布。

DeepVariant与之前的GATK一样,解决了一个技术但重要的问题,称为“变体调用”。现代序列发生器分析DNA,它们不会返回一条长链。相反,他们返回的短片段可能长达100个字母,彼此重叠。将这些片段对齐并与其序列已知的参考基因组进行比较。如果片段与参考基因组不同,您可能会有一个真正的突变。如果片段与参考基因组和彼此不同,则存在问题。

GATK尝试用大量统计数据来解决问题。DNA测序机有时会出错,因此GATK团队研究了机器往往会出错的地方。(字母GTG特别容易出错,只举一个例子。)根据DePristo的说法,他们认为“隐藏马尔可夫模型的统计模型”之类的事情很长很难。然后,GATK对DNA中某个位置的实际字母进行了最佳猜测。

另一方面,DeepVariant对DNA测序机仍然一无所知。但它消化了大量数据。神经网络通常被模拟为“神经元”层,其逐渐处理更复杂的概念-第一层可能响应光,第二层形状,第三实际物体。由于DeepVariant使用数据进行训练,因此可以了解要加强的“神经元”和要忽略的“神经元”之间的连接。最终,它可以根据错误对实际突变进行排序。

为了使DNA测序数据适合图像识别AI,Google团队想出了一个解决方法:只需将其制作成图像即可!当科学家们想要调查一个突变时,他们会经常拉出对齐的片段,如下所示:

Google

“如果人类将这视为一项视觉任务,为什么不把它作为视觉任务?”波普林说。所以他们做到了。字母-A,T,C或G-got分配了一个红色值;该位置的测序质量为绿色值;DNA的两条链是蓝色的。他们一起形成了一个RGB(红色,绿色,蓝色)图像。

(责任编辑:易富彩票注册)

本文地址:http://www.sunzequn.com/sanwen/xiaoyuan/201911/1867.html

上一篇:每日问题延续救助文化? 下一篇:没有了