浙大发布高精准基因组设计AI模型
来源:新华社
浙江大学郭国骥教授团队开发出一款用于基因组预测设计的深度学习AI模型“女娲CE”,能够以超过90%的准确率预测基因组调控区域发生突变之后带来的表型变化,并结合疾病表型设计出相应的治疗位点。8日,相关成果发表于国际学术期刊《细胞》。
据介绍,基因组由DNA组成,不仅包含蛋白质的编码序列,还包含大量不编码蛋白质的调控序列。这两类序列的协同作用,共同决定了生物体的复杂表型特征。
“读懂生物体的古老遗传‘语言’,是科学家们一直致力于攀登的科学高峰。”郭国骥说,人类基因组计划集全球科学家之力绘制出人类基因图谱,但多年来,科学家对其中的遗传信息的破译还不足10%。近年涌现的AI模型可帮助科学家们进一步快速、系统地理解隐藏在海量基因序列背后的复杂调控语言。
郭国骥团队自主开发了超高通量、超灵敏度的单核染色质可及性测序技术,在这一技术基础上构建了覆盖小鼠、鸡、守宫、蝾螈和斑马鱼五种代表性脊椎动物的全组织调控元件图谱,形成优质“数据库”,并开发出多任务深度学习AI模型“女娲CE”,实现从基因组到细胞图谱的直接预测。
“基于大量优质的数据,‘女娲CE’模型在多项指标上超越现有的基因组AI模型。”郭国骥介绍,“女娲CE”能够预测基因组调控元件发生突变之后对各种细胞类型带来的表型变化,经检测准确率超过90%。
“基于‘女娲CE’预测出的一个镰刀型贫血症治疗性基因位点,我们对该位点进行修改,使得胎儿血红蛋白表达量得到提升。”郭国骥表示,“女娲CE”系列模型将帮助研究人员更好地理解遗传病发生的复杂原因,为生命科学、医学和农学研究提供强大的支撑。
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
评论该主题
帖子不见了!怎么办?作者:您目前是匿名发表 登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》