利用人工智能预测蛋白质“光学指纹”取得进展 蛋白质是光学指纹生命的基石

蛋白质是光学指纹生命的基石,生物的利用功能依赖于既稳定而又灵活可变的蛋白质结构。蛋白质的人工光谱响应信号,尤其是智能质取展紫外光谱,可以称之为蛋白质骨架的预测“指纹”。这个“光学指纹”,蛋白得进经过理论模拟的光学指纹解读,可以揭示出精确的利用蛋白质结构,为生命科学和医学诊断提供极其重要的人工信息。
然而,智能质取展蛋白质的预测结构极其复杂多变,需要做大量的蛋白得进高精度的量子化学理论计算。由于计算量太大,光学指纹即使是利用最厉害的超级计算机轻易也“吃不消”。所以蛋白质的人工光谱的理论解读是一个长期的困难与挑战,限制了光谱的准确分析和蛋白质结构的发现。
怎么在光谱理论模拟中避免太昂贵的量子化学计算,解读蛋白质骨架的“光学指纹”,是一个重要的科学课题。而近年来,人工智能技术被广泛应用到各个领域,用于大幅度降低复杂体系的计算量。
最近,中国科学技术大学微尺度物质科学国家研究中心教授江俊,与中国科大教授罗毅和美国加州大学尔湾分校教授Shaul Mukamel合作,通过利用人工智能机器学习中的神经网络技术,模拟了蛋白质肽键结构与性质之间的构效关系,将计算量一下降低了上万倍。最后他们成功地预测了肽键紫外光谱,还用随机森林的办法揭示了具有化学内涵的结构描述子和构效关系。人工智能与量子化学理论计算的结合,为预测蛋白质的光学特性提供了一种高效的工具。相关成果以A Neural Network Protocol for Electronic excitations of N-Methylacetamide 为题发表在《美国国家科学院院刊》(PNAS, DOI:10.1073/pnas.1821044116)。
江俊课题组近些年致力于发展机器学习技术在量化领域的应用,努力探究使其成为解决量化问题的一种重要工具。在该工作中,研究人员首先在300K温度下通过分子动力学模拟以及量子化学计算,得到了五万组不同构型的肽键模型分子。通过机器学习算法筛选出键长、键角、二面角跟电荷信息作为描述符,通过神经网络来构建肽键基态结构与其激发态性质之间的构效关系。基于训练好的机器学习模型,预测出了肽键的基态偶极矩及激发态性质,最后预测出肽键的紫外吸收光谱。为了验证机器学习模型的鲁棒性,研究人员又基于300K的温度下得到的机器学习模型,预测出肽键在200K以及400K温度下的紫外吸收光谱,其结果与时间密度泛函理论计算很好地吻合。
这是人工智能技术首次用于理论计算预测蛋白质的光谱研究。通过理论计算得到大量数据,使用人工智能加以训练构建构效关系,使用最后得到的模型用于预测,为模拟蛋白质的光谱提供了一种新的思路。该项工作确立了机器学习模拟蛋白质肽键骨架紫外吸收光谱的可行性和优势,蛋白质的“光学指纹”解读也将会变得更加轻易和有效。
声明:本文所用图片、文字部分来源于网络,版权归原作者所有。如涉及到版权问题,请及时和我们联系。
相关文章
- 国务院新闻办公室4月9日发布《关于中美经贸关系若干问题的中方立场》白皮书,澄清中美经贸关系事实,阐明中方对相关问题的政策立场。白皮书除前言、结束语外共分为六个部分,分别是中美经贸关系的本质是互利共赢;2025-05-10
- 深陷违规担保漩涡的*ST新都(行情, 问诊)(000033,收盘价4.69元)今日公告,3名独立董事刘书锦、陈友春、郭文杰提交的《关于罢免控股股东推荐董事林汉章先生、叶文治先生、张力群先生》(以下简称2025-05-10
- 一年前,康芝药业(行情, 问诊)(300086,收盘价13.30元)突然曝出被海南证监局立案调查的消息,曾引来市场各方广泛关注,公司酝酿已久的股权激励计划,也宣告夭折。一年后的今天,随着康芝药业曝光一2025-05-10
- 上周A股运行重心有所回落,沪指跌破半年线、60日均线等多条中长期均线的支撑,2000点大关再度面临考验。盘面上虽然不乏军工、高铁等题材概念热点,但成交量不能有效放大始终是抑制股指走强的重要因素,这也表2025-05-10
- 滁州网讯全媒体记者喻 松 通讯员郝春燕)4月30日上午,滁州经开区管委会联合市卫健委举办“健康工作安全同行”职工职业健康安全知识竞赛,8支企业代表队通过知识竞答、实操比拼展开角2025-05-10
- 2013年156家期货公司实现净利35.69亿元,有125家盈利,占比八成中信期货净赚2.24亿元跃居榜首,东兴期货净利猛增11倍见习记者马爽日前,中期协公布了156家期货公司2013年年度财务信息,2025-05-10
最新评论