病毒与人类的健康密切相关,但人类已知已确认的病毒种类仅有5000余种,这只是病毒世界的冰山一角。传统RNA病毒鉴定方法高度依赖于序列同源性比对,即通过比较未知病毒与已知病毒的序列相似性来进行识别。然而,RNA病毒种类繁多且高度分化,传统方法难以捕捉缺乏同源性或同源性极低的“暗物质病毒”,新病毒发现的效率较低。
AI与病毒学研究的结合正在突破这一难题。本篇论文提出了全新的深度学习模型"LucaProt",它基于Transformer框架与大模型表征技术,结合蛋白质序列和内在结构性特征,在独立的测试数据集上表现优异,具有极高的准确性(假阳性率仅为0.014%)和特异性(假阴性率为1.72%)。
亚搏手机版官方登录《Cell》是国际公认的享有最高学术声誉的期刊之一,国内每年入选《Cell》的论文数量仅有数十篇。此次入选的论文提出了一种基于深度学习的RNA病毒发现方法,是深度学习算法在病毒发现领域的里程碑式进展,为病毒学研究开创了全新范式。
据介绍,研究团队对来自全球生物环境样本的10487份数据进行病毒挖掘,发现了513134条病毒基因组,代表161979个潜在病毒种及180个RNA病毒超群。使RNA病毒超群数量扩容约9倍,病毒种类增加约30倍,其中23个超群无法通过序列同源方法识别,被称为病毒圈的“暗物质”。
该论文还揭示了多个病毒学领域新发现,例如发现迄今为止最长的RNA病毒基因组,长度达到47250个核苷酸;识别出超出以往认知的基因组结构,展示了RNA病毒基因组进化的灵活性。此外,在高温的深海热泉等极端环境中,RNA病毒依旧存在多样性。
中山大学医学院教授施莽表示,在科研领域,AI的应用已经势不可挡,通过AI方法探索科学问题已取得了重要突破。“这种研究范式将成为未来科学界的常态,也可能成为我们认知世界的重要手段。”
网友评论更多
17遂宁s
游戏 UI 谈话会🙅🙆
2024-11-27 10:41:39 推荐
187****8101 回复 184****7182:独立游戏《曼尼汉堡店》在中国莫名奇妙破圈,如何评价独游“墙外开花墙内香”的这种现象?🙇来自内江
187****1796 回复 184****7710:面对新技术浪潮,如何找到好的产品落地方向|AI 先行者沙龙圆桌实录🙋来自乐山
157****8133:按最下面的历史版本🙌🙍来自自贡
26泸州811
MoonBit: 大模型时代下的编程语言探索🙎🙏
2024-11-26 20:25:49 推荐
永久VIP:对于《刺客信条:起源》中所展示的古埃及,你作何评价?🚣来自宜宾
158****6075:钢铁雄心4非作战状态时,部队的装备损耗怎么看?🚴来自攀枝花
158****1318 回复 666🚵:光荣公司的历史观点有什么特色?🚶来自巴中
40达州bx
历代的《三国志》里有哪些细思恐极的细节?🛀🛌
2024-11-27 07:52:28 不推荐
资阳oj:【The K 聊汽车安全(2)】汽车工程是如何进行人体伤害评价的?🤘
186****5633 回复 159****3712:如何给《只狼》的BOSS难度排名?🤙