首页 > AI资讯 > 最新资讯 > 新人工智能模型可精确预测人体细胞基因表达

新人工智能模型可精确预测人体细胞基因表达

新华社    2025-01-13

  新华社纽约1月11日电美国研究人员开发出一个新的人工智能模型,经过大量数据的训练后,该模型能精确预测各种人体细胞内部的基因表达情况,将为生物和医学研究带来便利。

  这个名为“通用表达转换器”(GET)的模型由美国哥伦比亚大学和卡内基-梅隆大学等机构研究人员联合开发,其准确性和有效性已得到实验验证,论文发表在新一期英国《自然》杂志上。

  在基因表达过程中,以DNA形式储存的基因“蓝图”转录成为RNA形式的“抄本”,后者指导合成出蛋白质,执行具体的生理功能。参与转录调控的生物分子种类繁多,相互作用极为复杂,此前相关预测模型局限于几种特定的细胞,尤其是癌细胞,缺乏适用于人体多种细胞类型的通用工具。

  研究人员根据转录调控机制的特点设计出机器学习模型,然后用来自1.3万个人体细胞的基因测序和表达数据对其进行训练。这些细胞涵盖213种人类胚胎细胞和成体细胞,都来自没有病变的正常人体组织。

  就像ChatGPT等人工智能工具能根据大量语料总结出通用语法规则,GET模型也能从训练数据中总结出关于转录调控的“语法”,在此基础上能对其没有接触过的细胞类型进行基因表达预测。

  该模型可用于揭示致病基因的作用机制,指导癌症和遗传疾病研究。例如某种儿童白血病的患者携带一个功能不明的变异基因,GET模型预测该基因会扰乱细胞中两种转录因子的相互作用,实验数据证实了这一结论。

  研究人员说,该模型还可用于探寻基因组中“暗物质”的作用。蛋白质编码基因序列只占人类基因组的一小部分,占比达98%的非编码区域就像宇宙中的暗物质一样,其属性和功能目前难以捉摸。

(文章来源:新华社)

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。