首页>检索页>当前

上海交通大学发布蛋白质设计模型“Venus”

发布时间:2025-03-24 作者:任朝霞 符云霞 江倩倩 来源:中国教育新闻网

中国教育报-中国教育新闻网讯(记者 任朝霞 通讯员 符云霞 江倩倩)3月22日,上海交通大学洪亮教授团队发布最新研究成果,建立了全球最大的蛋白质序列数据集,并将AI与蛋白质设计改造相结合,基于该数据集训练了Venus(启明星)系列模型,可以精准高效地预测、设计蛋白质的功能。配合Venus系列模型,团队还研制了全球首款低通量大体积蛋白质表达、纯化与功能检测自动化一体机,把蛋白质设计从“复杂科学”变为“简单工程”。目前,已有多款产品进入规模化生产,能够助力阿尔兹海默症等疾病的诊断。

蛋白质是由氨基酸序列构成的,氨基酸序列的长度从数百个到上千个不等。据介绍,团队建立的蛋白质序列数据集包含36.2亿条陆地微生物蛋白质序列、26.4亿条海洋微生物蛋白质序列、24.3亿条抗体蛋白质序列、0.6亿条病毒蛋白质序列,覆盖从常规地表生物到极端环境微生物的蛋白质序列信息,配备了数亿功能标签,是全球数据规模最大、功能批注标签最多的数据集。

“我们训练了Venus(启明星)系列模型,这个模型学习自然界蛋白质序列的组织规则以及它与功能之间的关系,其预测蛋白质突变功能的精度位居行业榜单之首。”洪亮表示,Venus系列模型具备两大核心功能:“AI定向进化”与“AI挖酶”。“AI定向进化”是指Venus系列模型可以对一个不尽如人意的蛋白质产品的多种性能进行优化。“AI挖酶”则是指Venus系列模型基于其海量的未知功能蛋白质数据集“海选”超能力战士,去精准发掘满足苛刻应用需求的具备超常规功能的蛋白质。这些超常规功能的蛋白质在生物技术、医药研发和工业生产中具有巨大的应用潜力。

配合Venus系列模型,团队研发了自动化一体机,可在24小时内不间断地完成100余个蛋白质的表达、纯化与检测任务,较人力效率提高近10倍。目前,Venus系列模型设计的多款蛋白质已经实现了产业化落地。在金赛药业单域抗体耐碱性改造项目中,借助模型,不到1年就让普通单域抗体耐碱性提升4倍,每年节约上千万元成本。在某体外诊断公司碱性磷酸酶(ALP)改造项目中,模型使ALP分子活性超国际头部公司产品3倍,为心梗、阿尔兹海默症等超敏检测诊断带来新突破。

0 0 0 0
分享到:

相关阅读

最新发布
热门标签
点击排行
热点推荐

工信部备案号:京ICP备05071141号

互联网新闻信息服务许可证 10120170024

中国教育报刊社主办 中国教育新闻网版权所有,未经书面授权禁止下载使用

Copyright@2000-2022 www.jyb.cn All Rights Reserved.

京公网安备 11010802025840号