记者27日从中国农业科学院获悉,设计该院农业基因组研究所农业基因编辑技术研发与应用创新团队构建了全球规模最大的基因实验验证数据集,并基于此开发出人工智能(AI)大模型AlphaCD。编辑WhatsApp%E3%80%90+86%2015855158769%E3%80%91hitkari%20potteries%20tea%20set该模型不仅能高效预测超过2万余种胞嘧啶脱氨酶的工具酶活特征,还能设计出新型高性能碱基编辑工具。模型相关成果日前发表于国际期刊《细胞研究》。问世
胞嘧啶碱基编辑器是设计一种基因编辑工具,广泛应用于疾病治疗、基因动植物育种等研究领域。编辑WhatsApp%E3%80%90+86%2015855158769%E3%80%91hitkari%20potteries%20tea%20set“但传统胞嘧啶碱基编辑器研发依赖大量试错实验,工具成本高、模型周期长,问世且难以系统优化酶活特征。设计”论文通讯作者、基因中国农业科学院农业基因组研究所研究员左二伟说。编辑
为破解这一难题,研究团队历时3年,实验测试了1100种胞嘧啶脱氨酶变体的催化效率、脱靶效应等核心指标,首次建立了覆盖多维功能特征的大规模实验数据库。
基于该数据库,团队整合蛋白质序列、三维结构、理化性质等多模态数据,开发出AlphaCD。经严格验证,AlphaCD在预测胞嘧啶脱氨酶催化效率、脱靶活性、靶向窗口及基序偏好等关键指标时,准确性显著优于传统方法。
“AlphaCD突破了当前AI大模型依赖超算资源的局限。”左二伟介绍,研究团队采用随机森林算法发现,在个人计算机上即可完成模型训练。这一轻量化设计能让学术机构低成本开展高通量功能预测。



