据科技日报报道,23日,华大生命科学研究院与之江实验室联合发布全球首个百亿参数可部署的基因组通用基础模型Genos。该模型支持多达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。
人类基因组由30亿对碱基组成。“人类基因组计划”破译了序列,但序列上碱基的具体功能仍需要精准识别和解析。
现有模型大多基于1—2个参考基因组开展训练,难以体现人类遗传资源的多样性。而Genos整合了人类泛基因组参考联盟、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次将全球范围内636个“端粒到端粒”级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,有助更全面理解人类遗传多样性。
据悉,Genos模型已在HuggingFace、魔搭等平台全面开源开放,提供12亿和100亿参数两个版本,满足不同需求。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
发力清洁能源德国太阳能发电量创纪录
据美国媒体5月29日报道,德国太阳能发电能力27日创纪录。总部位...
打破“旱涝保收”成规银行理财首现“赚钱才收管理费
无论产品盈亏,投资者都要付管理费,这样的银行理财固定收费模式正在...
微软申请在虚拟空间中固定键盘位置专利,可为下一代
,微软公司近日公布了一项名为“Intelligentkeyboa...
菲仕兰在荷兰开设新工厂 提升乳铁蛋白产能
近日,据外媒报道,菲仕兰在荷兰开设了一家生产乳铁蛋白的新工厂来满...
格力电器2022年净利润微增6%,格力钛新能源亏
4月28日晚,格力电器发布2022年报及2023年一季报。202...
在比亚迪汉DM上看大场面才过瘾 购买自主中高端B
汉DM-i冠军版也好,汉DM-p战神版也罢,都将领衔中国品牌完成...