包振民团队发布国际首个软体动物综合基因组数据库

期次:第2108期       查看:62

本报讯 10 月 23 日,中国海洋大学海洋生物遗传学与育种教育部重点实验室包振民院士团队在国际数据库领域顶级期刊 Nucleic Acids Research(《核酸研究》)在线发表了国际首个软体动物综合基因组数据库“MolluscDB: an integrated functional and evolutionary genomics database for the hyper-diverse animal phylum Mollusca”(MolluscDB:系统整合功能和进化组学资源的软体动物超大类群基因组数据库)。

软体动物起源于 5 亿年前早寒武纪,是进化上最成功的无脊椎动物群体之一。软体动物现存种类高达 10 万种以上,是动物界中仅次于节肢动物的第二大门类,对软体动物类群的起源演化研究是学术界长期以来关注的热点。此外许多软体动物也是重要水产经济物种,其占世界水产总产量高达 22%。本研究团队通过广泛收集软体动物基因组学资源,系统梳理整合多组学数据及开发丰富的分析工具,构建了迄今物种覆盖度最广、组学资源最丰富、功能最全面的软体动物基因组学分析平台MolluscDB。

MolluscDB 数据库收集并整合了近 1000份组学数据资源,包括 20 个高质量的参考基因组,538 个转录组和 409 个线粒体基因组。组学数据来自 123 个物种,涵盖了软体动物门全部 7 个纲和 53 个目中的 87%,地理分布覆盖从陆地、淡水、近海到深海,囊括了已公开的绝大部分软体动物组学资源。MolluscDB 提供多达 10 种的基础性组学分析,包括基因组组装信息、系统演化关系、古老化石记录、基因序列及结构、基因功能注释、发育时期 / 成体组织表达谱、基因家族、转录因子和转座子等。通过开发定制的基因组浏览器,实现了复杂基因组信息的便捷可视化。针对软体动物的基因组特征和生物学特性,MolluscDB 还提供了满足特定研究需要的定制数据集和分析工具,包括发育和成体基因共表达网络、软体动物祖先及其分演类群的核心基因集、基因组宏观共线性分析等。MolluscDB 提供了迄今最为系统全面的软体动物基因组数据库平台,该平台将使软体动物研究领域能够应对并充分利用日益增长的海量组学资源,从而加快重要基因资源发掘,推动认知海洋生物独特生命过程的遗传演化规律,也为贝类遗传育种工作提供了有力的支持。

海洋生物遗传学与育种教育部重点实验室、方宗熙 - 萨斯海洋分子生物学研究中心的王师教授为本文的通讯作者,李语丽副教授为共同通讯作者,在读博士生刘福云为本文的第一作者。研究工作获得国家重点研发计划、国家自然科学基金、山东省泰山学者等项目资助。该项工作同时获得了青岛海洋科学与技术试点国家实验室高性能科学计算与系统仿真平台的大力支持。 (王志刚)