南湖新闻网讯(通讯员 杨植全)近日,我校信息学院杨庆勇教授课题组在国际学术期刊Molecular Plant上发表题为“BnIR: a multi-omics database with various tools for Brassica napus research and breeding”的研究成果。该研究搜集并整合了甘蓝型油菜基因组、转录组、变异组、表观遗传、表型组和代谢组等6种组学数据,并构建出首个综合性的油菜多组学数据库—BnIR,为油菜遗传育种研究提供了重要的数据资源和分析平台(图1)。
图1
油菜作为世界上最重要的油料作物之一,是人类食用植物油和饲用蛋白的主要来源。近年来,越来越多的高通量组学技术被应用于油菜研究,油菜多组学数据大量积累。首先,油菜多组学数据规模的激增,对数据存储、检索和分析提出了更高的需求。其次,不同来源、不同组学、不同平台产生的生物大数据具有显著的异质性,目前尚缺乏相对高效的整合和挖掘方法。因此,油菜领域迫切需要一个类似TAIR的、能够支撑和服务油菜生物学研究的综合性数据库。
为解决这些问题,研究者利用生物信息团队在数据整合和深度分析的经验和优势,以前期发布的BnPIR、BnTIR以及BnVIR数据库为基础,进一步搜集了近年来新发布的多组学数据集,并进行了统一过滤、处理和分析,最终构建出目前最为系统和全面的油菜多组学数据库-BnIR(图2)。在该研究中,研究者共搜集了29个甘蓝型油菜以及近缘物种的基因组、2791个油菜组织样本的转录组、2311个样本的群体遗传变异数据、118个表型、266个代谢物含量以及多种表观基因组学数据(包括DNA甲基化、组蛋白修饰、染色质可及性和染色质交互强度等)组成的公共多组学数据。在BnIR数据库中,研究者不仅整合并升级了BnPIR、BnTIR和BnVIR数据库中的功能,而且基于不同组学数据的特征开发出多个新功能,以方便用户更加有针对性地进行查询和浏览(图3)。此外,基于群体多组学数据,研究者利用全基因组关联分析、表达数量性状位点定位、孟德尔随机化和共定位分析等多种分析策略,对不同组学数据进行了关联与整合。相关数据及结果已上传至数据库的多组学模块,以方便用户进行快速检索、分析和利用。此外,BnIR数据库还集成了18种在线分析工具,包括序列比对(BLAST、MSA)、富集分析(GO、KEGG)、关联分析(GWAS、TWAS、eQTL等)、共定位分析(COLOC)、孟德尔随机化分析(SMR)、遗传相似性分析、ePCR、引物设计等。最后研究者以种子硫苷含量和含油量为例,系统地阐述了BnIR在解析遗传变异位点对基因表达和表型影响方面的应用,展现了BnIR的在挖掘重要变异、探索变异作用机制方面的价值和潜力(图4)。
图2 油菜多组学数据库BnIR的构建流程和功能
图3 油菜多组学数据库BnIR的新特征和新功能
图4 使用BnIR鉴定与种子含油量相关的新基因的应用案例
与其他现有的数据库相比,BnIR是首个综合性的油菜多组学数据库,其不仅容纳了迄今为止最丰富的多种组学数据,还整合和开发了多个组学数据搜索和分析工具,可以帮助研究者快速获取并分析相关信息(图3),为油菜研究者提供了“一站式”的数据检索、获取和挖掘服务。
我校信息学院杨庆勇教授为论文通讯作者,信息学院已毕业博士生杨植全(现广州大学博士后),硕士生王升博为论文并列第一作者。我校油菜团队周永明教授、郭亮教授对本项研究提供了指导。该项研究得到国家自然科学基金(32070559)、国家重点研发计划(2021YFF1000100)、中国博士后基金(2022M710875)和海南省崖州湾种子实验室生物信息学开发平台(JBGS-B21HJ0001)、湖北省洪山实验室(2021HSZD004)等项目的资助。
审核人:杨庆勇
BnIR数据库链接:http://yanglab.hzau.edu.cn/BnIR
BnIR使用示例: http://yanglab.hzau.edu.cn/BnIR/tutorial