日前,东南大学涂景教授团队聚焦单细胞技术与基因组测序技术,发布国际首个人类单细胞基因组数据库“HSCGD”,成果以“HSCGD: a comprehensive database of single-cell whole-genome data and metadata”为题在国际著名学术期刊《核酸研究》(Nucleic Acids Research)上发表。
单细胞全基因组测序技术有别于传统的批量测序技术,是研究单细胞异质性的有力工具。近年来,大量单细胞基因组测序数据的产生大大提高了人们对细胞发育和肿瘤进展的理解。这种数据的迅速积累,使得我们迫切需要一个全面的资源平台来有效地管理和利用这些信息。
基于这种需求,涂景教授团队开发了HSCGD(Human Single Cell Genomic Database),它是第一个致力于单细胞全基因组数据的,具有收集、整合、分析和可视化功能的综合性数据库。HSCGD通过自动化脚本,收集全世界不同单细胞全基因组扩增方法产生的测序数据,并应用标准化的生物信息学流程,系统地挖掘细胞变异。它提供了包括出版物、细胞类型、癌症概况等与单细胞全基因组测序数据相关的丰富信息。此外,HSCGD提供了单细胞拷贝数变异(CNV)和单核苷酸变异(SNV)分析结果与可视化数据,线上工具可以定量分析并比较单细胞数据集的扩增效果。
目前,数据库收录已收录来自63个单细胞数据集的74,154个人类细胞元数据,这些数据涉及23种细胞类型和17种主要单细胞全基因组扩增方法。数据库提供浏览、搜索、可视化、下载和在线工具等各种功能,帮助研究人员探索和利用单细胞水平的基因组数据,研究人员可以通过域名http://www.hscgd.com访问该数据库网站。
5822yh银河国际、数字医学工程全国重点实验室博士研究生傅继业、硕士毕业生何诗扬、杨奕璇为文章的共同第一作者,涂景教授为文章通讯作者。
该项目受到国家自然科学基金、江苏省重点研发项目资金和中央高校基本科研业务费专项资金资助。
文章链接:https://doi.org/10.1093/nar/gkae971