最近我们生信技能树组建了一个《单细胞marker基因》微信交流群,超级火爆,借此我整理了一下常见的各种单细胞marker数据库,可以很方便的去查找自己的组织对应的细胞亚群有哪些marker。
CellMarker2.0 数据库
哈医大李霞团队发表,由1.0版本更新到了 CellMarker 2.0。CellMarker 是一个经过全面升级的数据库,通过人工精准收录了人类与小鼠不同组织中经实验验证的各种细胞类型标记物。相较于旧版1.0,本次更新新增了36,300条组织-细胞类型-标记物对应条目、474种组织、1901种细胞类型及4566个标记物。当前版本共涵盖26,915个细胞标记物、2578种细胞类型及656类组织,累计形成83,361条组织-细胞类型-标记物对应关系条目。对应的两个文献:
-
CellMarker: a manually curated resource of cell markers in human and mouse. [PMID: 30289549]
-
CellMarker 2.0: an updated database of manually curated cell markers in human/mouse and web tools based on scRNA-seq data. [PMID: 36300619]
官方网址:
http://117.50.127.228/CellMarker/
除了平时可以查询某个基因在哪些组织哪种细胞类型里面高表达,这个数据库还把所有整理的marker进行了共享,在Download页面可以下载这几个表格,再也不用自己一个个去搜罗了吧:
比如最近的单细胞marker群里面经常问的:脑组织相关marker,筛选一下看看:
ACT 数据库
ACT(细胞类型注释系统)是基于结构标记图谱与细胞类型富集算法开发的工具,旨在高效简化和促进细胞类型注释流程。该系统通过多个便捷易用的功能模块,使用户能够探索并注释目标细胞簇,主要包括:用于细胞类型注释的核心富集工具、富集结果汇总表、层次化富集细胞类型关系图、标准标记基因与差异上调基因的映射关系,以及在人类与小鼠多器官单细胞RNA测序整合数据中标记基因的分布特征及其可视化呈现。
官方网址:
http://xteam./ACT
注释步骤
-
从下拉菜单选择物种(”人”或”小鼠”)(1); -
通过组织层次树勾选多个组织类型(2); -
输入细胞簇的有序差异上调基因列表(3); -
若勾选”GSEA”选项框则需结合GSEA算法进行WISE分析(4)。 -
点击”提交”按钮后,系统将执行分析任务并分配唯一任务ID,用户可通过该ID调取注释结果(5)。 -
页面右侧的简明导览向用户介绍ACT核心功能与特性(6)。
PanglaoDB 数据库
PanglaoDB是一个面向科研社群的数据库,专注于整合小鼠和人类单细胞RNA测序实验数据。通过统一框架对来自多项研究的数据进行收集与整合,并提供以下典型应用场景:
-
运行基因搜索(如SOX2、PECAM1或ACE2) -
浏览完整样本列表 -
探索施万细胞的细胞类型标记物清单 -
查阅小鼠视网膜细胞类型 -
查看CRX基因在光感受器细胞中的表达情况 -
使用”AND”布尔运算符检索同时表达PECAM1与VCAM1的细胞簇 -
运用”AND+NOT”组合定位静息态神经干细胞
官方网址:
https:///index.html
我用的最多的就是这里进行marker筛选:
以及搜索页面放一堆基因进去看看可能是什么细胞类型:基因之间逗号分割,可以数据 细胞亚群cluster高表达基因top30,整理成这种格式,非常方便!
ITGA7,ADAMTS18,GSTA1,LOXL4,SYTL5,CDH4,LIN7A,SEMA3D,TENM2,SERTM1
Cell Taxonomy 数据库
本研究推出细胞分类学数据库(Cell Taxonomy),这是一个经过专业编纂的细胞类型与相关细胞标记物资源库,涵盖多物种、多组织及多生理条件。通过文献挖掘与数据整合,当前版本构建了包含3,143种细胞类型的结构化分类体系,收录了涵盖34个物种、387种组织及257种条件下的26,613个细胞标记物。基于4,299篇文献和约350万个细胞的单细胞转录组图谱,该数据库提供细胞类型与细胞标记物的多维度表征,包括标记物质量评估、细胞簇验证、跨物种比对、组织细胞组成分析以及基于标记物的细胞相似性研究。2023年发表在NAR杂志上,标题为《Cell Taxonomy: a curated repository of cell types with multifaceted characterization》。
这个数据库的参考文献挺有意思的。
官方网址:
https://ngdc./celltaxonomy/
这个数据库有个细胞树,我搞了一个上皮,结果展示如下:
这里也可以扔一堆基因进去进行细胞预测,不过我用的比较少,没有什么评价。此外数据库提供了marker和代码下载:
-
Cell Taxonomy’s curated cell types and markers file:https://download./celltaxonomy/Cell_Taxonomy_resource.txt -
Source code:https://download./celltaxonomy/Code_for_download.zip
上面的表格,我检索了小鼠的脑部的星形胶质细胞:

这个数据库是目前看到的除了支持人和小鼠的其他物种的,涵盖34个物种!
Human Cell Atlas数据库
HCA数据库(https://data./)是一个全面的、高质量的、可访问的人类细胞图谱数据库,支持生物学、医学和生物信息学领域的研究和应用。其涵盖人类所有主要器官和组织类型,包括大脑、心脏、肺、肝、肾、胰腺、肠道、生殖系统等。HCA总共已解析6740万细胞数据,这些数据来自10.3k位捐献者,由951个实验室的506个项目组成。HCA 数据门户网站存储并提供世界各地实验室提供的单细胞数据。任何人都可以贡献数据、查找数据或访问社区工具和应用程序。
如果希望查找图谱类的各种文章和数据,可以来这里,2025年10月份还进行了更新。我看到数据检索部位还可以找有代码和数据的paper,很好!
官网:
https://data./
Mouse Cell Atlas 数据库
来自浙大的郭国骥团队。2018年发表在Cell杂志上,文献标题《Mapping the Mouse Cell Atlas by Microwell-Seq》。运用单细胞RNA测序技术解析了小鼠主要器官的细胞类型构成,并构建了小鼠细胞图谱(MCA)的基础框架。为便于科研人员访问该资源,我们建立了小鼠细胞图谱网站(http://bis./MCA/)。图谱模块:
-
MCA 1.0版本:我们分析了来自10余种小鼠组织的超过40万个单细胞(每组织通常设2-4个重复) -
MCA 1.1全局视图:完整小鼠组织数据集被划分为104个主要细胞簇 -
MCA 2.0(小鼠细胞分化图谱):我们分析了从胚胎早期(E10.5)到成年期共7个生命阶段、10余种小鼠组织的超过52万个单细胞(每组织通常设2-4个重复)。全局视图中,完整数据集被划分为95个主要细胞簇 -
MCA 3.0(小鼠细胞发育与衰老图谱):我们分析了从胚胎早期到成年期共10个生命阶段(E10.5至24月龄)、10余种小鼠组织的约113万个单细胞(每组织通常设2-4个重复)。全局视图中,完整数据集被划分为177个主要细胞簇
官方网址:
https://bis./MCA/
Human Cell Landscape 数据库
同样来自浙大的郭国骥团队,2022年发表在Nature杂志上,文献标题为《Construction of a human cell landscape at single-cell level》。也是个图谱类的网站。
官网:
https://db./HCL/
CELL Landscape 数据库
2022年一月发表在NAR杂志上,来自浙大郭国骥团队,文献标题为《Construction of a cross-species cell landscape at single-cell level》。这个数据库由小鼠、人扩大到了多物种。
本研究通过单细胞RNA测序技术,构建了小鼠、斑马鱼和果蝇在多个生命阶段的 organism-level 细胞图谱。通过整合超过260万个单细胞的综合数据集,我们建立了跨物种细胞图谱,并识别出贯穿整个生命周期的特征标记与共通通路。研究发现结构性炎症和线粒体功能障碍是生物体衰老的最普遍特征,并通过药理学实验证实激活线粒体代谢可缓解小鼠的衰老表型。本研究所构建的跨物种细胞图谱与其他已公开数据集共同存储于”细胞全景”在线平台。该成果为研究谱系发育、机体成熟及衰老进程提供了宝贵资源。
官网:
http://bis./cellatlas/
Cell BLAST 数据库
北大高歌团队发表,2019年发表第一版,更新到了2023年。2020年正式发表在NC杂志上,文献标题《Searching large-scale scRNA-seq databases via unbiased cell embedding with Cell BLAST》。
Cell BLAST是一款用于单细胞转录组学数据的细胞查询工具。该工具能够针对每个查询细胞,在参考数据库中搜索最为相似的细胞。基于细胞间相似性,可将参考细胞中的注释信息(如细胞类型)转移至查询细胞。
官网:
https://cblast./
可以看到很多ref数据:
Invitrogen 免疫细胞指南
赛默飞公司提供了一份在线指南:https://www./cn/zh/home/global/forms/download-immune-cell-guide.html/
里面有很多定义细胞类型的各种细胞表面marker蛋白:我之前用的还挺多的!
植物的marker:PCMDB数据库
植物细胞标记物数据库(PCMDB)收录了六种模式植物(拟南芥、水稻、玉米、大豆、番茄和烟草)的三类细胞标记物,包括:经实验验证的标记基因、基于Bulk RNA-seq数据的差异表达标记基因,以及通过单细胞RNA-seq鉴定的特定细胞差异表达基因。
官网:
https://www./pcmdb/homePage
今天分享到这~