阅读是最好的习惯

【原】单细胞初探(seurat基础流程)(2021公开课配套笔记)

【原】单细胞初探(seurat基础流程)(2021公开课配套笔记)

新课发布在B站了,马上有热心的粉丝看完后写了配套笔记:

三分钟教你如何快速熟悉电脑,怎样快速准确的熟悉键盘打字以及快捷键的使用

之前的几篇文章说了一下电脑的快捷键,很多朋友回复我很有用处。希望我能多发点关于如何使用电脑的知识,能用一种很简单的方法记住这些使用电脑的技巧。怎么说呢!凡事只要你努力,就没有你办不到的事。下面下边总结了一下如何快速的熟悉电脑,让你分分钟对电脑有一个全新的认识。如何运用一个台式电脑或者笔记本,首先你要知道电脑的组成部件有哪些?光说外表的话,一个电脑无非就是一个显示屏和一个键盘。显示屏你用眼去看就行,但是键盘你一定要了解。因为你的所有意向和操作都是通过电脑的键盘传输出去的,所以说电脑的键盘也是一个电 更多

《微信》如何一次性发送上传多张图片的方法介绍

我们使用微信发送图片给朋友或者上传朋友圈时,会显示最多只能一次发送9张照片。有时这样会显得非常麻烦,会打乱我们上传图片的排列顺序。那么我们该如何一次性上传9张以上的图片呢?下面来看看小编带来的详细方法。微信怎么一次性发送9张以上图片给好友?与好友聊天、或是在微信群里聊天,需要发图片时。点击如下图箭头所指的图标:下方弹出的各个选项中,在第一个选项“相册”;点击“相册”,进入到相册页面:在相册这个页面;看到有手机上储存的所有图片;每张图片右下角都有一个小方框,这个小方框就是勾选图片的;在小方框内点下 更多

自学生信半载有余,跌跌撞撞,不敢和大佬同称萌新,勉强算得上菜鸡。根据课题组进展,马上要接手一个单细胞课题,适逢jimmy老师在B站发布了《单细胞公开课2021》,结合课程以及公众号推文,上手了一下单细胞基础分析流程。

先说一下感悟吧:安装R包最为痛苦😂😂😂,相同代码在不同版本的R包上运行结果可能不同。

以Seruat官方教程和数据为练习,地址:/seurat/articles/pbmc3k_tutorial.html, 那下面我们就开始吧。

首先在官网下载原始数据(方法如下)

下载解压后得到如下3个文件,这3个文件就是分析要用的原始数据。

参考:可视化单细胞亚群的标记基因的5个方法

这里非常感谢健明老师让我学会了使用project管理R代码,非常方便。将解压的文件拷贝到project根目录的data目录下。

这个 pbmc 就是全部单细胞数据分析所需要的,查看变量pbmc 如下:

可见一共有13714个基因,2700个细胞。有了这个构建好的Seurat 对象,也可参考官网代码对数据进行探索(此处不再赘述),后续分析代码相对来说非常标准,如下:

通常使用的QC指标:

每个细胞被检测到的unique genes数量(低质量的细胞或空的液滴含有unique genes较少;细胞双重态或多重态检测到异常高unique genes);

细胞内被检测到的features的总数目(与unique genes高度相关);

线粒体基因占比(低质量/将要死去的细胞经常出现线粒体基因占比过高)。

接下来,根据每个细胞线粒体基因占比、检测到的基因数进行简单的过滤。先计算细胞内线粒体基因占比,类似的核糖体基因(大多为RP开头)也可以这样计算,但是注意线粒体基因的MT-,其中-不能少,不然容易把别的基因也计算在内。

可见过滤掉了62个细胞,继续后续分析

各种组学的原始数据普遍存在数据量不统一,数据变化范围过大,数据变化幅度不统一等问题。各种测序数据的分析流程都要对原始数据进行“标准化”,以符合下游分析的需求,单细胞数据也不例外。

高变基因:在一些细胞中表达高,另一些细胞中表达低的基因。单细胞表达矩阵为稀疏矩阵(很多0,且为了压缩文件大小,0用.表示),选高变基因可以找到包含信息最多的基因

数据归一化是将每个基因在所有细胞中的均值变为0,方差标为1,即零-均值归一化(z-score归一化)。是组学数据常用的一种降维前处理方法。

PCA降维,默认使用前面2000个高变基因的scale矩阵用于降维。Run开头的函数降维,Find开头的函数聚类。resolution参数表达聚类的分辨率,值越大得到的cluster越多,对于3K细胞的单细胞数据0.4-1.2 通常会得到较好的结果。

上述结果可见,分为10类,由0-9,细胞数依次递减。

降维可以将相似的细胞放置在低维度的空间

在umap图中,cluster之间的距离更明显,图形也更美观。

根据生物学背景知识,将表达相应Marker基因的各个单细胞亚群的重命名,官网给出的marker基因和细胞对应关系如下所示,本人该部分生物学知识较浅,暂不深究,待后续深入了解。

可视化展示marker基因的坐标映射分布

上图结合UMAP可视化中的聚类对聚类重命名,会得到如下所示的分群情况。

这个时候有5个可视化方法选择,分别是:小提琴图,坐标映射图,峰峦图,气泡图,热图。代码参见可视化单细胞亚群的标记基因的5个方法

我个人比较喜欢这个气泡图,看的很清楚,也可以根据气泡图来重命名聚类名。

至此,单细胞基础流程分析就结束了。接下来根据健明老师解答的问题,来加深一下理解。特别是seurat对象的结构,在R语言中同一变量重复赋值,则会覆盖,而创建的Seruat对象pbmc则不会。查阅资料才知道Seruat对象是S4结构,会记录所执行的计算及其信息。在此献上周运来老师总结的一幅Seruat对象结构图。

与十万人一起学生信,你值得拥有下面的学习班:

三分钟教你如何快速熟悉电脑,怎样快速准确的熟悉键盘打字以及快捷键的使用

之前的几篇文章说了一下电脑的快捷键,很多朋友回复我很有用处。希望我能多发点关于如何使用电脑的知识,能用一种很简单的方法记住这些使用电脑的技巧。怎么说呢!凡事只要你努力,就没有你办不到的事。下面下边总结了一下如何快速的熟悉电脑,让你分分钟对电脑有一个全新的认识。如何运用一个台式电脑或者笔记本,首先你要知道电脑的组成部件有哪些?光说外表的话,一个电脑无非就是一个显示屏和一个键盘。显示屏你用眼去看就行,但是键盘你一定要了解。因为你的所有意向和操作都是通过电脑的键盘传输出去的,所以说电脑的键盘也是一个电 更多

《微信》如何一次性发送上传多张图片的方法介绍

我们使用微信发送图片给朋友或者上传朋友圈时,会显示最多只能一次发送9张照片。有时这样会显得非常麻烦,会打乱我们上传图片的排列顺序。那么我们该如何一次性上传9张以上的图片呢?下面来看看小编带来的详细方法。微信怎么一次性发送9张以上图片给好友?与好友聊天、或是在微信群里聊天,需要发图片时。点击如下图箭头所指的图标:下方弹出的各个选项中,在第一个选项“相册”;点击“相册”,进入到相册页面:在相册这个页面;看到有手机上储存的所有图片;每张图片右下角都有一个小方框,这个小方框就是勾选图片的;在小方框内点下 更多

赞(0) 打赏
未经允许不得转载:微精选 » 【原】单细胞初探(seurat基础流程)(2021公开课配套笔记)
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏