阅读是最好的习惯

【原】生信编程3.hg38每条染色体的基因、转录本分布

【原】生信编程3.hg38每条染色体的基因、转录本分布

 有一些五六年前的学生们都成长为了各个生物信息学相关公司的小领导,而且他们都有了自己的公众号,知乎号,也算是一番人物。最近他们跟我反馈面试找不到或者说很难直接考核筛选到认真干活的生信工程师,挺有意思的。让我想起来了早在生信技能树论坛创立之初我为了引流,而规划的200个生信工程师面试题。值得继续分享,上一期是:生信编程系列(1-2)

这10个批量处理的PPT技巧,让你的效率提升100倍!

职场中要学的PPT技能,不一定是为了漂亮、炫酷,更是为了高效、省时。在职场中脱颖而出的秘密或许并没有那么麻烦,对同样一件事,别人用一小时完成,你用一分钟能完成,你就是超级人才。今天,就为各位总结了PPT中的10大批量处理的技巧,提升你的制作效率!文本批量快速排版:文本转SmartArt众所周知SmartArt是PPT中一个比较高效的工具,但这个工具归在「插入」中,在以往的做法中,很多人一般都是先插入一个SmartArt图形,然后在里面敲字。有时候也可能已经有了一段文本,大部分人也是先点击插入一个 更多

会议专用,做ppt最常用的20个技巧,快收藏

办公室那些事儿复制幻灯片,将幻灯片发到word幻灯片自动播放、自动缩略图效果快速改变图片颜色,添加logo保存特殊字体,图片随时更新快速调用其它ppt,定位幻灯片制作滚动文本,利用笔画来做标记将图片文件用作项目符号快速选择多个对象灵活设置背景

##gtf文件的简单介绍

然后我们对gtf文件进行探索 ##首先是获得每条染色体含有的基因数量统计

第一种方法:使用perl进行统计

==解释== $F[2]取文件的第三列,如果第三列的字符为“gene”的话,就输出该行,然后用cut以tab键作为分隔符进行分隔,取分隔后的第一个字符,也就是染色体号。最后对染色体出现的次数进行统计,就可以得到结果

第二种方法:使用awk进行统计

得到的结果是一致的

==解释== 这里比较重要的就是用到perl的正则表达/gene_type “(.*?)”;/,括号里的是需要返回的内容

##使用python进行处理 首先对GTF的关键信息进行结构化

探究的内容:

将整个过程分为4步

chr_gene函数以记录了基因信息的字典作为输入,然后统计每条染色体上包含的基因数量。

gene_len函数以list_gene这个字典作为输入,统计每个基因的长度

gene_transcript函数以list_transcript作为输入,统计每个基因上的转录本的数量

transcript_exon 以list_exon作为输入,统计每个转录本上的外显子数量

exon_pos 以list_exon作为输入,统计转录本中每个外显子的位置信息

这10个批量处理的PPT技巧,让你的效率提升100倍!

职场中要学的PPT技能,不一定是为了漂亮、炫酷,更是为了高效、省时。在职场中脱颖而出的秘密或许并没有那么麻烦,对同样一件事,别人用一小时完成,你用一分钟能完成,你就是超级人才。今天,就为各位总结了PPT中的10大批量处理的技巧,提升你的制作效率!文本批量快速排版:文本转SmartArt众所周知SmartArt是PPT中一个比较高效的工具,但这个工具归在「插入」中,在以往的做法中,很多人一般都是先插入一个SmartArt图形,然后在里面敲字。有时候也可能已经有了一段文本,大部分人也是先点击插入一个 更多

会议专用,做ppt最常用的20个技巧,快收藏

办公室那些事儿复制幻灯片,将幻灯片发到word幻灯片自动播放、自动缩略图效果快速改变图片颜色,添加logo保存特殊字体,图片随时更新快速调用其它ppt,定位幻灯片制作滚动文本,利用笔画来做标记将图片文件用作项目符号快速选择多个对象灵活设置背景

赞(0) 打赏
未经允许不得转载:微精选 » 【原】生信编程3.hg38每条染色体的基因、转录本分布
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏