写在前面

当前,越来越多物种基因组得到测序,甚至同一个物种我们都会得到非常多个基因组,当然也包括各种单倍型基因组云云。有时候我们可能会用这个基因组,有时候又要用那个基因组。总而言之,要是你稍微做一点点比较基因组的工作,然后又不时下地干活,或者你还跑实验室做做实验,甚至说处理一些报账、填表等工作。那么其实很快,如果你跟我一样不是很擅长文件整理归档,就会发现「某某物种的基因组在哪里?是哪个版本?我需要用到他」类似的问题出现。

因此,有时候我心情好,就会建立建立文件夹,以这种方式来管理,但说实话,很不高效。最好是有一个功能,然后我觉得哪个基因组有用,我就给他导入进去,对吧?下次我要用,我就直接去这个地方拿。自然有一些网站可以解决这个问题,但网络连接永远是一个问题。为此呢,咱们就AI辅助编程,实现了一个 TBtools 新功能「Simple Genome Hub」

Simple Genome Hub

一句话,这个功能就是用来做基因组和注释信息数据归档的,当然,也附带取出文件的功能嘛。大体如下

打开功能,上来第一件事,Config可以配置一下你要把你导入的数据文件都放到哪里。而import则用于导入。另外也附带两个Batch处理摁钮,按需操作。

导入数据很简单,点击 Import 

Simple Genome Hub | 长时有效管理你喜欢用基因组版本和数据

基本上就是填入基因组序列路径和基因结构注释路径,填写至少两个必要的信息,比如拉丁学名,当然你要直接填比如apple  banana 等,也不会有人在意。

导入成功后,界面就会显示出来了。每次要哪个文件,就直接回来找到,点选,操作即可。

当然,其中比较常用的估计是「Extract Sequence」。

提取完成可以查看输出目录

我只能说确实非常方便。以后你想存多少基因组就存多少,想存哪个就存哪个。

写在最后

Emmm…当然了,事实上,到底有没有用,见仁见智啊。我也不清楚我还会不会继续用,只是不少时候,我总觉得我找不到某个基因组,或许以后我就可以直接放进去,要用的时候,快速拿出来。

比如我又导入了我们自己最喜欢的 T2T 基因组,连注释都是世界上最好的。