阅读是最好的习惯

【原】蛋白质数据库及其结构预测攻略

【原】蛋白质数据库及其结构预测攻略

一、蛋白质结构层次

云南双柏旅游攻略(双柏在云南哪里)

1. 双柏在云南哪里元双公路是国家一级公路元谋至双柏公路是云南省公路“9210”网规划中的一条重要通道,也是楚雄州“三纵四横”路网规划中最为重要的一纵。路线呈北南向布局,纵向连接永武、安楚高速公路和昆曼国际大通道,是云南省“9210”路网昆明市外环公路主要路段,也是滇中南地区北上四川,南下玉溪、思茅、景洪最为便捷的通陆路通道之一。2. 双柏县哪里有在云南产区,茯苓种植规模比较大的几个县市几乎都是林业大县,如景谷县、双柏县、云龙县、景东县、永平县等等。这些林业大县既有丰富的松树资源,同时又是以松木 更多

万寿谷旅游(万寿景区旅游攻略)

1. 万寿景区旅游攻略2004年,南宁青秀山风景区的观音禅寺扩建工程开始动工。在原禅院的旧址上改建,扩建后更名为“万寿观音寺”,占地面积约15亩,是原有面积的三倍。寺院内有大雄宝殿、药师殿、观音阁、卧佛殿、法物流通处、素菜馆等布置,整体仿唐宋建筑风格。时经4年,大雄宝殿终于落成。寺院方面决定在春节的大年初一至十五,大雄宝殿开放半个月,供信众与游客祈福参拜。2. 万寿景区旅游攻略图重庆主城开车先到重庆市长寿区长寿湖游玩,再到万寿天梯吃长寿米粉,湖鱼面。到重庆市丰都县游玩鬼国神宫,南天湖游玩。到重庆 更多

一般情况下,蛋白质的结构分为4 个层次:

初级结构——氨基酸序列;

二级结构——а螺旋(alpha-helix),β折叠(β-sheets),β转角,无规则卷曲(random coil)

三级结构——三维结构,由模体(motif)和结构域(domain)组成;

四级结构——亚基之间的互作。

二、蛋白质数据库:

包含三大蛋白质序列数据库,Swiss-Prot,TrEMBL 和PIR,分为三个层次:第一层叫UniParc,收录了所有UniProt 数据库子库中的蛋白质序列,量大,粗糙。

第二层是UniRef,他归纳了UniProt 几个主要数据库并且是将重复序列去除后的数据库。

第三层是UniProtKB,他有详细注释并与其他数据库有链接,分为Swiss-Prot(最有用的)和TrEMBL。

PDB存储生物大分子3D 结构。这些生物大分子除了蛋白质以外还包括核酸以及核酸和蛋白质的复合物。只有通过实验方法获得的3D 结构才会被收入其中。PDB文件是一堆数字字母,那是每个原子的坐标,一般用用可视化软件VMD打开,免费的,这里不作具体说明。

Pfam 主页上的搜索工具可以查找某条序列上有哪些结构域。

CATH是四种结构分类层次的首字母。根据PDB编号搜索,可以获得各层次具体的结构分类信息以及各种结构相关分析信息、聚类分析。

在搜集、整理、分析PDB数据中已知的蛋白质三维结构的基础上,详细描述了一直结构的蛋白质在结构、进化事件与功能类型三个方面的关系,主要依赖人工验证。

三、蛋白质结构研究

PDB-输入检索号-sequence- view sequence& DSSP image

预测网址如下:输入氨基酸序列,等待大概半小时。PSIPRED /psipredJpred3  /www-jpred/PREDICTPROTEIN  /SSpro  /PSSpred  /PSSpred/PREDATOR  /cgi-bin/portal.py?#forms::predatorGOR V  /

实验方法,又贵又难做,还是预测比较好啊。

原理:相似的氨基酸序列对应着相似的蛋白质结构要求:找到与目标序列一致度≥30%已知结构作为模板操作:输入氨基酸序列-start modeling评估:GMQE    :可信度范围为 0-1,值越大表明质量越好QMEAN4:区间-4-0,越接近0,评估待测蛋白与模板蛋白的匹配度越好

Moddler中的 easymoddeler 4.0,教程参考https://wenku.baidu.com/view/2d00e4220b1c59eef8c7b46b.html

原理:不相似的氨基酸序列也可以对应着相似的蛋白质结构。补充说明:已知的蛋白质结构有十几万个,但其所具有的不同的结构拓扑只有1393个,也就是说,所有结构都落在这1393个拓扑内!因此,选择匹配能量最低的拓扑。要求:没要求,比较任性。一般是不能同源建模(一致度<30%)的蛋白选用这个方法。操作:用学术邮箱注册,提交序列,等待35h。结果页面:(1)预测的二级结构(2)预测的残基可溶性(高度暴露的表面残基:9,深埋的内部残基0)(3)建模使用的模版及多序列比对。不是序列相似性比对,而是用穿线法穿出来(4)预测蛋白质功能,以及有可能与之结合的配体和该配体的结合位点评估:模型质量评估模型质量评估系数C-score:[-5,2],分值越高,可信度越高。TM-score:两两结构相似度系数,>0.5说明模型具有正确的结构拓扑,可信,

原理:1973年《science》Anfinsen:蛋白质的三维结构决定于自身的氨基酸序列,并且处于最低自由能状态。模拟肽段在三维空间中所有可能的姿态,并计算出自由能最低的一个。计算量极大,不常用。

四、模型优化

Chiorn服务器提供Clash处理优化,一般来说优化过后的评分更高,对比一下,如果分降低了,就当什么都没发生,别优化了。

五、三级结构模型质量评估

模型预测出来后需要有3个评估软件认为合格才能用,下载PDB文件,提交到测评软件。saves(一次性提供6个软件评估结果)我一般把warning忽略掉,这不知道对不对,没有一个准确的说法。

1.verify 3D超过80%的残基拥有大于0.2的3D/1D值,则模型质量合格,低于0.2的部分需要进一步修正。

2.procheck主要看拉氏图检查Cα的两面角是否合理,合格的模型超过90%的残基都应该落在红色(允许区域)和正黄色(额外允许区域)落到其他区域的残基应当被查看并修正。以PDB中高分辨率的晶体结构参数为参考,给出提交模型的一系列立体化学参数(主链)。其输出结果包括:拉氏图,主链的键长与键角,二级结构图,平面侧链与水平面之间的背离程度等。3.whatcheck提交的蛋白结构与正常结构之间的差异,指标贼多,绿色多就当通过了。4.errat计算0.35nm范围之内,不同的原子类型对之间形成的非键相互作用的数目(侧链)。得分>85较好,晶体可达到95,一般来说结果在91以内,很容易过。

5.prove与预先计算好的一系列标准体积的差别,用z-score来表示,显示模版蛋白质与待测蛋白之间的匹配程度,越高越好。

云南双柏旅游攻略(双柏在云南哪里)

1. 双柏在云南哪里元双公路是国家一级公路元谋至双柏公路是云南省公路“9210”网规划中的一条重要通道,也是楚雄州“三纵四横”路网规划中最为重要的一纵。路线呈北南向布局,纵向连接永武、安楚高速公路和昆曼国际大通道,是云南省“9210”路网昆明市外环公路主要路段,也是滇中南地区北上四川,南下玉溪、思茅、景洪最为便捷的通陆路通道之一。2. 双柏县哪里有在云南产区,茯苓种植规模比较大的几个县市几乎都是林业大县,如景谷县、双柏县、云龙县、景东县、永平县等等。这些林业大县既有丰富的松树资源,同时又是以松木 更多

万寿谷旅游(万寿景区旅游攻略)

1. 万寿景区旅游攻略2004年,南宁青秀山风景区的观音禅寺扩建工程开始动工。在原禅院的旧址上改建,扩建后更名为“万寿观音寺”,占地面积约15亩,是原有面积的三倍。寺院内有大雄宝殿、药师殿、观音阁、卧佛殿、法物流通处、素菜馆等布置,整体仿唐宋建筑风格。时经4年,大雄宝殿终于落成。寺院方面决定在春节的大年初一至十五,大雄宝殿开放半个月,供信众与游客祈福参拜。2. 万寿景区旅游攻略图重庆主城开车先到重庆市长寿区长寿湖游玩,再到万寿天梯吃长寿米粉,湖鱼面。到重庆市丰都县游玩鬼国神宫,南天湖游玩。到重庆 更多

赞(0) 打赏
未经允许不得转载:微精选 » 【原】蛋白质数据库及其结构预测攻略
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏