打开kegg pathway
通路网址http://www.kegg.jp/kegg/pathway.html,寻找⾃⼰感兴趣的通路,找到⼤类中的某些通路后,然后在我们的KEGG富集结果中搜索通路编号。(例:map04213通路是Longevity
regulating pathway),点开相应⽐较对的⽹⻚版展⽰结果,点击相应通路详细查看。
⾸先unique peptide在不同情况下有两种不同的含义:⼀种情况指⽤于定性的unique peptide,第⼆种情况则是指⽤于定量的unique peptide。
定性的unique peptide的数量≥定量的unique peptide数量。
简单来说,肯定是检测到的蛋⽩质的(定性)unique peptide越多,蛋⽩质可信度越⾼。早些年的发表⽂章⼀般会认为unique peptide≥2的数据是可信的蛋⽩质定性数据。但是随着现在质谱仪精度和分辨率的提⾼,对应⾼精度质谱仪(如Q-Exactive,AB5600等等)产⽣的数据,像MCP或者JPR这类蛋⽩质组学领域最好的杂志,也明确表⽰认可unique peptide=1且对应图谱质量较⾼的数据,只是根据杂志的不同要求需要提交不同格式的图谱数据。如MCP要求最⾼,需要提交质谱原始⽂件,查库结果⽂件,而且需要通过专⻔的软件提交(如Pride,ProteomeXchange);JPR要求相对MCP低些,⼀般提供⽂章或附件列表中出现的所有鉴定差异蛋⽩质的unique peptide=1的肽段图谱即可。
另⼀⽅⾯,对于定量unique peptide的数量,⽂章⼀般都没有要求。可以理解的是,对于只有⼀段肽定量⼀个蛋⽩质的情况,蛋⽩质定量结果的准确性和可靠性会相对较低。通常情况下,通过设置⽣物学或者技术重复实验,根据蛋⽩质定量数据的平均值和统计学p value值可以获得准确度和可信度较⾼的蛋⽩质定量结果。纯粹的⼀次质谱⾏为则不能反映其定量准确性。
UniPort数据库是动态更新的,其中存在的⼀些重复、冗余、有误的数据会被不断地纠正和删除。标注为Obsolete的蛋白质,⼀般是通过测序结果直接翻译⽽来,先存放在TrEMBL里,注释信息不全,甚⾄这个蛋⽩是否存在也不确定。经过人工校验和注解后,⼀部分不存在的蛋⽩质会被删除,状态显⽰为Obsolete(如F1MYU3这个蛋⽩ 已经从数据库中删除了),⼀部分经过注释后会被移到SwisspProt,或者这个蛋⽩质已经在数据库中存在了,就和已存在的合并,显⽰为Replaced。这些蛋⽩质可以通过对应⽹⻚中的“history…”追踪到数据库中该蛋⽩质信息的更新过程。
这种情况是可能存在的,许多断裂基因在其转录本剪接中,通过不同的剪接⽅式从⼀个基因产⽣多种不同的多肽或蛋⽩质。生物体通过这种选择性剪接(alternative splicing)来调控基因的表达,产⽣不同的蛋⽩质以适应不同的环境需要。例如:⼈类2万个基因,编码20万个蛋⽩ 。
不同数据库有不同的命名方式及特征,现在较常用的UniProt数据库(www.uniprot.org)的命名格式如下:
tr|W6NF68|W6NF68_HAECO DNA RNA he licase domain containing protein OS=Haemonchus contortus GN=HCO I _01691200 PE=4 SV=1,代表的意义为tr=TrEMBL(UniProtKB中包含两类数据库:Swiss-Prot,which is manually annotated and reviewed;TrEMBL,which is automatically annotated and is not reviewed.),W6NF68为蛋⽩质登录号,HAECO DNA RNA helicase domain containing protein 为蛋⽩质名称及其描述 ,OS= Organism Name(物种名称),GN=Gene Name(基因名称),PE=Protein Existence ,SV=Sequence Version。 In UniProtKB there are 5 types of evidence for the existence of a protein:
1. Experimental evidence at protein level
2. Experimental evidence at transcript level
3. Protein inferred from homology
4. Protein predicted
5. Protein uncertain
我们在蛋⽩数据库鉴定蛋⽩以及GO、COG、KEGG等注释蛋⽩都是根据其蛋⽩序列⽐对的结果。要查 看其他信息,打开Uniprot⽹站,输⼊该蛋⽩ID,即可看到该蛋⽩的名称,特性,涉及通路等信息。其他数据库的可以NR注释。
质谱定量与western定量原理本⾝不同,所以最终鉴定结果有差异是属于正常现象;另外对于丰度较低的蛋白,质谱鉴定的灵敏度会降低,容易出现偏差;另外TMT产品属于标记定量,对不同样本间蛋⽩的差异会有⼀定压缩,所以差异不⼤的两个样本,如果采⽤TMT可能就会表现出⼏乎⽆差异;这也是为何发⽂章时为了增加数据的可靠性,都会增加实验验证的原因。