肽段⻓度分布:肽段过⻓或过短都⽆法在质谱仪中被检测到,肽段⻓度主要分布在7-25之间的数据属于正常状态;
母离子质量容差分布:肽段⺟离⼦的实测分⼦量和理论分⼦量的质量偏差分布在0附近,⼤部分小于10ppm,说明数据正常;
重复性CV分析:曲线上升越快说明样本整体的重复性越好;⼀般标记定量:CV=20%时累计蛋⽩含量达到80%以上为正常状态,⾮标定量CV=20%时累计蛋⽩含量达到60%以上为正常状态。
同⼀个group的所有蛋⽩含有相同的肽段(鉴定到的肽段),选择这些蛋白中总序列⻓度最⻓的蛋⽩作为这个group的代表,称为master protein,而每⼀个group独有的肽段,则称为Unique肽段,“独有肽段”是指该group相对于其他的group 来说所特有的肽段;
FDR指蛋⽩容错率。数据库检索的时候⼀般都会⽤正库(老师提供的数据库)和反库(数据库序列完全颠倒)分别对数据进⾏检索,然后对鉴定到的蛋⽩进⾏打分(数据库⽐对的正确率),根据分值⾼低进⾏排序。当反库鉴定到的蛋⽩数量超过5%的时候,剩余分值靠下的蛋⽩全部删除。以保证我们鉴定到的蛋⽩可信度保持的95%,且分值较⾼。
不能。蛋⽩是经过打断成为6-25个氨基酸左右的肽段上质谱的,根据所提供数据库中理论打断的肽段进⾏⽐对得到的肽段序列,然后根据肽段序列对蛋⽩进⾏预测和定量。对于没有比对上蛋⽩的这些打断的肽段,软件⾃动就会进⾏过滤,在搜库结果中不会有任何呈现。可以参看结果⽂件中的PSM⽂件,这些肽段都是可以比对的上数据库的可信肽段。至于比不上蛋⽩的那部分肽段,也有可能是质谱的精度不够导致系统判定不可信,实验中我们会尽量避免这部分肽段的比例,所以这部分也不具单独分析的价值。
Label free采⽤⼀级谱图进⾏定量,二级谱图进⾏定性;iTRAQ/TMT:采⽤⼆级谱图定量和定性;DIA:⼆级谱图定量和定性;
可能的原因如下:A、只检测到了⽤于定性的肽段,⽽没有检测到可⽤于定量的唯⼀肽段,所以⽆定量数据。这种蛋⽩质在附表⼀中显示的unique peptide=0。
B、肽段被标记上而且被检测到了,但是由于信号值太低,导致信号强度积分数据赋值为零。
结题报告中质控报告部分的蛋⽩覆盖度分布图中的覆盖度是指某⼀蛋⽩鉴定到的所有unique肽段的⻓度之和占该蛋⽩全⻓的⽐例,⽽unique肽段是指可以表征某⼀蛋⽩的特有的肽段,所以决定蛋白覆盖 度⼤⼩的因素有两个:蛋白鉴定到的unique肽段⻓度之和、蛋⽩的全⻓;有些蛋⽩全⻓较短,当该蛋白的所有unique肽段都鉴定到了,其覆盖度就会很⾼,也就说明该蛋⽩的可信度很⾼;⽽有些蛋⽩的全⻓很⻓,那么即便该蛋白的所有unique肽段都鉴定到了,其覆盖度依然会较低,所以并不能说这个蛋⽩的可信度很低,举例说明:蛋⽩A和蛋白B都有10个unique肽段,每个unique肽段⻓度均为10aa(10个氨基酸),蛋⽩A总⻓度是200aa,蛋⽩B总⻓度是1000aa,那么蛋⽩A和蛋⽩B都是可信度⾮常⾼的蛋白,只是蛋⽩A的覆盖度=10*10aa/200aa=50% ,蛋白B的覆盖度=10*10aa/1000aa=10%,所以蛋⽩覆盖度只是⼀个参考因素,而不是绝对依据。