关于生物信息学相关毕业论文格式范文 和小麦醇溶蛋白序列的分子生物信息学分析方面硕士论文范文

这是一篇与生物信息学论文范文相关的免费优秀学术论文范文资料,为你的论文写作提供参考。

小麦醇溶蛋白序列的分子生物信息学分析

摘 要:从NCBI 蛋白数据库中选取10 条有代表性的小麦醇溶蛋白序列,利用Protparam 分析理化性质、用Clustalw 软件在线构建多序列对比和系统进化树、用MEME program3 软件在线分析醇溶蛋白的类型和排列顺序、用PSIPRED version 3.3 软件在线预测醇溶蛋白的二级结构、域结构和折叠域识别.结果表明:醇溶蛋白的平均疏水指数均为负值,为亲水性蛋白质;醇溶蛋白的不稳定系数均大于40,属于不稳定蛋白质;多序列比对发现醇溶蛋白均含有P(Pro)和Q(Gln),且重复出现率较高;对10 条醇溶蛋白序列系统进化树构建可以看出α/β- 和ω- 醇溶蛋白的同源性较近,与γ- 醇溶蛋白同源性较远;醇溶蛋白均含有基序Motif 1、Motif2、Motif 3 和Motif 4,这些域结构可能在维持醇溶蛋白结构和功能方面有重要作用;醇溶蛋白的二级结构由α- 螺旋、β- 折叠和无规则卷曲等结构组成,α/β- 和γ- 醇溶蛋白中α- 螺旋且含量较多,且结构有序,而ω- 醇溶蛋白中α- 螺旋含量较少,而结构混乱无序.

关键词:小麦;醇溶蛋白;生物信息学;理化性质;结构特征

小麦是中国第二大口粮作物,为北方人民的生活主食,随着人们生活水平的提高,人们不仅重视其产量,也开始更加重视其内在品质[1-2].小麦醇溶蛋白是面筋的主要组成成分之一,醇溶蛋白的相对分子质量小,溶于乙醇溶液,能赋予面筋延展性,醇溶蛋白与麦谷蛋白相互作用会形成网状结构,使面筋具有弹性等[3];醇溶蛋白也是影响面包烘烤[4-5] 及馒头品质[6] 的重要成分,醇溶蛋白的含量与质量决定着面筋的延展性及品质[7].醇溶蛋白含量高的面粉适合做蛋糕和饼干等食品;醇溶蛋白可分为α、β、γ 和ω4 类,或者按照韦恩分类方法分为8 类[7];醇溶蛋白的基因位于小麦的第1、6 号染色体上,由于染色体会出现易位的现象,所以基因也会随着染色体的移动而移动,从而出现醇溶蛋白的遗传多样性[8-9].

生物信息学是随着基因组学和蛋白质组学的不断发展而产生的交叉性的新兴学科[10],依赖计算机软件和硬件的发展[11-12],应用数学的相关思维,在“序列决定结构,结构决定功能”这一重要理论的指导下[13],生物信息学研究内容主要是基因组学和蛋白质组学的数据分析,通过对已知的生物学实验数据的一系列分析,解释目标数据所具有的生物学意义.

本文利用Protparam、Clustalw、MEME program3、PSIPRED version 3.3 等软件工具对小麦醇溶蛋白的理化性质及结构等进行预测分析,可得到目标蛋白的分子质量、理论等电点、总平均亲水性、不稳定系数和脂肪系数等基本理化数据,为蛋白质的深入研究提供了一点借鉴.

1 材料与方法

1.1 小麦醇溶蛋白序列的获取

从NCBI Protein 数据库将小麦醇溶蛋白序列的氨基酸数目在300 AA 左右、且不同源的序列挑选出来,从中随机选择α/β- 醇溶蛋白3 条序列、γ- 醇溶蛋白3 条序列和ω- 醇溶蛋白4 条序列,序列的格式采用FASTA 格式.

1.2 小麦醇溶蛋白的理化性质分析

利用ExPASy 的Protparam 与Protscale 软件预测醇溶蛋白的主要理化性质及蛋白质亲水性/ 疏水性,具体步骤参考Flynn 等方法[14].

1.3 小麦醇溶蛋白多序列对比和系统进化树的构建

利用Clustalw 软件在线分析小麦醇溶蛋白多序列对比和系统进化树的构建.从Launch Clustal Omega进入界面,点击“选择文件”按钮,选择要比对的10条小麦醇溶蛋白的文本文档FASTA 格式,点击最下方的“Submit”按钮,会弹出序列比对图,点击上方的“Phylogenetic Tree”按钮生成系统进化树.

1.4 小麦醇溶蛋白基序分析

利用MEME program3 软件(http://meme-suite.org/)在线分析小麦醇溶蛋白的类型和排列顺序.在“Inputthe primary sequences” 选择“Type in sequences” 将10条小麦醇溶蛋白序列用FASTA 格式输入,motif 数量设置为10,点击“Start Search”开始基序分析.

1.5 小麦醇溶蛋白二级结构预测

采用PSIPRED version 3.3 软件在线预测工具对小麦醇溶蛋白的二级结构(α- 螺旋和β- 折叠)、域和折叠域识别进行预测分析.

2 结果与分析

2.1 小麦醇溶蛋白的基本理化性质

对10 条小麦醇溶蛋白序列基本理化性质的分析结果如表1 所示.由表1 可以看出,醇溶蛋白氨基酸长度在279 ~ 328 AA,分子质量在32.04 ~ 39.63 kU,理论等电点在6.04 ~ 8.91,其中,α/β 和γ- 醇溶蛋白的理论等电点大于7.00,为碱性蛋白质,而ω- 醇溶蛋白的理论等电点小于7.00,为酸性蛋白质.该10 条醇溶蛋白的平均疏水指数均为负值,在-1.585 ~ -0.595,表明都有一定的亲水性,ω- 醇溶蛋白的亲水性最大,平均疏水指数是-1.433,α/β- 醇溶蛋白的亲水性次之,平均疏水指数是-0.802,γ- 醇溶蛋白的亲水性最小,平均疏水指数是-0.694.10 条小麦醇溶蛋白的不稳定系数均大于40,属于不稳定蛋白质,其中ω- 醇溶蛋白的平均不稳定系数最大,为155.03;其次是α/β-醇溶蛋白,平均不稳定系数为110.80,最小是γ- 醇溶蛋白的平均不稳定系数为103.60.α/β- 醇溶蛋白的脂肪系数平均为71.35,γ- 醇溶蛋白的脂肪系数平均为67.20,ω- 醇溶蛋白的脂肪系数平均为35.74.

2.2 小麦醇溶蛋白序列的多序列比对分析

对10 条小麦醇溶蛋白的氨基酸序列分析结果如图1 所示.由图1 可以看出,醇溶蛋白氨基酸序列都含有保守位点脯氨酸P(Pro)和谷氨酰胺Q(Gln),除CAC94871.1、ACN62214.1 和ATD83895.1 之外,醇溶蛋白N 端起始部分具有相似的氨基酸序列;小麦醇溶蛋白序列大致分为10 个片段,同基序照应;“*”表示比对的位置全部相同,相同率分别为0.037、0.037、0.038、0.039、0.036、0.037、0.034、0.034、0.036 和0.038,表明醇溶蛋白的相似性非常低.

2.3 小麦醇溶蛋白序列的系统进化树构建

对10 条小麦醇溶蛋白序列构建系统进化树分析结果如图2 所示.由图2 可以看出,根据小麦醇溶蛋白同源关系,10 条小麦醇溶蛋白序列被聚类在4 个组,γ- 醇溶蛋白AAA34272.1、ACX37115.1 和CAC94871.1的分布比较远, 在Group1 和Group2 两组内; 说明γ- 醇溶蛋白同源性较远;α/β- 醇溶蛋白A27319、CAA10257.1 和SCW25770.1 的分布较近,在Group3 组内,ω- 醇溶蛋白ACN62214.1、ATD83895.1、AGZ20254.1和AJG03093.1 的分布较近, 在Group4 组内, 说明α/β- 和ω- 醇溶蛋白的同源性较近.

2.4 小麦醇溶蛋白序列的基序分析

对10 条小麦醇溶蛋白序列基序分析结果如图3 所示.由图3 可以看出,基序Motif 1 是最明显的基序,10 条小麦醇溶蛋白序列中都含有,除AJG03093.1 在末尾之外,其余均在序列中间部位;基序Motif 2 的含量较多, 除AJG03093.1 和ACN62214.1 序列在中部,剩余8 条序列位于开头部分;10 条醇溶蛋白序列都含有基序Motif 3,γ- 醇溶蛋白(ACX37115.1、CAC94871.1 和AAA34272.1) 和α- 醇溶蛋白(SCW25770.1、CAA10257.1 和A27319)在序列末尾,ω- 醇溶蛋白(AJG03093.1、ACN62214.1、ATD83895.1 和AGZ20254.1)在序列开头.10 条醇溶蛋白序列都含有基序Motif 4,但相对位置不集中,α/β- 醇溶蛋白在前部,CAC94871.1、CAA10257.1 和A27319 没有重叠.醇溶蛋白的保守域结构为Motif 1、Motif 2、Motif 3 和Motif 4,可能在维持醇溶蛋白结构和功能方面有重要作用.

2.5 小麦醇溶蛋白二级结构预测

利用PSIPRED version 3.3 软件在线预测10 条醇溶蛋白序列的二级结构结果如图4 所示.图4A 为α/β- 醇溶蛋白域结构和折叠域结构分析结果图,在α/β- 醇溶蛋白序列中,有浅色阴影的小方块代表α- 螺旋且位置和数量大致在相同的区域,表明其二级结构的α- 螺旋含量较多且螺旋位置相似度高;其折叠域结构均为一高峰和一低峰,高峰在146 左右,低峰在230 左右,表明3 条α/β- 醇溶蛋白的空间结构是相似的.图4B为γ- 醇溶蛋白域结构和折叠域结构分析结果图,在γ- 醇溶蛋白中有浅色阴影的小方块的数量比α/β- 醇溶蛋白的数量有所降低,且相对位置有所偏移,表明其二级结构的α- 螺旋含量较少;其折叠域结构表现为单峰,峰高在140 ~ 160,表明3 条γ- 醇溶蛋白的空间结构也是相似的.ω- 醇溶蛋白域结构和折叠域结构分析结果如图4C 所示,在ω- 醇溶蛋白中有浅色阴影的小方框的数量明显减少,且位置均不相同,表明该蛋白中几乎没有α- 螺旋的二级结构;该4 条ω- 醇溶蛋白的折叠域结构呈现出M 型峰,表明4 条ω- 醇溶蛋白的结构相同但结构混乱无序.

3 结论

对10 条氨基酸数目在300 左右的醇溶蛋白分析结果表明:醇溶白质的平均疏水指数均为负值,均为亲水性蛋白质;醇溶蛋白的不稳定系数均大于40,属于不稳定蛋白质;多序列比对分析均含有P(Pro)和Q(Gln)醇溶蛋白,且重复出现率较高;对10 条麦醇溶蛋白序列系统进化树构建可以看出α/β- 和ω- 醇溶蛋白的同源性较近,与γ- 醇溶蛋白同源性较远;醇溶蛋白均含有基序Motif 1、Motif 2、Motif 3 和Motif 4,这些域结构可能在维持麦醇溶蛋白结构和功能方面有重要作用;醇溶蛋白的二级结构由α- 螺旋、β- 折叠和无规则卷曲等结构元件组成,α/β- 和γ- 醇溶蛋白中 α- 螺旋含量较多,且结构有序,而ω- 醇溶蛋白中α- 螺旋含量较少,而结构混乱无序.

生物信息学论文范文结:

大学硕士与本科生物信息学毕业论文开题报告范文和相关优秀学术职称论文参考文献资料下载,关于免费教你怎么写生物信息学方面论文范文。

1、医学信息学杂志

2、生物信息学论文

3、中华医院感染学杂志

4、新课程导学期刊

5、电子信息工程专业论文

6、移动信息期刊