
摘要
背景:蛋白质可能没有、单个、双或多个结构域,而单个结构域可能出现在多个蛋白质中。它们的分布模式可能对细菌生理和生活方式产生影响。目的:本研究旨在了解结构域在细菌蛋白质组中的分布和复制方式,以更好地了解细菌生理和生活方式。
方法:在这项研究中,我们使用 16712 个隐马尔可夫模型来筛选 944 个细菌参考蛋白质组,阈值 E 值 <0.001。计算每个物种的非冗余域的数量和冗余域的重复率。还为每个物种确定了独特的域,如果有的话。此外,在理化性质方面研究了无结构域蛋白质的性质。
结果:细菌蛋白质组的非冗余域数量的增加遵循渐近函数的趋势。域重复率与蛋白质组大小呈正相关,并且增加得更快。单域蛋白质的高百分比与小的蛋白质组大小更相关。对于每个蛋白质组,还获得了独特的域。此外,在本研究中分析的几种理化性质方面,无域蛋白质与其他三组蛋白质显示出差异。
结论:该研究证实,低结构域重复率和高百分比的单结构域蛋白更有可能与细菌宿主依赖或限制性的生态位适应生活方式有关。此外,基于对物种特异性域和核心域相互作用或共现的分析,揭示了独特的生活方式和生理学。
论文官方网址请点击下方链接: