2005-12-04

人基因启动子区偏爱序列的统计分析

启动子区是基因表达调控的重要区域。转录起始位点对潜在的启动子区的调控元件的分析带来便利。本文章通过对5700个已知转录起始位点的全长cDNA进行分析,抽提出4737个假定的启动子区(putative promoter regions,PPRs)。由于很多调控区包含短的(少于10个)、高度保守的核苷酸序列,所以作者分析了假定的启动子区中的8个碱基的组合偏爱性,使用的是z-scores和其它一些相关的统计学方法。

研究结果表明,有一些高度偏爱的核苷酸组合在真核生物转录因子数据库TRANSFAC中可以找到相应的描述,但很多没有。这些没有相关描述的可能是新的潜在的启动子调控区。另外文章还讨论了z-scores和其它一些相关的统计学方法的区别。

请参考:

Leonardo Marin?o-Ram??rez, John L. Spouge, Gavin C. Kanga and David Landsman。(2004) Statistical analysis of over-represented words in human promoter sequences. Nucleic Acids Research, 32, No. 3 949±958, DOI: 10.1093/nar/gkh246.

没有评论:

发表评论