2005-12-29

[转载]强烈谴责中关村904号楼的一个高姓、韩姓房东

发信站: 水木社区 (Sun Dec 25 21:11:56 2005), 站内

房子位于12层的楼顶上面,有点像个小阁楼,类似于一居室,房东叫高庆芝,她老公姓韩,40岁左右。我们于今年九月27日和这个人签下合同,原定租期为一年,在看房子的时候她说房租中包含有线电视费,结果合约一签下她又张口要求我们交有线电视费,这点钱也就罢了。
由于她自己的房子也在楼顶,就和我们挨着,她在我们居住期间总是在晚上十点后去我们屋看房子找毛病,要求我们不许干这不许干那,由于房子是在楼顶,四面漏 风,即使有暖气也很冷,我们一般吃完饭就上床暖和去了,她每次这么晚来我们都要起来给她开门还要听她唠叨半个小时一个小时不等。
在刚开始住进去时我们想开开窗户透透气,他们不让说是不安全,后来由于这个屋子太潮屋顶上发霉变黑他们又赖我们平常不注意通风向我们索要700元做赔偿,我们当然没有接受。
后来有一次我们同事来玩被她发现,她便怒斥我们一番并威胁我们要我们搬走。再后来一个星期天中午我们正在午睡,她砰砰乓乓地来砸门,我怒了,没有给她开,她就
打我的手机大发雷霆说我们屋外的垃圾没有弄好,我老公出去开门发现垃圾袋被风吹开了,就赶紧清理,结果她还在不停唠叨,我真的很生气就屡数她老来我们屋的恶行,她就跳进卧室和我争吵,临走时再三说让我们搬家,说了很多遍。
我们一看她这样,就按她说的搬家吧,结果后来她竟厚颜无耻地说扣我们押金,这可是她说的让我们搬家结果来这么一套,我当时就跟她大吵了一架,她的这一阴谋没有
得逞,我们搬出后我老公找她结算房钱,她扣下我们剩余房钱以及屋顶维修费共200元。
说实话如果是我们主动要求搬出她要扣押金也就罢了,是她要求我们搬的结果还让我们白白赔偿她钱,真是岂有此理。
不过幸亏也没损失太多,在这也要提醒大家,碰见不讲理的人时一定要勇于争吵!
不要因为所谓的风度就让恶人得逞!
另外大家在租这样的露台房子时一定要考虑清楚,因为实在是太冷了,屋子漏风。但愿所有想租一居室的朋友注意不要上这个人的当。房子多的是,好房东也很多,大家
不要自寻烦恼呀。

2005-12-17

勃客郑渊洁

郑渊洁在新浪的Blog开张了,并且还谈了感想。我看他的感想说的很有意思,于是去他的官方网站看了一下,发现 他早就开始写blog了,在新浪的blog只能算是一家分店而已。
感觉郑渊洁有点贫,是从看一篇记者采访他的帖子感受到的,这是从他的童话作品里完全感受不到的。他对blog说了这么多看法,不一定对,但是很有新意,我并没有感到这个杀手不太冷 那样的愤怒。

2005-12-09

从blogspot转移到ftp的blog发布-兼答阿Q问

你好。我原来的blog也是用的blogspot,后来才转移到的国内ftp发布。现在blogspot被屏蔽,也碰巧躲过这一劫。
将blog发布到ftp也比较方便。只需要在blogger.com的"设置"->"发布"里面选择"通过ftp发布",然后再设置相应的ftp帐号即可。至于具体步骤,blogger的帮助里有 详细介绍
ftp空间去哪里找呢?网上有很多免费的,尤其是国外的服务较多。但是问题就在于不稳定,说不定哪天就不能访问了(另外就是不能绑定域名)。我用的我要安家的空间。他的自助型空间比较适合。网页空间:10元/10M/年,如果用blogger.com的系统, 就无需数据库。对于一般的blogger,20M空间足矣。
有不详细的地方,尽管问我。
update:版面不是我设计的,就是用的blogger.com现成的模板。

Nature封面故事:狗的基因组完成测序

Genome sequence, comparative analysis and haplotype structure of the domestic dog
从遗传上来讲,家狗的基因组在地球上5500种哺乳动物中可以说是最有趣的。不同品种的狗之间在行为和体征方面的明显差异(这些特征是由在相对较短的时间内人类的强化选择造成的),这意味着,狗的基因组含有了解基因组演化和组织的关键线索,也含有了解疾病易感性的线索。在本期Nature上,Lindblad-Toh等人发表了狗基因组的高质量序列草图,更具体地说,是一只名叫"塔莎"的、品种为"拳击手"的德国母狗的基因组,并且还列出了不同品种的狗之间的一些遗传差异。将狗与人类和啮齿类动物所做的比较分析,为我们提供了一个关于基因和基因组的演化的具有普遍性的视角。
http://www.nature.com/nlink/v438/n7069/abs/nature04338.html
(Article p. 803; News and Views)(封面美术:Bang Wong, Broad Institute of MIT and Harvard;封面摄影:加州大学戴维斯分校Alison Ruhe;华生和克里克的照片:A. Barrington Brown/ Science Photo Library)

2005-12-08

从基因组学到蛋白质组学

蛋白质组学是研究所有表达蛋白质功能的学科。过去几年间,有关蛋白质与蛋白质之间的相互作用、细胞器的组成、癌症患者蛋白质的活性成分以及蛋白质表达谱等 方面积累了大量的数据。但是,进一步地完善技术、组织国际蛋白质组学计划以及开放使用蛋白质组学数据迫切需要蛋白质组学发挥其应有的效力。

蛋白质组一词最先是用于描述基因组编码的一组蛋白质[1]。研究蛋白质组的科学称为蛋白质组学。现在蛋白质组学不仅包括细胞中的所有蛋白 质,而且包括所有的蛋白质亚型及其异构体、蛋白质之间的相互作用、蛋白质初级结构以及他们的高级结构的描述,几乎包括了后基因组学的所有内容。在这篇综述 里我们将以崭新的和高通量的观点,应用蛋白质组学全面理解蛋白质的生物化学。希望这种高通量的生物化学将在各个层面,为全面了解细胞的功能做出贡献。

蛋白质组学补充了其它功能基因组学方法,包括微阵列表达谱[2],细胞和生物体水平的系统表型谱[3,4],系统遗传学[5,6]和小分 子阵列[7]。通过生物信息学整合这些数据将产生全面的基因功能数据库,这将对蛋白质的特性和功能研究有巨大的参考价值,同时也是研究人员提出和验证假说 的有力工具。此外,大量的数据库对新出现的系统生物学也是十分重要的[8]。

蛋白质组学的挑战和方法

如果没有先前的基因组学的成果,蛋白质组学的研究是不可能的。基因组学提供可能的基因产物的蓝图,这些基因产物是蛋白质组学研究的核心内 容。虽然蛋白质组学的任务几乎是老生常谈了,但所面临的困难可以和最初基因组计划所面对的巨大而直接的挑战相提并论。不象DNA测序技术可以应用PCR和 自动测序技术,蛋白质组学必须面对各种不可回避的问题,如有限的、不断变化的标本资源、标本的降解、动态波动巨大(蛋白质丰度差异超过106倍)、翻译后 修饰的多样性、多种多样的组织来源、发育上的和时间上的特异性以及疾病和药物的干扰。虽然从定义上看蛋白组学可以产生直观的生物学结果,但所有这些困难致 使人们对全面的蛋白质组学计划产生了一种内在的压力,并经常将之看作令人有挫败感的练习。

在3月份的《Nature》上,5个重要的蛋白质组学研究的重点放在技术的发展和应用上。这些领域包括基于质谱的蛋白质组学、全蛋白质组 的生物化学分析、系统结构生物学和成像技术、蛋白质信息学和蛋白质组学的临床应用。很明显,这样的分类方法是有些主观的,不仅仅因为技术的突破经常在很多 科学前沿得到直接应用,更重要的是在深入了解蛋白质功能方面,经常出现需要联合应用不同的蛋白质组学的研究方法。

基于质谱方法的蛋白质组学

质谱学具有从不断增长的复杂混合物中分离出微量蛋白质的能力,这是推动蛋白质组学研究的主要力量。最初蛋白质组学研究的成效依赖于二维凝 胶电泳,然后用质谱鉴定蛋白质。这种方法受蛋白质浓度范围的限制,必须将标本中的蛋白质浓缩成最大丰度。质谱技术的快速发展已经转变到直接质谱分析,进一 步的改进将提高特异性、稳定性和数据处理的能力。

过去几年对酵母蛋白质相互作用组、疟原虫蛋白质组、细菌蛋白质组和不同细胞器的蛋白质组进行了部分分析。这些大量蛋白组学数据只代表生物 学和药物学进展的冰山一角。更巨大的挑战来源于蛋白质组是一个动态的,而不是一个静止的学科的事实。当初想在一次实验中测定全蛋白质组调控事件所做的努 力,已经转向酵母磷酸蛋白质组[9]和泛素介导的分解代谢组。想要获得真实的蛋白质组动力学和细胞反应的动态情况,需要更高通量和更加灵敏的检测方法。初 期不需要凝胶分析复杂混合物的方法在这方面起了重大的作用[10]。进一步的需求包括每种蛋白质的全部序列,样品前处理的各种方法以及翻译后修饰的蛋白质 的自动检测和识别的复杂的算法。系统生物学的目标是在整个系统水平来理解典型的细胞间相互作用[8,11],这也将需要更加可靠的定量方法。

基于阵列的蛋白质组学

许多已经建立的,快速的蛋白质组学研究平台补充了质谱法的不足。这些方法的先驱是Fields 改进的双杂交筛选法[12]。 不像直接的生物化学方法受蛋白质丰度的限制,双杂交法虽有假阳性的缺点,但它可以检测低丰度蛋白质之间极其微弱的相互作用。

最近,不同格式的蛋白质阵列有希望在蛋白质组水平快速检查蛋白质的活性。这些阵列是建立在重组蛋白基础上,或者是与蛋白质特异性作用的分 子,包括抗体、多肽和一些小分子[13]。从蛋白质阵列得到的信息可以了解蛋白质之间的相互作用,蛋白质修饰和酶的活性。目前存在的挑战是有效地结合 highend质谱到阵列上去。阵列分析方法也可以用于显示体内信息,例如,通过绿色荧光蛋白(GFP)信号系统分析蛋白质在细胞的定位,或者通过蛋白质 融合体之间的荧光共振能量转移到不同波长的GFP来分析蛋白质的相关性。最后,基于细胞和组织的阵列能够在另一层面上解释蛋白质的功能。

这些方法实际应用中的一个瓶颈,其实也是大多数系统方法的瓶颈,是应用已知全基因组cDNA捕获带有抗原决定位点的蛋白质复合体时,一直存在有效性不高的问题。

结构蛋白质组学

由Baumeister等撰写的综述完全超越蛋白质一级结构、丰度及活性的描述,系统地理解蛋白质的相互作用及其功能的结构基础。作者运 用文学上的比喻,令人信服地论证了全面描述细胞的行为必须结合结构信息,不仅仅是在全部蛋白质水平,而且包括所有蛋白质的复合体以及这些复合体在细胞内的 组织水平。所有这些结构学上的目标包括测量范围的跨度有几个数量级,需要一系列研究蛋白质结构的技术,从研究蛋白质的X射线晶体衍射技术和核磁共振技术 (NMR),到复杂的放大数百万倍的电子显微镜以及能看到整个细胞环境的高分辨率的X射线断层摄影。这些重复关于蛋白质组产量和灵敏度的论文涉及了每一个 研究结构的方法。Baumeister等建议新的解决方法甚至包括从晶体摄影中消除结晶。NMR和芯片对建立蛋白质相互作用的动力学模型是必要的, 这些相互作用很多是通过大量的非结构区所控制的[14]。

信息学

随着大量数据的产生, 信息学研究在许多蛋白质组学前沿显得十分重要。Boguski 和McIntosh强调了样品资料管理的重要性,和执行严格的标准及恰当的基因功能的注释[15]。十分重要的是软件的开发是与早期一致同意的文件编制相 联系的, 基于XML的定义和对词汇的控制,可以允许使用不同的工具交流原始数据。已经投入很大力量建立蛋白质相互作用数据库[16],系统生物学软件的基础结构 [17]应该建立在将来蛋白组学的发展之上。开发可靠的统计学方法以便从大量不完整的质谱数据中赋予蛋白质特性,对于将结果自动存入数据库是十分重要的, 这也是一个目前十分艰辛的操作和不断纠正错误的过程。从DNA微阵列数据分析得来的知识包括聚类,概略以及形式-匹配方法,应该可以移动到蛋白质组的分析 上[2]。令人受到鼓舞的是欧洲生物信息学研究院和人类蛋白质组学组织(HUPO)已经联合开始启动关于蛋白质间的相互作用和其他蛋白质组学数据的研究 (参看http://psidev.sourceforge.net/)。

临床蛋白质组学

蛋白组学对临床诊断和新药物研发产生了深刻的影响,HUPO总裁Sam Hanash在这方面已经有很好的综述。因为大多数药物的靶点是蛋白质,蛋白质组学研究将不可避免推动新药的发现、发展以及临床应用。蛋白组学全力履行其 任务的形式是受多因素影响的,不仅仅指在完成的不同时期应用不同技术平台上。

检测与疾病相关的蛋白质谱可以追溯到蛋白质组学发展的初期,当时二维凝胶电泳首次应用于临床检测。质谱技术现在已经能够在体液中同时检测 到数千种蛋白质和多肽,已经开始改变基于蛋白质的诊断学,这些成果已经被对癌症患者的回顾性研究所证实[18]。质谱仪具有坚固耐用和高通量特性,十分适 合于临床应用。带有确定诊断阅读器的蛋白质和抗体芯片也可能逐渐变得符合临床应用的要求。因为所有的临床界面,标准品的制备,贮存和注释均必须得到解决。

尽管在这个领域前进的步伐比开始想象的要慢,蛋白质组学将不可避免地加快新药的开发。使用当前先进的技术已经能够识别新的疾病特异性靶标,这些靶标大部分位于细胞表面。了解位于细胞表面的生物学网络知识有利于为初步选择适合的药物靶点提供理论基础。

直系同源(Orthogonalomics)

对所有高通量的研究方法包括蛋白质组学需要注意的是,大量的实验经常缺少重复性和严格的验证, 而这些恰恰是可靠的科学研究的根本。 但是,从各种不同物种而来的蛋白质组学数据之间或蛋白质组之间与其它全基因组数据之间的交集,经常允许进行相互验证。这个观点已经被最近分析酵母菌和人类 的核仁的结果验证。这些直接或间接的成果揭示了蛋白质之间相互作用的巨大网络, 其中许多影响核糖体的生物发生的保守过程[19]。对酵母细胞大小突变体(表型组学)和调控这些控制细胞大小基因的一组基因 (转录组学) 进行独立系统性分析的结果,揭示了在核糖体生物发生和其对细胞分裂的作用之间存在一种人们意想不到的调节关系[20]。

类似对相互作用组、表型组和转录组数据库的整合,已经应用于线虫胚系从而推导出一个新的调节网络[21]。联合应用生理学,表型和表达数 据库可以得到一些假说,否则只应用上述任何单一的方法则不会产生这些假说。即使只有有限的数据资源,也可以依据简单的参数做出猜测。例如,一种称为 ScanSite的算法,仅仅依据磷酸化物质的电泳质量和与PKB丰度一致的位点序列,就可以识别结节性硬化症复合体-1是与蛋白激酶B(PKB)在生理 学上相关联的底物[22]。最后,通过利用新的方法重新检测已知的复合体,经常可以得到很多新的信息。例如,已经着重研究的促进细胞分裂后期复合体的三种 新成分,最近已经通过多维质谱分析法找到[23]。

随着大量开始系统地将许多模式生物包括酵母菌、线虫、果蝇、斑马鱼、小鼠和人类的表型与缺失的基因功能之间进行联系,从联合应用大规模的 细胞生物学、转录和蛋白组学数据库而获得的认识必须经过整合而变得协同,因为研究的范围在扩大。最近,通过RNA干扰技术在组织培养细胞中系统地研究人类 基因组的方法快速采集表型数据[6],结合蛋白质组数据将大大加速功能研究的新发现。

将来的发展和挑战

人类基因组序列的巨大成功已经表明,更快速和更廉价这句话是任何大规模事业必然的道路。虽然离蛋白组学还很遥远,但这个华丽的语言被成倍 地运用于蛋白组学。就这个词的纯粹意思来说,蛋白质组就像地平线一样永远不可触及;更正确的说法是,蛋白质组学将以一种迄今还无法想象的方式与其他技术结 合,以便精确地描述细胞的特征。

以全部标准来评判, 当今的仪器手段还远远不是最佳的,在一定程度上是因为厂家还没有花费足够的时间制造出仪器及相关的完全适合于蛋白质分析的硬件。

以质谱为基础的蛋白质组学在使用中受到众多限制,因此在不久的将来仪器性能将有望大幅度提高。由于新一代蛋白质组学仪器的改进,从而有可 能监测许多有关的蛋白质翻译后修饰和复杂混合物中蛋白质的相互作用[24]。作为技术革新可以预计的一个例子是,通过实时分析复杂混合物中每一种蛋白质存 储的色谱信号,可以使蛋白质的产量和范围大幅度增长。

在单个实验室水平,由于质谱仪可以常规应用于生物学研究的各个方面,毫无疑问的是,灵敏的和可花费得起的小型质谱仪在这方面将有巨大的市场。

样品处理的自动化、选择性地计算蛋白质之间的相互作用和微小流动相使样品的损失减少到最小,这些是获得高质量蛋白质组进行质谱分析的全部因素。同样重要的是,适度地利用蛋白质的表达和抗体将提高蛋白质组学研究的速度和规模。

关于更为简单的模式生物的蛋白质组, 所有现成的蛋白质相互作用图谱远远未达到饱和。由于已知的蛋白质相互作用密度的提高,可验证的假说应该来源于不断增长的数据库,尤其是联合其他基因组的数 据库,包括预测蛋白质结构的数据库。一旦足够的动力学数据有利于建立细胞行为的原始模型,对模型的改进要求在众多的突变和药物治疗条件下,蛋白质分析具有 重复性。如果简单的Boolean网络模型是一个引子,那么在系统水平上研究蛋白质相互作用的网络必定产生一些令人惊讶的效果[25]。

所有这些网络信息必须是可被人们利用的格式。为了达到这个目的,大量的工作必须放在发展形象化工具上,包括和其他全基因组数据库的自动整合。

新技术还有很大的发展空间,许多有待改进的方面可能来自遭受信息超载之苦的其他领域。这样的例子包括将DNA阵列数据聚类的复杂工具和用颜色突出整个趋势的多变量的绘图表现形式[26],以及用于计算机游戏程序上的精巧的三维界面。

在临床上,深入分析少量疾病组织的蛋白质组将有利于诊断和治疗的监测,尤其是当预测的疾病模式从大量的临床数据中得到验证时。将磷酸化蛋 白质组学方法应用于临床标本可能最有希望获取大量信息和分辨细胞状况,这将有利于诊断、新药的研发以及阐明药物的作用机制。病原体宿主相互作用的蛋白质组 也应该成为新药作用的丰富的靶点。无论什么确切的形式,质谱测量法和蛋白质阵列技术平台必定会渗透到临床,代替价格更为昂贵、可靠性差的、传统的临床生物 化学分析方法。最后,刚出现的化学蛋白质组学不仅有利于发现许多药物的作用机制,而且有可能使无数失败的不明原因失去效应的小分子重新得到利用。

开放的蛋白质组学

蛋白质组学发展最常见的阻碍是提供给生物医学研究者个人的途径很有限或没有。虽然事实上所有的研究中心有某类质谱仪,但丢失标本、鉴定失 败和通量不足是很普遍的。从某种意义上说,这些问题代表了一种复杂技术的初期阶段;另外的原因是无力支付设备的高昂费用和缺乏训练有素的人员检查仪器。结 果大多数蛋白质组学的突破和原始数据仅仅来源于一些倾向于实验室的技术性工作。改善这种状况的任务就落在仪器制造厂商、蛋白质组学的领导者、基金会、学术 研究机构和个体用户身上。国家蛋白质组学中心也被提议作为一种确保可得到专家意见和仪器使用的途径[27]。

绘制和理解蛋白质组学各种表现方式方面可以从基因组序列协会得到借鉴。首先,假如整个生物医学界的参与是有意义的,则公众必须有权使用在 线的原始数据。与在基因组计划的危机关头发布的百慕大指导方针相似[28],制订的条例规定,对基本的蛋白质数据公众可以有权使用和不能申请专利将有利于 学术和产业机构的研究。这些数据应该包括蛋白质的一级结构、翻译后的修饰、蛋白质的定位以及蛋白质间相互作用的所有模式。

具有重要意义的一点是,大规模蛋白质组学研究应该是协调的,目的是避免重复和为基金会提供强有力的理性建议。这些基金会组织原则上愿意资 助蛋白质组计划,目的是获得象基因组计划那样丰厚的回报,但是需要向他们展示明确的目标和说明蛋白质组学如何为加速生物医学的发展建立基础。HUPO是有 重要协调作用的机构。HUPO已经宣布全世界的蛋白质组学研究的5个重要的目标:血浆蛋白质组学的定义;提议深入研究针对特殊类型细胞的蛋白质组学;建立 一个联合会生产全部人类蛋白质的抗体;发展新技术和建立信息学基础设施。在这个列表上我们将加上所有蛋白质一级结构的目录、绘制所有可以纯化的细胞器图 谱,以及为比较蛋白质组学和正在进行的整合功能基因组学计划而产生的模式生物的蛋白质相互作用图谱。

为了完成这个宏伟的计划,必须为蛋白质组学研究建立一个专门的基金库,类似于为人类和模式生物的基因组计划而建立的基金会,或者正在执行 的基金同样资助蛋白质组计划。既然知道全蛋白质组计划的花费是巨大的,因此学术界和产业界在方法学的发展、数据采集和项目调整方面尽可能合作对双方都有 利。最后,必须建立一种方法将全蛋白质组实验和许多个别生物学实验室的成果整合起来,发展和检测生物学模型。无论将来如何发展,蛋白质组学将对生物学和医 学学科产生巨大的回报。

参考文献

[1] Wilkins, M. R. et al. From proteins to proteomes: large scale protein identification by two-dimensional electrophoresis and amino acid analysis. Biotechnology ,1996,14: 61-65.
[2] Shoemaker, D. D. & Linsley, P. S. Recent developments in DNA microarrays. Curr. Opin. Microbiol,2002,5: 334-337.
[3] Giaever, G. et al. Functional profiling of the Saccharomyces cerevisiae genome. Nature , 2002,418:387-391.
[4] Gerlai, R. Phenomics: fiction or the future? Trends Neurosci, 2002 ,25:506-509.
[5] Tong, A. H. et al. Systematic genetic analysis with ordered arrays of yeast deletion mutants. Science , 2001, 294:2364-2368.
[6] Hannon, G. J. RNA interference. Nature, 2002,418:244-251.
[7] Kuruvilla, F. G., Shamji, A. F., Sternson, S. M., Hergenrother, P. J. & Schreiber, S. L. Dissecting glucose signalling with diversity-oriented synthesis and small-molecule microarrays. Nature , 2002,416: 653-657.
[8] Csete, M. E. & Doyle, J. C. Reverse engineering of biological complexity. Science,2002,295:1664-1669.
[9] Ficarro, S. B. et al. Phosphoproteome analysis by mass spectrometry and its application to Saccharomyces cerevisiae. Nature Biotechnol, 2002,20, 301-305.
[10]Liu, H., Lin, D. & Yates, J. R. III Multidimensional separations for protein/peptide analysis in the post-genomic era. Biotechniques , 2002,32:898-911.
[11]Ideker, T. et al. Integrated genomic and proteomic analyses of a systematically perturbed metabolic network. Science , 2001,292:929-934.
[12]Fields, S. & Song, O. A novel genetic system to detect protein-protein interactions. Nature, 1989,340:245-246.
[13]MacBeath, G. Protein microarrays and proteomics. Nature Genet,2002,32(Suppl.):526-532.
[14]Wright, P. E. & Dyson, H. J. Intrinsically unstructured proteins: re-assessing the protein structure-function paradigm. J. Mol. Biol, 1999 ,293:321-331.
[15]Ashburner, M. et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature Genet, 2000 ,25:25-29.
[16]Bader, G. D. & Hogue, W. V. C. in Genomics and Bioinformatics (ed. Sensen, C. W.) 399-413 (Wiley-VCH, Weinheim, 2001).
[17]Kitano, H. Systems biology: a brief overview. Science ,2002,295:1662-1664.
[18]Petricoin, E. F., Zoon, K. C., Kohn, E. C., Barrett, J. C. & Liotta, L. A. Clinical proteomics: translating benchside promise into bedside reality. Nature Rev. Drug Discov. , 2002,1: 683-695.
[19]Andersen, J. S. et al. Directed proteomic analysis of the human nucleolus. Curr. Biol, 2002 ,12:1-11.
[20]Jorgensen, P., Nishikawa, J. L., Breitkreutz, B. J. & Tyers, M. Systematic identification of pathways that couple cell growth and division in yeast. Science , 2002,297:395-400.
[21]Walhout, A. J. et al. Integrating interactome, phenome, and transcriptome mapping data for the C. elegans germline. Curr. Biol, 2002 ,12:1952-1958.
[22]Manning, B. D., Tee, A. R., Logsdon, M. N., Blenis, J. & Cantley, L. C. Identification of the tuberous sclerosis complex-2 tumor suppressor gene product tuberin as a target of the phosphoinositide 3-kinase/akt pathway. Mol. Cell , 2002,10:151-162.
[23]Yoon, H. J. et al. Proteomics analysis identifies new components of the fission and budding yeast anaphase-promoting complexes. Curr. Biol, 2002 ,12:2048-2054.
[24]Mann, M. & Jensen, O. N. Proteomic analysis of post-translational modifications. Nature Biotechnol. (in the press).
[25]Huang, S. & Ingber, D. E. Shape-dependent control of cell growth, differentiation, and apoptosis: switching between attractors in cell regulatory networks. Exp. Cell Res,2000, 261, 91-103.
[26]Ball, P. Data visualization: picture this. Nature ,2002,418:11-13.
[27]Aebersold, R. & Watts, J. D. The need for national centers for proteomics. Nature Biotechnol, 2002 ,20:651.
[28]Marshall, E. Bermuda rules: community spirit, with teeth. Science , 2001,291:1192.
Nature,2003,422:193-197.(张志译)

2005-12-07

中国兰州神秘消失,美国白宫极为震动[roy@yjrg]

北京时间11月25晚,美国白宫灯火通明,所有情报人员,彻夜未眠,难道发生了什么大事?
  
   就在3天前美国发现,在其卫星地图上找不到中国的兰州,兰州消失了,兰州是中国的经济城市,更是重要的军事重地,兰州突然消失了,这还了得???这 令美国全国上下极为震惊,难道中国又发明了什么新的科学技术,可以把整个城市都隐藏起来,如果这是真的,对美国的威胁就大了,   
  美国连夜派出中央情报局人员,赶赴兰州调查原因,又联系一切在中国从事情报的特务人员,连续找了几天,都没有找到原因,而且中国领导层也没什么特别反映,美国方面非常沮丧,准备撤回在兰州的情报人员,   
  
  就在情报人员离开兰州的时候,一位研究中国的专家,买了一份当地26号早上的兰州日报,准备路上浏览,打开报纸一看,头版头条赫然写道:兰州雾锁全城污染创全国之最 污染指数达500(图)   
  
  真是踏破铁鞋无觅处,得来全不费工夫。几天来美国上上下下都解决的问题,一份小小的兰州日报就搞定了!!     
  
  靠,该死的500字!!

   附上YAHOO新闻:

   据国家环保总局的统计显示,11月26日,兰州市空气质量污染为五级重污染,污染指数为500,位列84个监测城市首位,创下今冬以来最高,比排名第二 的乌鲁木齐市191的污染指数,整整高出309。气象专家说,中、重度污染天气(4级、5级)会造成空气对流不畅,污染物很难扩散,市民遇到这样的天气应 尽可能避免户外活动。要早晚加强室内通风,保持空气流通,还应多喝白开水,多吃新鲜水果和蔬菜,以提高身体的免疫力。
原发于一见如故BBSjoke版by roy同学,因为此文非常精彩,转发这里留影纪念。

2005-12-04

Blogspot又被封禁了!

七巧仔那里得知,Blogspot又被封禁了!
我试验了一下,果然,*.blogspot.com的网页都无法访问了,其中包括我原来的blog页面。
幸好前不久我的空间转移到了国内,才使得没有受到这个影响。看来google的公关不可靠啊。

哺乳动物中的重叠基因(比较基因组)

人的基因组有32亿左右碱基,但却只有约3万5千个编码蛋白的基因。按道理来说,每个基因应该可以"分到"比较多的长度,但是,令人不解的是,在哺乳动物基因组中存在大量的重叠基因(overlapping genes),为什么这些基因不分散开来而"重叠"在一起?

本文研究了人和小鼠1316对重叠基因,发现只有一小部分基因的重叠方式是严格相同的。

请参阅:

Vamsi Veeramachaneni, Wojciech Makalowski, Michal Galdzicki, Raman Sood and Izabela Makalowska(2004)Mammalian Overlapping Genes: The Comparative Perspective. Genome Research,14:280-286

人基因启动子区偏爱序列的统计分析

启动子区是基因表达调控的重要区域。转录起始位点对潜在的启动子区的调控元件的分析带来便利。本文章通过对5700个已知转录起始位点的全长cDNA进行分析,抽提出4737个假定的启动子区(putative promoter regions,PPRs)。由于很多调控区包含短的(少于10个)、高度保守的核苷酸序列,所以作者分析了假定的启动子区中的8个碱基的组合偏爱性,使用的是z-scores和其它一些相关的统计学方法。

研究结果表明,有一些高度偏爱的核苷酸组合在真核生物转录因子数据库TRANSFAC中可以找到相应的描述,但很多没有。这些没有相关描述的可能是新的潜在的启动子调控区。另外文章还讨论了z-scores和其它一些相关的统计学方法的区别。

请参考:

Leonardo Marin?o-Ram??rez, John L. Spouge, Gavin C. Kanga and David Landsman。(2004) Statistical analysis of over-represented words in human promoter sequences. Nucleic Acids Research, 32, No. 3 949±958, DOI: 10.1093/nar/gkh246.

难以解释的现象--转录因子结合位点在人21和22号染色体上的分布

转录因子的结合位点(transcription factor binding site,TFBS)是转录因子调节基因表达时,与mRNA结合的区域。按照常识,转录因子(transcription factor,TF)的结合位点一般应该分布在基因的前端,但是,新的研究发现,人21和22号染色体上,只有22%的转录因子结合位点分布在蛋白编码基因的5'端。

这篇文章的试验方法是,通过高密度的寡核苷酸芯片,反映出人21和22号染色体的几乎所有的非重复序列,通过这种芯片,检测三种转录因子,Sp1、 cMyc、和p53的结合位点。结果表明,每种转录因子都有大量的TFBS与之结合。然而,只有22%的转录因子结合位点分布在蛋白编码基因的5'端, 36%的TFBS分布在蛋白编码基因的中部或3'端,并且这36%的TFBS常常和基因组中的非蛋白编码RNA分布在一起。这暗示,在人的基因组中,不仅包含蛋白编码基因,也包含数量相当的非编码基因(noncoding genes),他们都受常见的转录因子所调控。

(有关非编码基因的研究:)
人们对蛋白编码基因已经很熟悉了,但是,最近几年,人们发现,似乎基因组中的转录产物(转录组,transcriptome)比想象的更多更复杂。这主要是由非编码基因造成的,它们不编码蛋白,其中有一些编码反义RNA。后来,通过对小鼠基因组的分析,发现人和小鼠的基因组中的非编码区存在比预想多的保守区域,这些保守区域可能就是非编码基因所在的区域。非编码基因对生物体照样有很重要的功能,但是,目前我们对这一部分还知之甚少。

参考文献:

Simon Cawley, Stefan Bekiranov, Huck H. Ng, Philipp Kapranov, Edward A. Sekinger, Dione Kampa, Antonio Piccolboni, Victor Sementchenko, Jill Cheng, Alan J. Williams, Raymond Wheeler, Brant Wong, Jorg Drenkow, Mark Yamanaka, Sandeep Patel, Shane Brubaker, Hari Tammana, Gregg Helt, Kevin Struhl and Thomas R. Gingeras
Unbiased Mapping of Transcription Factor Binding Sites along Human Chromosomes 21 and 22 Points to Widespread Regulation of Noncoding RNAs.
Cell 2004, 116:499-509
http://www.cell.com/content/article/abstract?uid=PIIS0092867404001278

转录因子靶点的鉴定(综述)

鉴定转录因子的靶点对了解生物过程的细胞及分子机制有重要的意义。这篇综述回顾了以往研究此类问题的常见方法,也介绍了一些寻找转录因子直接靶点的新的技术,如染色质免疫沉淀,生物芯片,生物信息等。

鉴定转录因子的靶点的第一步通常是将所研究对像敲除掉或超量表达,然后考察基因表达的变化,通常的方法有RT-PCR,消减杂交(subtractive hybridization),差异显示(differential display)和SAGE(analysis of gene expression)等。芯片技术的发展使这种分析变得更加简便。它能一次分析很多的基因。但上面的技术都不能让我们知道所找到的靶基因是否直接的靶基因,可能有大量的基因都是间接被调控的。另外一些技术的发展使我们能够找到直接的靶点,如染色质免疫沉淀(chromatin immunoprecipitation,ChIP)和Dam甲基化酶鉴定法(Dam methylase identification,DamID)。这种技术和芯片技术联合起来可以帮助我们分析在基因组范围内转录因子的结合位点,称作基因组范围的定位分析(Genome-wide location analysis)。另外,基于算法和数据库的生物信息学方法也得到了一定的发展,这表现在从单纯保守位点分析到比较基因组方法的应用,这种方法基于以下事实,在种间高度保守的非编码序列有更大的可能性参与基因调控。

参考文献:
Nicola V Taverner, James C Smith and Fiona C Wardle.
Identifying transcriptional targets.
Genome Biology 2004, 5:210.
http://genomebiology.com/2004/5/3/210/

转录因子结合位点的适应进化

这篇文章用一个理论模型探讨了转录因子结合位点的适应进化问题。

Abstract (provisional)

Background

The regulation of a gene depends on the binding of transcription factors to specific sites located in the regulatory region of the gene. The generation of these binding sites and of cooperativity between them are essential building blocks in the evolution of complex regulatory networks. We study a theoretical model for the sequence evolution of binding sites by point mutations. The approach is based on biophysical models for the binding of transcription factors to DNA. Hence we derive empirically grounded fitness landscapes, which enter a population genetics model including mutations, genetic drift, and selection.

Results

We show that the selection for factor binding generically leads to specific correlations between nucleotide frequencies at different positions of a binding site. We demonstrate the possibility of rapid adaptive evolution generating a new binding site for a given transcription factor by point mutations. The evolutionary time required is estimated in terms of the neutral (background) mutation rate, the selection coefficient, and the effective population size.

Conclusions

The efficiency of binding site formation is seen to depend on two joint conditions: the binding site motif must be short enough and the promoter region must be long enough. These constraints on promoter architecture are indeed seen in eukaryotic systems. Furthermore, we analyse the adaptive evolution of genetic switches and of signal integration through binding cooperativity between different sites. Experimental tests of this picture involving the statistics of polymorphisms and phylogenies of sites are discussed.
参考文献
Johannes Berg , Stana Willmann and Michael Lassig .
Adaptive evolution of transcription factor binding sites.
BMC Evolutionary Biology 2004, 4:42 doi:10.1186/1471-2148-4-42
http://www.biomedcentral.com/1471-2148/4/42/abstract
PDF: http://www.biomedcentral.com/content/pdf/1471-2148-4-42.pdf

GeneSear: 基因名称与基因组资源的数据库

目前,在不同生物中的基因的研究都是独立鉴定并且命名的,这样就造成大量的基因名称,往往知道基因名称并不能很轻易的找到基因的其他信息如基因序列,在其他物种中的同源物等等。

作者在这篇文章中提到他们做的工作,他们把很多信息综合在一起,构建了一个基因名称翻译数据库。利用这个称作GeneSear的工具可以根据基因名称很快的找到它的其它信息,可以找一个基因在其他物种中是否存在同源物等等。这个工具可以通过http://geneseer.cshl.org/ 地址访问。

参考文献:
Andrew J Olson , Tim Tully and Ravi Sachidanandam
GeneSeer: A sage for gene names and genomic resources.
BMC Genomics 2005, 6:134 doi:10.1186/1471-2164-6-134
http://www.biomedcentral.com/1471-2164/6/134
http://geneseer.cshl.org/