七招读懂基因功能研究方法

日期: 2015年12月18日


    

生命科学的研究有相当大一部分都集中于研究基因及其产物的功能(此处若有弹幕,估计出现一大片复杂、高深、难懂等词)。


不过世上无难事,只怕有心人。我们“从生活中来,到生活中去”,简单粗暴的“七大绝招”和“三板斧”,让你轻松读懂基因功能的研究方法,设计实验、看文献、听学术报告就更不在话下了。

 


无论是学习还是研究,讲究的都是学以致用。学习若与日常生活中熟悉的、简单的事情结合起来理解,就可以化繁为简,化难为易。学到的东西,就该应用到日常生活中去。


那怎样研究基因的功能呢?我们先看看如何研究人的功能。假如你是本校男生,喜欢上了一个“女生”,偏偏TA长得扑朔迷离,既帅气又带有妩媚感。所以,你面临的第一个问题就是:TA到底是男还是女?第二个问题是:TA是不是学生?如果是的话,是本校的吗?因不认识TA的任何朋友,所以也没法打听。为了找出答案,你决定对TA密切留意。你发现,白天的大多数时间,TA去了本校教学楼的教室。下课的时候TA去的是女洗手间,不过以防万一,你还是继续留意她晚上回的是男生宿舍还是女生宿舍。不出所料,她去了本校的女生宿舍。这下你终于放心了:她是本校的一个女生。


因为她去女洗手间和女生宿舍,提示她是女的。因为她白天去本校教室,晚上去本校女生宿舍,提示她是本校女生。上述事例告诉我们:一个人什么时候,在哪里活动可以提示其身份。同样,基因表达的时间和部位,常常可以提示其功能。例如,如果基因A在胚胎发育过程中表达,成年后不表达,则提示该基因与发育有关。基因B在在大脑的海马中表达,而海马与记忆有关,那么这个基因可能与记忆有关。


接下来的问题就是:她是哪个系的?她有什么兴趣爱好?你发现,她有两个形影不离的好朋友,恰好你有有同学认识她们。同学告诉你:她两个好朋友都是中文系的,都喜欢打羽毛球。这时,你基本上就可以认为这个女生是中文系的,爱好之一是羽毛球了。


以上所述可以归纳为三点:天时,地利,人和。“天时”指基因及其产物什么时候表达,“地利”指的是基因及其产物表达于哪个部位。“人和”可以进一步引申为两点:1. 近朱者赤,近墨者黑。就是说一个人会与他经常接近的人相似。基因也是如此,相互作用的一些基因常常具有类似的功能,它们为了完成同一个功能而通力合作。例如,如果实验发现蛋白C与蛋白D相互结合,而基因D是某一信号通路的受体,则基因C可能也是该信号通路的成员。2. 近猪者吃,近墨者喝。就是说一个人不仅会经常接触与自己类似的人,还经常接触自己的工作对象。例如,一个经常与学生接触的人,既可能是学生(近朱者赤),也可能是老师(近猪者吃)。同理,与一个基因接触的其它基因或者物质,也可能是其作用的对象。例如,如果蛋白质F与DNA结合在一起,则提示其对DNA发挥作用,可能参与DNA复制、转录等。


“合”指的是合理。亿万年的进化使不合理的基因基本上都被淘汰了,所以存在的基因其功能必定是合理的,至少具有合理性的一面。合理的表现就是能够促进个体的生存和繁衍。合理遵循两个原则:一,经济原则。生物不会浪费物质和能量在一个无用或者冗余的基因上。凡是一个基因可以实现的功能,没有必要用两个基因。二,有效原则。基因的功能应该促进而不是损害生物的生存和繁衍。根据合理性原则,无需任何实验证据,我们不难想到非编码DNA序列是有用的,不是无用的垃圾。

 


有人说,金钱不是万能的,但是没有金钱是万万不能的。那么,金钱到底有什么作用呢?有两种方法可以知道答案。第一种方法是你去一个陌生的地方,突然钱包被偷,所有的现金、信用卡和可以换钱用的物品都没有了。此时,你就知道钱的作用是什么了。第二种情况是你买彩票突然中了一千万,很快,你也可以知道钱的作用是什么。得到和失去,都可以让我们知道事物和人物的功能,而其中失去更为有效。


得,指的是基因的过表达(Overexpression);失,指的是基因敲除(Knockout)或者低表达(Under-expression)。例如研究的假说是基因A与记忆力呈正相关,那么可以这样设计实验:先过表达基因A,预期结果是记忆力增强,再降低基因A的表达水平,或者完全敲除(如果不是lethal的话),预期结果是记忆力减弱。一个高质量的实验设计,一般应该“患得患失”,两方面的实验都要做。


我们不仅要“患得患失”,还要“斤斤计较”。因为过表达或低表达的水平不同,表型改变可能也不同,甚至看不到表型改变。例如,用RNAi Knockdown一个基因的表达水平的70%也许看不到任何变化,但是Knockdown 90%就能观察到表型改变了。所以,当过表达或者低表达研究基因却没有得到预期结果的时候,就需要考虑基因表达水平的变化是否不足。


有时即使完全敲除一个基因也看不到任何表型的改变,此时也不能下“研究基因与研究表型无关”的结论。这就好比一个桥有十个桥墩,如果只去除掉桥墩4,在非过负荷的情况下,桥可能不会倒塌,可以正常通车。可是,如果先去除掉桥墩5,再去除桥墩4,桥就会倒塌了。我们能够认为桥墩4是无用的吗?当然不能。桥墩在这里好比处于同一个通路具有相似功能的基因,桥是否可以通车好比基因的表型是否正常。所以,在敲除一个基因A看不到表型改变的情况下,可以在基因B(与A的功能具有相似性,或者是上下游的基因)敲除的动物模型上敲除基因A,观察敲除后是否有变化。


有时候,全身性的过表达、低表达或者基因敲除会出现我们不想要的结果。例如,全身性的基因敲除会致命。为了解决这个问题,现已开发出许多种组织特异性和时间特异性的过表达、低表达和基因敲除技术,使得基因调控更加准确。

 


基因需要经过转录为RNA、翻译为蛋白质至少两步才能发挥功能。所以,研究一个基因的功能,就可以在DNA、RNA和蛋白质的水平分别进行研究。DNA的水平相同,不代表RNA的水平相同;同样,RNA的水平相同,不代表在蛋白质的水平相同。哪怕就是在RNA水平,还有不同的剪切的可能。


一个基因翻译成蛋白质之后,常常需要同其它的基因及其产物相互作用才能发挥功能。例如基因S,翻译成蛋白质S,如果它是配体,就需要和受体结合,然后受体激活信号通路。如果S鉴定出来了而其余的通路基因没有鉴定出来,那就可以研究上游的配体和下游的信号通路基因分别是什么。一个转录因子,常常可以激活或抑制一系列基因的表达,究竟可以控制哪些下游基因,也值得研究。蛋白质发挥功能,常常会有正性调控和负性调控因子。从上游来看,哪些基因及其产物可以促进或抑制研究基因的表达水平?具体机制是怎样的?从下游来看,哪些基因及其产物可以增强或者减弱研究基因的功能?具体机制是怎样的?这些都可以研究。


所以,研究一个基因,就可以在不同的表达水平和不同的作用水平上“上下求索”。

 


背井离乡,指的是misexpression,就是在非正常时间、非正常位置、非正常物种(时间、地点、人物)表达一个基因。如果在正常情况下,研究基因具有特定功能,而且在非正常时间、非正常位置和非正常物种间表达的时候同样导致该功能,则我们下“该基因具有该特定功能”的结论就更有把握。


值得注意的是,misexpression不产生预期表型,并不能认为研究基因与该表型无关。因为一个基因发挥作用,需要很多其它基因的帮助。如果misexpression的部位、时间、物种缺乏该基因发挥功能需要的辅助基因,或者多了可以抑制该基因功能的其它基因的表达,则可以导致预期表型无法产生。如果misexpression产生了某一表型,不代表该表型是该基因的正常功能,原因同上。所以,misexpression告诉我们:该基因“可以”做什么,不代表该基因实际上做了什么。打个比方,我们把一个教授放到农村去,他没法接触到做科研需要的设备、文献等,而且迫于生计,他不得不自己种田维持生存。我们能够下结论说:教授的社会职能是种田吗?当然不可以。但是我们可以说:教授是“可以”种田的。

 


体外实验(In vitro)简单便捷,可以很快得到结果。可是,体外实验的条件和体内的情况不一样,体外实验得到的结果一般还需要体内实验(In vivo)来验证。“内外兼修”指的是既做体外实验, 又做体内实验。

 


当你论证一个观点时,可能有人反驳你。一篇好的文章就须提前想到这些反驳,并通过做相应实验设下“埋伏”,反驳这些可能的反驳;此外,还应通过类似实验重复验证来增加结论的可靠性,这就叫做“十面埋伏”。


中医诊治病人,需要“望闻问切”,把四种方法得到的信息综合起来才能做出正确的诊断,这叫“四诊合参”。历史学上有一个说法叫做“孤证不立”,就是说如果只有一条证据支持一个论点,那么这个论点是不可靠的。如果仅仅从一篇文章的角度来考虑,做这么多的实验不是很有必要。


例如,做了第一个实验,结论成立的可能性是80%,做了第二个,可能性上升到95%。可是,科研是积累性的,你的结论是别人推理的基础,你推理的基础则是前人的结论。假如A1引用了你的文章,A2又引用了A1的文章,如此反复一直到A10。如果每篇文章结论正确的概率是80%,则A10文章结论正确的概率是0.8010=10%,如果每篇文章结论正确的概率是95%,则A10文章结论正确的概率是0.9510=60%。差别从一开始的15%,变成6倍了。所以,多做实验增加结论的可靠性,对于科学的长期发展是至关重要的。


看文献的时候,你会发现作者做了一大堆实验,这么多的实验就像唐僧在你耳边念经一样,把你弄得晕头转向。为了提高看文献的效率,一般只看关键实验,次要的实验略过。当你做学术报告时,由于时间有限,只报告关键实验。等到观众提问时,这些次要实验就可以派上用场了。例如,听完你的报告,有听众提问说:“我觉得你的结果还有两种可能的解释,包括....你怎样得出这个结论的呢?”此时,你就可以从容自若的说:“这是一个很好的问题。针对第一种可能,我们做了XX实验,结论不支持这个可能。针对第二种可能,我们做了XX实验,发现。。。”看到了吧?这就是“十面埋伏”的妙处。

 


如上所述,每一个基因都有作用于它的上游基因,也有受它作用的下游基因。每一个上游基因和下游基因又分别有自己的上下游基因。除了上下游基因及其产物,细胞内、机体内的其它物质例如离子等也都会作用于基因自身。用马哲的观点来说就是联系无处不在,无时不有。这些联系构成了一个复杂的网络。目前生命科学的一个发展趋势就是研究基因网络。所以,研究一个基因的功能,还可以构建出它所处的网络。


三板斧:天时地利,患得患失,十面埋伏

 

为了增加适用范围,上面一共总结出了七大绝招,但却不够简练。一个研究或者一篇文章,常常只用到其中的一部分。为了更加简洁,可以总结为最重要的“三板斧”:天时地利,患得患失,十面埋伏。“天时地利”,指的是基因何时何地表达。“患得患失”,其中“患失”比“患得”重要得多。“十面埋伏”,指的是立体论证。基本上,每一个研究都离不开这三板斧,上述文章就是一个很好的例子。而只要学会这三板斧,就可以做大部分科研了。所以,科研也能通俗易懂!


备注:文章图片出自网络(侵删),原文出自解螺旋、医生科研助手,赛业生物编辑整理。

  • 侧边栏广告 - 模式动物成功案例
  • 侧边栏广告 - 科研奖励基金计划
  • 侧边栏广告-积分兑换礼品