随着人类基因组草图与模式生物基因组序列的获得,人们已进入后基因组时代,如何识别出基因组(特别是人类基因组)中的各种基因并采用基因芯片等高通量生物技术来研究这些基因的功能已成为目前的研究热点。然而,在基因识别中,不仅包含编码蛋白质的基因识别,也包含非编码RNA基因(ncRNA基因)的识别。但是,传统的基因预测程序如GeneScan等,仅对基因编码区的识别有效,到目前为此,还没有高效且通用的ncRNA基因的预测算法。 因此,ncRNA基因的预测方法及分类研究具有重要意义:
1、由于ncRNA基因在基因剪接、RNA核苷酸修饰、蛋白质合成、蛋白质转运和基因表达调控等方面起着重要的作用,从基因组(特别是人类基因组)序列中预测出ncRNA基因,对ncRNA基因的结构与功能关系研究具有重要意义;
2、为ncRNA基因的实验研究提供帮助,通过预测手段从庞大的基因组序列中初步识别出ncRNA基因,将使实验研究更具有针对性;
3、近年来随着各种具有重要调控作用的小RNA分子的发现,人们认识了RNA的许多新的功能,但一个基因组中究竟有多少类ncRNA基因,目前仍不清楚,通过ncRNA基因的识别及其分类研究,有可能发现新的ncRNA基因的类别及其在基因表达调控中的作用,从而使人们对基因组的结构与功能的理解登上一个新的台阶。