生物信息学  2019, Vol. 17 Issue (3): 151-160  DOI: 10.12113/j.issn.1672-5565.201812006
0

引用本文 

蔡媛, 钟灿, 刘浩, 金剑, 王勇庆, 张水寒. 植物长链非编码RNA的生物信息学预测与分析研究进展[J]. 生物信息学, 2019, 17(3): 151-160. DOI: 10.12113/j.issn.1672-5565.201812006.
CAI Yuan, ZHONG Can, LIU Hao, JIN Jian, WANG Yongqing, ZHANG Shuihan. Progress of bioinformatics prediction and analysis of long non-coding RNA in plants[J]. Chinese Journal of Bioinformatics, 2019, 17(3): 151-160. DOI: 10.12113/j.issn.1672-5565.201812006.

基金项目

国家自然科学青年基金项目(No.81503197);湖南省自然科学青年基金项目(No.2018JJ3310);湖南省中医药管理局项目(No.201810);湖南省中医药研究院科研计划项目(No.201705)

通信作者

张水寒,女,研究员,研究方向:中药学. E-mail:zhangshuihan@126.com

作者简介

蔡媛,女,助理研究员,研究方向:分子生物学. E-mail:tcmyuanyuan@163.com

文章历史

收稿日期: 2018-12-29
修回日期: 2019-05-06
植物长链非编码RNA的生物信息学预测与分析研究进展
蔡媛 , 钟灿 , 刘浩 , 金剑 , 王勇庆 , 张水寒     
湖南省中医药研究院 中药研究所,长沙 410013
摘要: 长链非编码RNA(Long non-coding RNAs,lncRNAs)是一类广泛存在于真核生物中,长度大于200个核苷酸、无蛋白编码功能, 具有调控基因转录后表达的RNA转录本。新近研究表明,lncRNA在多种生物途径中起着重要调节作用。生物信息学由生物、数学、计算机科学, 统计学等多学科交叉产生,能从全局和系统水平对大数据信息进行深入挖掘与分析。采用生物信息学方法预测与分析lncRNA是当前发现和鉴定植物lncRNA的重要策略之一。本文梳理和总结了近年来采用生物信息学预测植物lncRNA及其靶基因的方法策略,以期为今后深入认知植物lncRNA在植物的生长发育过程、抗逆境胁迫及系统进化等过程中的作用研究提供一定参考。
关键词: 长链非编码RNA    生物信息学    功能预测    
Progress of bioinformatics prediction and analysis of long non-coding RNA in plants
CAI Yuan , ZHONG Can , LIU Hao , JIN Jian , WANG Yongqing , ZHANG Shuihan     
Institute of Traditional Chinese Medicine, Hunan Academy of Traditional Chinese Medicine, Changsha 410013, China
Abstract: Long non-coding RNAs (lncRNAs) widely exist in eukaryotes, which are RNA transcripts expressed by the transcription of regulatory genes with more than 200 nucleotides in length and no protein-coding ability. Numerous studies have shown that lncRNAs play an important role in regulating a variety of biological pathways. Bioinformatics is generated by multiple disciplines including biology, mathematics, computer science, and statistics, which can deeply mine and analyze big data information from the global and system levels. Currently, using bioinformatic method to predict and analyze lncRNA is one of the important strategies for the discovery and identification of plant lncRNA. This paper summarizes and discusses the methodological strategies of bioinformatics for predicting plant lncRNA and its target genes, so as to provide a reference for the future research on the role of plant lncRNAs in plants′ growth and development, stress resistance, and phylogenetic evolution.
Key Words: Long non-coding RNA    Bioinformatics    Functional prediction    

多年来,研究人员对基因组的研究主要聚焦在蛋白质编码基因,其研究思维也一直遵从经典中心法则“DNA-mRNA-蛋白质”。随着人类基因组及其他物种海量基因组的不断解析和深入研究,以及蛋白组学和转录组学的蓬勃发展,促进了RNA组学研究的日趋成熟,揭示高等真核生物的遗传物质只有极小一部分编码蛋白质,绝大部分都不编码蛋白质和多肽,这部分非编码蛋白基因一直被当做“噪音”或者是“垃圾”(Junk)分子[1]。能够编码蛋白的mRNA已经不再独占转录组鳌头,许多不同类型的非编码调控RNA逐一进入研究者的视线,并陆续被证明具有重要的生物学意义。

长链非编码RNA(long non-coding RNA,lncRNA)是在真核生物中新发现的一类长度大于200个核苷酸、没有阅读框架,但往往具有mRNA结构特征(帽式结构和polyA尾巴)的RNA[2-3]。大多数lncRNA由RNA聚合酶Ⅱ转录翻译而来,少数由RNA聚合酶Ⅲ转录而来,以RNA的形式在多种层面上调控基因的表达。lncRNA在基因组中普遍存在转录现象,但较之mRNA往往表达水平比较低,其自身的表达水平也受到转录及转录后调控机制的严密调节。相对于长链非编码RNA在哺乳动物上的研究,植物长链非编码RNA的研究才刚刚开始[4-6]。生物信息学的迅猛发展,改变了传统lncRNA的研究方式,极大地促进了植物lncRNA的研究发展。长链非编码RNA在植物生命活动中发挥着重要的作用,不同类的长链非编码RNA在植物中发挥的功能也不尽相同,主要包括调节生长发育、影响转录调控、染色体结构、mRNA的稳定性与翻译、RNA加工与修饰等[[7-9]。最近获得的基因组序列呈爆炸性地增加,从而激发了用快速、有效和精确的方法组织和获取重要序列以及结构元件的能力需求。新获得的数据显示,迄今为止,一类潜在的重要基因类型我们还没有检测到,有一大类功能RNA分子或隐藏在蛋白质编码之间或位于编码蛋白质区内(内含子中),至今未被注释。然而,任何功能分析中,都不应该遗漏在基因组范围寻找非编码RNA(non-coding RNA)。如何能像发现读码框一样发现没有强烈结构特征的调控RNA,本文就近年来植物中已发现的lncRNA的种类、参与的生物学过程、发挥功能的分子机制及其生物信息学预测与分析进行综述和展望,以期为更深入认识植物lncRNA提供借鉴。

1 植物lncRNA的分类及其生物学功能 1.1 植物lncRNA的分类 1.1.1 按其与编码蛋白基因的相对位置分类

长链非编码RNA根据其在基因组中与蛋白质编码基因的相对位置,一般将其分为正义lncRNA(Sense long non-coding RNA)、反义lncRNA(Antisense long non-coding RNA)、双向lncRNA(Bidirectional long non-coding RNA)、基因内lncRNA(Intronic long non-coding RNA)和基因间lncRNA(Intergenic long non-coding RNA)五类[10]。其中,基因间lncRNA也被称为大型介入性非编码RNA,即lincRNA(Large intervening noncoding RNA),位置关系对于推测其功能具有重要的作用。

1.1.2 按其作用机制分类

按照lncRNA发挥作用的分子机制,Wang等将lncRNA分为了以下四类,即信号分子(Signals)、诱饵分子(Decoys)、引导分子(Guides)、骨架分子(Scaffolds)[11]。Wilusz等[12]总结了生物体内lncRNA的具体机制,包括:(1)在编码蛋白基因的上游启动子区转录,从而干扰邻近蛋白编码基因的表达(如酵母SER3基因)[13];(2)抑制RNA聚合酶Ⅱ,或介导染色质重构和组蛋白修饰,而影响基因表达[14];(3)LncRNA与编码蛋白基因的转录本形成互补双链,干扰mRNA的剪切,进而产生不同的剪切形式[15];(4)LncRNA与编码蛋白基因的转录本形成互补双链,在Dicer酶作用下产生内源性的siRNA,调控基因的表达水平[16];(5)LncRNA结合在特定蛋白质上调节相应蛋白的活性[17];(6)作为结构组分与蛋白质形成核酸蛋白质复合体[18];(7)结合在特定蛋白上从而改变该蛋白的胞质定位[19], 研究者发现,MtEnod40能够与MtRBP1蛋白结合,引导MtRBP1从细胞核的核小点到细胞质颗粒的重定位[20]; (8)可作为小分子RNA(如miRNA)的前体分子[21]。在植物中,有研究表明lncRNA作为小RNA生物合成前体。研究发现水稻光敏雄性不育关键调控基因LDMAR最终被发现通过剪切加工形成了长21 nt的小RNA osa-smR5846w/m。Ding和Zhu等研究显示,1 236 nt长的LDMAR可能是初级转录本,该初级转录本会被加工为一条长136 nt的中间转录本,最终才形成21 nt的小RNA[22-24]

1.2 植物lncRNA的生物学功能

长链非编码RNA的基因不像编码基因那样编码蛋白质,但是它们具有丰富强大的生物学功能。大量数据表明,这些lncRNA可能在从蛋白质分泌到广泛的基因调节细胞过程中起重要作用。它们在诸如剂量补偿、基因印迹、转录调控、前mRNA剪接和mRNA翻译控制等不同的途径中发挥功能[25]。LncRNA在植物生长发育过程中扮演着重要角色,处于基因调控网络的核心位置,调控各种重要生物途径,包括发育、代谢、抗病、胁迫、应激反应、激素信号和维护基因组的完整性等[26-30]。目前,在拟南芥、小麦、水稻、玉米、黄瓜等植物中发现了大量lncRNAs,但是明确其功能机制的不到1%。研究比较透彻的主要集中在生长发育、逆境胁迫、生殖发育等方面。

1.2.1 lncRNA参与植物成花过程

长链非编码RNA引起植物研究人员的兴趣始于lncRNA能够调控春化作用的关键蛋白FLC来实现开花的转变。并且,研究者发现有两种lncRNA参与调节FLC基因,从而参与调节植物的开花过程[28, 31]。在拟南芥中,COOLAIR通过吸引相关蛋白清除FLC上激活型组蛋白甲基标记,引起FLC正向转录本的沉默。COLDAIR则通过结合PcG蛋白复合体使FLC染色质组蛋白抑制型甲基化,引起FLC沉默。这两种长链非编码RNA都通过沉默FLC而参与调节春化过程,影响植物开花的时间。

1.2.2 LncRNA参与植物的胁迫响应

在植物的生长发育过程中,不可避免地受到病害、干旱、磷、盐等胁迫。研究者发现,在逆境胁迫中,lncRNA扮演重要角色。研究者发现Npc536在拟南芥根和叶中调控响应盐胁迫。在盐胁迫下,Npc536的T-DNA插入突变体无明显表型,过表达可以促进在盐胁迫条件下的根系生长,提高初生根的生长和次生根的伸长[32]。另外,在拟南芥中,IPS1和At4是由磷饥饿诱导产生,其可以阻止miR399对靶基因PHO2的抑制作用而调节磷含量的动态平衡[33-35]

1.2.3 LncRNA参与植物的生殖发育

研究者在水稻中筛选到调控水稻光敏性雄性不育的lncRNA-LD MA,该基因是长日照植物特有的雄性生殖相关的lincRNA,在长日照条件下转录表达,是水稻花粉正常发育所需。自发突变系水稻植株改变LDMAR的二级结构,提高LDMAR启动子区域的甲基化程度,从而降低LDMAR转录,尤其是在长日照调节下,导致发育中花药过早的程序性死亡,从而导致PSMS,阐明lncRNA在水稻生殖进程中的重要调控作用[22-24]

2 植物lncRNA的生物信息学预测及策略

目前,植物长链非编码RNA的预测方法主要分为生物信息学方法和实验RNA组学方法。实验RNA组学方法是通过RNA-Seq、构建cDNA数据库、微阵列分析和基因组SELEX等发现lncRNA[36]。高通量测序技术是发现lncRNA的有效方法,可以直接、快速地发现低丰度、新的lncRNA。目前研究中一般首先采用生物信息获得目标序列,然后再进行下一步的功能验证及其机制研究。

生物信息学方法主要是利用某种算法,通过设计筛选标准,建立评分系统,对候选序列进行选择。伴随着物种测序工作的逐步开展和序列信息的日益丰富,利用生物信息学发现和预测lncRNA序列的方法已经成为简单、高效的策略之一。但是大部分策略仅能预测得到保守的lncRNA序列。同时也会出现假阳性序列,需要通过进一步的实验验证,来完善预测和研究。

在众多发现和研究lncRNA的方法中,生物信息学方法以其方便、快速和经济的优势受到许多研究者的青睐[37]。事实证明,生物信息学方法是预测和发现新lncRNA的有效方法,是以基因组序列和计算机程序鉴定为基础[38]。目前,通过各种计算机软件以及其他计算工具已经成功地预测和鉴定了动植物中大多数lncRNA[39-40]

在过去十几年中,人们通过生物信息学手段和分子克隆方法从拟南芥(Arabidopsis thaliana L.)[21, 28, 31-34, 41-53]、水稻(Oryza sativa L.)[22-24, 54-57]、玉米(Zea mays L.)[58-61]、小麦(Triticum aestivum L.)[30]、黄瓜(Cucumis sativus L.)[62]、苜蓿(Medicago truncatula) [63-66]、番茄(Solanum lycopersicum) [67]、大豆(Giycine max) [68]、油菜(Brassica campestris L.) [69-71]等植物中发现了大量的多种类型的lncRNA(见表 1)。

表 1 植物中已报道的lncRNA Table 1 The reported lncRNAs in plants
2.1 植物lncRNA靶基因预测及策略

LncRNA具有多种重要功能,寻找lncRNA靶基因并挖掘它对基因表达、蛋白合成各方面的调控作用成了lncRNA研究的关键。LncRNA靶基因的预测,大致可分为两种情况:已知gene symbol的lncRNA和新发现的lncRNA。对已知gene symbol的lncRNA,可以直接通过软件数据库例如starBase、CHIPBase、NONCODE等,利用gene symbol搜索其相关信息。对于新发现的lncRNA来说,目前现有的数据库物种信息十分有限,数据信息也必将少,所以对于转录本预测出的没有symbol号的新lncRNA,由于lncRNA对靶基因没有固定的作用模式,基因调控可能以顺式(Cis)或反式(Trans)作用发生。所以,可根据不同作用方式分别进行预测,包括顺式作用靶基因预测及反式作用靶基因预测。

顺式作用靶基因预测,认为lncRNA的功能与其坐标临近的蛋白编码基因相关,位于编码蛋白上下游的lncRNA可能与启动子或者共表达基因的其他顺式作用元件有交集,从而在转录或者转录后水平对基因的表达进行调控。判断一个lncRNA具有顺式调控作用通常要同时满足以下几个条件:(1)附近的基因表达情况与其保持一致;(2)该基因失活后会影响周围基因的表达;(3)会影响附近同一位点的基因表达。对于满足以上条件的lncRNA,首先找出位于其上游或者下游附近(10 k)的编码蛋白基因,通过对编码蛋白的功能富集分析,从而预测lncRNA的主要功能,为后续顺式作用分析打下基础。

反式作用靶基因预测基本原理认为lncRNA的功能与编码基因的位置关系没有关系,而与其共表达的蛋白编码基因相关。当lncRNA与一些距离较远的基因在表达量上存在正相关或者负相关的情况时,可以通过样本间lncRNA与蛋白编码基因的表达量相关性分析或共表达分析方法来预测其靶基因。当样本数≥6时,使用Pearson相关系数法分析样本间lncRNA与蛋白编码基因的相关性,对相关性最高的编码基因蛋白进行功能富集分析进而预测lncRNA功能;当样本数≥24时,使用WGCNA方法将表达模式相似的基因聚类得到不同的共表达模块,根据模块内的已知的编码基因功能预测lncRNA的功能。

除了顺式作用和反式作用调控,lncRNA参与调控许多转录后进程时,与miRNA和snoRNA等小RNA类似,这些调控往往与碱基的互补配对有关。一部分反义lncRNA可能因为与正义链的mRNA结合而调控基因沉默、转录及mRNA的稳定性。所以,lncRNA的反义分析,可以利用软件(如RNAplex)预测反义lncRNA与mRNA之间的互补配对关系,根据热力学结构计算最小自由能来预测最佳碱基配对关系。

生物信息学预测还可以通过比较基因组学策略。尽管lncRNA一级和二级结构不完整,但小部分具有保守性,可根据其保守性推测功能。通过与miRNA或蛋白相互作用预测,如通过miRcode算法通过miRNA推测lncRNA,也可通过评估其潜在互作蛋白推测其功能如catRAPID算法。

2.2 植物lncRNA相关数据库及预测工具

随着高通量测序技术的发展,植物lncRNA的研究已经取得显著进展。随着与植物相关的新lncRNA出现,收集归类植物非编码RNA基因相关信息的数据库也开始出现,建立了系列针对植物的lncRNA数据库,如TAIR10、PlantNATsDB, PLncdb等(见表 2)。这些数据库信息的来源主要是通过汇总ChIP-seq、RNA-seq、Tilling array、文献,等其他数据库信息。LncRNAdb(lncRNAs Database)数据库收录了289条真核生物的lncRNA相关信息,包含lncRNA特征、进化保守性、表达、功能、种类、相关组件、序列及对应的文献。与植物相关的包括At4、COOLAIRCOLDAIRAtIPS1、Npc48、Npc536、TERRAOsPI1、OsENOD40、MtENOD40、TPSI1, GmENOD40等16个lncRNA表达情况及相关信息[74]。TAIR10(The Arabidopsis Information Resource)是拟南芥专属数据库[75-76],汇总了拟南芥基因组序列及其基因图谱、序列、表达、功能等,共收录478条lncRNA信息。PlantNATsDB(Plant Natural Antisense Transcripts DataBase)数据库包括2 138 498条反义转录对,其主要用于预测和查询植物天然反转录及其调控功能的数据库[77]。PLncDB(Plant long non-coding RNA database)是目前收录植物lncRNA最齐全的数据库。该数据库通过收集Tilling array、RNA-seq,文献过滤等信息,获得16 227条lncRNA数据,能够提供不同组织、发育阶段、突变体和胁迫处理等应激条件下lncRNA的表达特征,编码位点及其侧翼基因组区域表观遗传变化和功能[78]。NONCODE数据库是专注于分析非编码RNA基因的综合知识平台,所有收入的非编码RNA基因都是采取计算机自动过滤GenBank数据和文献报道中的信息,且经过人工检查确认,共收录423 976条lncRNA信息。可查阅lncRNA的长度、序列信息、生物功能及其表达模式、基因组上下游序列调控元件等[79]。PNRD数据库目前数量约28 214,来自166种物种。包括lncRNA,tRNA,rRNA,tasiRNA,snRNA和snoRNA等。PNRD是一个植物ncRNA综合分析平台,能够提供许多功能搜索和分析工具,涉及ncRNA关键词搜索,基于文献的功能搜索,miRNA-target搜索和在线分析,包括新的miRNA预测工具包,编码潜在计算器工具包,Blast工具和定制的UCSC基因组浏览器[80]。GREENC数据库是基于Wiki数据建立的,可作为植物lncRNA的注释和存档。该数据库于2015年开始提供有关lncRNA的序列,基因组坐标,编码潜力和折叠能量的信息。其中包含来自37种植物和6种藻类的超过19万份转录本的信息[81]。CANTATAdb数据库目前有45 117条lncRNA数据,来源于10个物种。提供序列、RNA-Seq文库中的表达值,基因组位置等信息[82]。而PLNlncRbase数据库是基于系列实验得到的lncRNA形成的数据库[83]。除了不断完善的数据库外,研究者们还开发了系列lncRNA的分析与预测工具,比如PhlyoCSF能够使用CSF评分来计算lncRNA编码潜力[84];CPS使用序列特征和SVM计算lncRNA的蛋白编码潜力[85];CNCI通过分析相邻核苷酸计算lncRNA的编码潜力[86];CPAT使用逻辑回归模型计算lncRNA的蛋白编码潜力,DeepLNC利用深度神经网络预测lncRNAs[87];iSeeRNA使用SVM算法预测lncRNAs[88]。LncRNATargets能够基于核酸热力学预测lncRNAs靶标[89]

表 2 植物lncRNA数据库及预测工具 Table 2 Databases and prediction tools of plant lncRNAs
3 结语与展望

近年来调节转录和翻译的长链非编码RNA的不断发现,使基因组调节的全貌已发生了彻底改变。随着研究的不断深入以及相关理论技术的完善,发现植物中存在一系列特异lncRNA,其数量也在以惊人的速度增加。虽然目前已确定的lncRNAs很多,但对绝大部分lncRNA在生命活动过程中的具体调控机制及功能模式仍不清除。与哺乳动物lncRNA的研究报道相比,有关植物lncRNA的研究还比较落后,目前仅在拟南芥、水稻、小麦、玉米、黄瓜等中对lncRNA进行了初步的系统识别和功能研究,距离完全解释lncRNA的作用机制和生物学功能仍有较大距离。

生物信息学分析作为一种强有力的技术手段,在从实验设计到结果分析等各个层面发挥着不可替代的作用,既能够启迪研究人员设计阶段的预判以少走弯路,也可以从结果分析中挖掘大量的有用信息,起到事半功倍的作用。

总体上来说,目前植物lncRNA的研究还处于初级探索阶段,主要存在以下问题:(1)lncRNA数据库不够完善。与植物lncRNA相关的基因组和蛋白质组数据库寥寥无几;(2)lncRNA功能预测工具不多,针对lncRNA的生物信息学工具少,难以对lncRNA二级结构等进行有效地预测,lncRNA作用机理还不清楚,应用研究领域有限;(3)整体上有关植物lncRNA的新研究方法和预测功能的工具不够,其功能研究的思路和技术不成熟,不能很好地注释lncRNA的调节机制和生物学功能,也不能系统深入地研究lncRNA。在未来的几年里,lncRNA表型的分析和解释将是生物信息学工作者的主要挑战。

针对以上问题,未来在植物中开展lncRNA的相关研究,首先需要不断完善和逐步建立有共同特征的长链非编码RNA文库,它将有助于确认和预测非编码RNA的功能特征;其次需要通过生物信息学结合实验组学的方法深入阐明lncRNAs基因调控机制,挖掘新的植物lncRNAs,并探索其在植物生长发育、逆境胁迫、系统发育、品种改良等方面的功能及机制,这将对成功破解基因组的各种遗传信息,深入了解植物的生命代谢、系统发育等具有十分积极的意义。

参考文献
[1]
CONSORTIUM E P, BIRNEY E, STAMATOYANNOPOULOS J A, et al. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project[J]. Nature, 2007, 447(7146): 799-816. DOI:10.1038/nature05874 (0)
[2]
WANG K C, YANG Y W, LIU B, et al. A long noncoding RNA maintains active chromatin to coordinate homeotic gene expression[J]. Nature, 2011, 472(7341): 120-124. DOI:10.1038/nature09819 (0)
[3]
SCHAUKOWITCH K, KIM T K. Emerging epigenetic mechanisms of long non-coding RNAs[J]. Neuroscience, 2014, 264: 25-38. DOI:10.1016/j.neuroscience.2013.12.009 (0)
[4]
XIAO B, ZHANG X, LI Y, et al. Identification, bioinformatic analysis and expression profiling of candidate mRNA-like non-coding RNAs in Sus scrofa[J]. Journal of Genetics and Genomics, 2009, 36(12): 695-702. DOI:10.1016/S1673-8527(08)60162-9 (0)
[5]
LIU J, JUNG C, XU J, et al. Genome-wide analysis uncovers regulation of long intergenic noncoding RNAs in Arabidopsis[J]. Plant Cell, 2012, 24(11): 4333-4345. DOI:10.1105/tpc.112.102855 (0)
[6]
HEO J B, LEE Y S, SUNG S. Epigenetic regulation by long noncoding RNAs in plants[J]. Science, 2013, 21(6-7): 685-693. DOI:10.1007/s10577-013-9392-6 (0)
[7]
RINN J L, CHANG H Y. Genome regulation by long noncoding RNAs[J]. Annual Review of Biochemistry, 2012, 81(1): 145-166. DOI:10.1146/annurev-biochem-051410-092902 (0)
[8]
GUTTMAN M, RINN J L. Modular regulatory principles of large non-coding RNAs[J]. Nature, 2012, 482(7385): 339-346. DOI:10.1038/nature10887 (0)
[9]
TANG T H, POLACEK N, ZYWICKI M, et al. Identification of novel non-coding RNAs as potential antisense regulators in the archaeon Sulfolobus solfataricus[J]. Molecular Microbiology, 2005, 55(2): 469-481. DOI:10.1111/j.1365-2958.2004.04428.x (0)
[10]
PONTING C P, OLIVER P L, REIK W. Evolution and functions of long noncoding RNAs[J]. Cell, 2009, 136(4): 629-641. DOI:10.1016/j.cell.2009.02.006 (0)
[11]
WANG K C, CHANG H Y. Molecular mechanisms of long noncoding RNAs[J]. Molecular Cell, 2011, 43(6): 904-914. DOI:10.1016/j.molcel.2011.08.018 (0)
[12]
WILUSZ J E, SUNWOO H, SPECTOR D L. Long noncoding RNAs: Functional surprises from the RNA world[J]. Genes & Development, 2009, 23(13): 1494-1504. DOI:10.1101/gad.1800909 (0)
[13]
MARTENS J A, LAPRADE L, WINSTON F. Intergenic transcription is required to repress the Saccharomyces cerevisiae SER3 gene[J]. Nature, 2004, 429(6991): 571-574. DOI:10.1038/nature02538 (0)
[14]
CAMBLONG J, IGLESIAS N, FICKENTSCHER C, et al. Antisense RNA stabilization induces transcriptional gene silencing via histone deacetylation in S. cerevisiae[J]. Cell, 2007, 131(4): 706-717. DOI:10.1016/j.cell.2007.09.014 (0)
[15]
ANNILO T, KEPP K, LAAN M. Natural antisense transcript of natriuretic peptide precursor A (NPPA): Structural organization and modulation of NPPA expression[J]. BMC Molecular Biology, 2009, 10(1): 81. DOI:10.1186/1471-2199-10-81 (0)
[16]
OGAWA Y, SUN B K, LEE J T. Intersection of the RNA Interference and X-Inactivation Pathways[J]. Science, 2008, 320(5881): 1336-1341. DOI:10.1126/science.1157676 (0)
[17]
FENG J, BI C, CLARK B S, et al. The Evf-2 noncoding RNA is transcribed from the Dlx-5/6 ultraconserved region and functions as a Dlx-2 transcriptional coactivator[J]. Genes & Development, 2006, 20(11): 1470-1484. DOI:10.1101/gad.1416106 (0)
[18]
FOX A H, LAM Y W, LEUNG A K, et al. Paraspeckles: A novel nuclear domain[J]. Current Biology, 2002, 12(1): 13-25. DOI:10.1016/S0960-9822(01)00632-7 (0)
[19]
WILLINGHAM A T, ORTH A P, BATALOV S, et al. A strategy for probing the function of noncoding RNAs finds a repressor of NFAT[J]. Science, 2005, 309(5740): 1570-1573. DOI:10.1126/science.1115901 (0)
[20]
CAMPALANS A, KONDOROSI A, CRESPI M. Enod40, a short open reading frame-containing mRNA, induces cytoplasmic localization of a nuclear RNA binding protein in Medicago truncatula[J]. Plant Cell, 2004, 16(4): 1047-1059. DOI:10.1105/tpc.019406 (0)
[21]
HIRSCH J, LEFORT V, VANKERSSCHAVER M, et al. Characterization of 43 non-protein-coding mRNA genes in Arabidopsis, including the MIR162a-derived transcripts[J]. Plant Physiology, 2006, 140(4): 1192. DOI:10.1104/pp.105.073817 (0)
[22]
DING J, LU Q, OUYANG Y, et al. A long noncoding RNA regulates photoperiod-sensitive male sterility, an essential component of hybrid rice[J]. Proceedings of the National Academy of Sciences of the United States of America, 2012, 109(7): 2654-2659. DOI:10.1073/pnas.1121374109 (0)
[23]
ZHOU H, LIU Q, LI J, et al. Photoperiod-and thermo-sensitive genic male sterility in rice are caused by a point mutation in a novel noncoding RNA that produces a small RNA[J]. Cell Research, 2012, 22(4): 649-660. DOI:10.1038/cr.2012.28 (0)
[24]
ZHU D, DENG X W. A non-coding RNA locus mediates environment-conditioned male sterility in rice[J]. Cell Research, 2012, 22(5): 791-792. DOI:10.1038/cr.2012.43 (0)
[25]
HEO J B, SUNG S. Vernalization-mediated epigenetic silencing by a long intronic noncoding RNA[J]. Science, 2011, 331(6013): 76-79. DOI:10.1126/science.1197349 (0)
[26]
SECCO D, BAUMANN A, POIRIER Y. Characterization of the rice PHO1 gene family reveals a key role for OsPHO1;2 in phosphate homeostasis and the evolution of a distinct clade in dicotyledons[J]. Plant Physiology, 2010, 152(3): 1693-1704. DOI:10.1104/pp.109.149872 (0)
[27]
JABNOUNE M, SECCO D, LECAMPION C, et al. A Rice cis-natural antisense RNA acts as a translational enhancer for its cognate mRNA and contributes to phosphate homeostasis and plant fitness[J]. Plant Cell, 2013, 25(10): 4166-4182. DOI:10.1105/tpc.113.116251 (0)
[28]
SWIEZEWSKI S, LIU F, MAGUSIN A, et al. Cold-induced silencing by long antisense transcripts of an Arabidopsis Polycomb target[J]. Nature, 2009, 462(7274): 799-802. DOI:10.1038/nature08618 (0)
[29]
ZHU Q H, STEPHEN S, TAYLOR J, et al. Long noncoding RNAs responsive to Fusarium oxysporum infection in Arabidopsis thaliana[J]. New Phytologist, 2014, 201(2): 574-584. DOI:10.1111/nph.12537 (0)
[30]
XIN M, YU W, YAO Y, et al. Identification and characterization of wheat long non-protein coding RNAs responsive to powdery mildew infection and heat stress by using microarray analysis and SBS sequencing[J]. BMC Plant Biology, 2011, 11(1): 1-13. DOI:10.1186/1471-2229-11-61 (0)
[31]
HELLIWELL C A, ROBERTSON M, FINNEGAN E J, et al. Vernalization-repression of Arabidopsis FLC requires promoter sequences but not antisense transcripts[J]. Plos One, 2011, 6(6): 240-247. DOI:10.1371/journal.pone.0021513 (0)
[32]
AMOR B B, WIRTH S, MERCHAN F, et al. Novel long non-protein coding RNAs involved in Arabidopsis differentiation and stress responses[J]. Genome Research, 2012, 19(1): 57. DOI:10.1101/gr.080275.108 (0)
[33]
MARTIN A C, DEL P J J, RUBIO V, et al. Influence of cytokinins on the expression of phosphate starvationresponsive genes in Arabidopsis[J]. Plant Journal, 2010, 24(5): 559-567. DOI:10.1046/j.1365-313x.2000.00893.x (0)
[34]
HEUNGSOP S, HWA-SOO S, RUJIN C, et al. Loss of At4 function impacts phosphate distribution between the roots and the shoots during phosphate starvation[J]. Plant Journal for Cell & Molecular Biology, 2010, 45(5): 712-726. DOI:10.1111/j.1365-313X.2005.02629.x (0)
[35]
FRANCO-ZORRILLA J M, VALLI A, TODESCO M, et al. Target mimicry provides a new mechanism for regulation of microRNA activity[J]. Nature Genetics, 2007, 39(8): 1033-1037. DOI:10.1038/ng2079 (0)
[36]
LUKASHIN A, BORODOVSKY M. GeneMark.hmm: New solutions for gene finding[J]. Nucleic Acids Research, 1998, 26(4): 1107-1115. DOI:10.1093/nar/26.4.1107 (0)
[37]
LETIZIA D S, ANTONELLA B, ANDREA M. Bioinformatics tools and novel challenges in long non-coding RNAs (lncRNAs) functional analysis[J]. International Journal of Molecular Sciences, 2011, 13(1): 97-114. DOI:10.3390/ijms13010097 (0)
[38]
CHARNY P, NAMHEE Y, IKJUNG C, et al. lncRNAtor: A comprehensive resource for functional investigation of long non-coding RNAs[J]. Bioinformatics, 2014, 30(17): 2480-2485. DOI:10.1093/bioinformatics/btu325 (0)
[39]
YANG X, GAO L, GUO X, et al. A network based method for analysis of lncrna-disease associations and prediction of lncRNAs implicated in diseases[J]. Plos One, 2014, 9(1): e87797. DOI:10.1371/journal.pone.0087797 (0)
[40]
YE S, YANG L, ZHAO X, et al. Bioinformatics method to predict two regulation mechanism: TF-miRNA-mRNA and lncRNA-miRNA-mRNA in pancreatic cancer[J]. Cell Biochemistry & Biophysics, 2014, 70(3): 1849-1858. DOI:10.1007/s12013-014-0142-y (0)
[41]
KHANG A P C, DENNIS E S, WANG M B. Analysis of argonaute 4-associated long non-coding RNA in Arabidopsis thaliana sheds novel insights into gene regulation through RNA-directed DNA methylation[J]. Genes, 2017, 8(8): 198. DOI:10.3390/genes8080198 (0)
[42]
SEVERING E, FAINO L, JAMGE S, et al. Arabidopsis thaliana ambient temperature responsive lncRNAs[J]. BMC Plant Biology, 2018, 18(1): 145. DOI:10.1186/s12870-018-1362-x (0)
[43]
鲁志, 吴玥, 邸超. 拟南芥全基因组范围的non-polyA lncRNA检测[J]. 清华大学学报(自然科学版), 2014, 54(8): 1117-1121.
LU Zhi, WU Yue, DI Chao. Genome-wide identification of non-polyA lncRNAs in Arabidopsis thaliana[J]. Journal of Tsinghua University, 2014, 54(8): 1117-1121. DOI:10.16511/j.cnki.qhdxxb.2014.08.003 (0)
[44]
ROWLEY M J, BÖHMDORFER G, WIERZBICKI A T. Analysis of long non-coding RNAs produced by a specialized RNA polymerase in Arabidopsis thaliana[J]. Methods, 2013, 63(2): 160. DOI:10.1016/j.ymeth.2013.05.006 (0)
[45]
YAMAGUCHI A, ABE M. Regulation of reproductive development by non-coding RNA in Arabidopsis: To flower or not to flower[J]. Journal of Plant Research, 2012, 125(6): 693-704. DOI:10.1007/s10265-012-0513-7 (0)
[46]
QIN T, ZHAO H, CUI P, et al. A nucleus-localized long non-coding RNA enhances drought and salt stress tolerance[J]. Plant Physiology, 2017, 175(3): 1321. DOI:10.1104/pp.17.00574 (0)
[47]
YUAN J, YE Z, DONG J, et al. Systematic characterization of novel lncRNAs responding to phosphate starvation in Arabidopsis thaliana[J]. BMC Genomics, 2016, 17(1): 655. DOI:10.1186/s12864-016-2929-2 (0)
[48]
WU J, OKADA T, FUKUSHIMA T, et al. A novel hypoxic stress-responsive long non-coding RNA transcribed by RNA polymerase Ⅲ in Arabidopsis[J]. RNA Biology, 2012, 9(3): 302-313. DOI:10.4161/rna.19101 (0)
[49]
VRBSKY J, AKIMCHEVA S, WATSON J M, et al. siRNA-Mediated methylation of Arabidopsis Telomeres[J]. Plos Genetics, 2010, 6(6): e1000986. DOI:10.1371/journal.pgen.1000986 (0)
[50]
KINDGREN P, ARD R, IVANOV M, et al. Transcriptional read-through of the long non-coding RNA SVALKA governs plant cold acclimation[J]. Nature Communications, 2018, 9(1): 4561. DOI:10.1038/s41467-018-07010-6 (0)
[51]
ZHAO Xinyue, LI Jingrui, LIAN Bi, et al. Global identification of Arabidopsis lncRNAs reveals the regulation of MAF4 by a natural antisense RNA[J]. Nature Communications, 2018, 9(1): 5056. DOI:10.1038/s41467-018-07500-7 (0)
[52]
WUNDERLICH M, GROß-HARDT R, SCHÖFFL F. Heat shock factor HSFB2a involved in gametophyte development of Arabidopsis thaliana and its expression is controlled by a heat-inducible long non-coding antisense RNA[J]. Plant Molecular Biology, 2014, 85(6): 541-550. DOI:10.1007/s11103-014-0202-0 (0)
[53]
SEO J S, SUN H X, PARK B S, et al. ELF18-Induced long noncoding RNA associates with Mediator to enhance expression of innate immune response genes in Arabidopsis[J]. Plant Cell, 2017, 29(5): 1024-1038. DOI:10.1105/tpc.16.00886 (0)
[54]
WASAKI J, YONETANI R, SHINANO T, et al. Expression of the OsPI1 gene, cloned from rice roots using cDNA microarray, rapidly responds to phosphorus status[J]. New Phytologist, 2003, 158(2): 239-248. DOI:10.1046/j.1469-8137.2003.00748.x (0)
[55]
KOUCHI H, TAKANE K, SO R B, et al. Rice ENOD40: Isolation and expression analysis in rice and transgenic soybean root nodules[J]. Plant Journal, 1999, 18(2): 121-129. DOI:10.1046/j.1365-313X.1999.00432.x (0)
[56]
LIU X, LI D, ZHANG D, et al. A novel antisense long noncoding RNA, TWISTED LEAF, maintains leaf blade flattening by regulating its associated sense R2R3-MYB gene in rice[J]. New Phytologist, 2018, 218(D1): 774-788. DOI:10.1111/nph.15023 (0)
[57]
FAN Y, YANG J, MATHIONI S M, et al. PMS1T, producing phased small-interfering RNAs, regulates photoperiod-sensitive male sterility in rice[J]. Proceedings of the National Academy of Sciences of the United States of America, 2016, 113(52): 15144. DOI:10.1073/pnas.1619159114 (0)
[58]
BOERNER S, MCGINNIS K M. Computational identification and functional predictions of long noncoding RNA in Zea mays[J]. Plos One, 2012, 7(8): e43047. DOI:10.1371/journal.pone.0043047 (0)
[59]
LI L, EICHTEN S R, SHIMIZU R, et al. Genome-wide discovery and characterization of maize long non-coding RNAs[J]. Genome Biology, 2014, 15(2): R40. DOI:10.1186/gb-2014-15-2-r40 (0)
[60]
DAI X Y, YU J J, ZHAO Q, et al. Non-coding RNA for ZM401, a pollen-specific gene of Zea mays[J]. Acta Botanica Sinica, 2004, 46(4): 497-504. DOI:10.1002/jcb.21807 (0)
[61]
HAAG J R, PIKAARD C S. Multisubunit RNA polymerases Ⅳ and Ⅴ: Purveyors of non-coding RNA for plant gene silencing[J]. Nature Reviews Molecular Cell Biology, 2011, 12(8): 483-492. DOI:10.1038/nrm3152 (0)
[62]
CHO J, KOO D H, NAM Y W, et al. Isolation and characterization of cDNA clones expressed under male sex expression conditions in a monoecious cucumber plant (Cucumis sativus L. cv. Winter Long)[J]. Euphytica, 2005, 146(3): 271-281. (0)
[63]
WEN J, PARKER B J, WEILLER G F. In silico identification and characterization of mRNA-like noncoding transcripts in Medicago truncatula[J]. Silico Biology, 2007, 7(4-5): 485. DOI:10.1617/s11527-009-9500-4 (0)
[64]
CRESPI M D, JURKEVITCH E, POIRET M, et al. enod40, a gene expressed during nodule organogenesis, codes for a non-translatable RNA involved in plant growth[J]. Embo Journal, 1994, 13(21): 5099-5112. DOI:10.1002/j.1460-2075.1994.tb06839.x (0)
[65]
BURLEIGH S H, HARRISON M J. The down-regulation of Mt4-like genes by phosphate fertilization occurs systemically and involves phosphate translocation to the shoots[J]. Plant Physiology, 1999, 119(1): 241-248. DOI:10.2307/4278617 (0)
[66]
BURLEIGH S M, HARRISON M J. Characterization of the Mt4 gene from Medicago truncatula[J]. Gene, 1998, 216(1): 47-53. DOI:10.1016/s0378-1119(98)00326-6 (0)
[67]
LIU C, MUCHHAL U S, RAGHOTHAMA K G. Differential expression of TPS11, a phosphate starvation-induced gene in tomato[J]. Plant Molecular Biology, 1997, 33(5): 867-874. DOI:10.1023/A:1005729309569 (0)
[68]
YANG W C, KATINAKIS P, HENDRIKS P, et al. Characterization of GmENOD40, a gene showing novel patterns of cell-specific expression during soybean nodule development[J]. Plant Journal, 1993, 3(4): 573-585. DOI:10.1046/j.1365-313X.1993.03040573.x (0)
[69]
SONG Jianghua, CAO Jiashu, YU Xiaolin, et al. BcMF11, a putative pollen-specific non-coding RNA from Brassica campestris ssp. chinensis[J]. Journal of Plant Physiology, 2007, 164(8): 1097-1100. DOI:10.1016/j.jplph.2006.10.002 (0)
[70]
SONG Jianghua, CAO Jiashu, WANG Chenggang. BcMF11, a novel non-coding RNA gene from Brassica campestris, is required for pollen development and male fertility[J]. Plant Cell Reports, 2013, 32(1): 21-30. DOI:10.1007/s00299-012-1337-6 (0)
[71]
ZHANG Fang, DONG Heng, LIU Yanhong, et al. BcMF11 and its homologous sequences may form a lncRNA family in Brassica diploids[J]. Acta Physiologiae Plantarum, 2018, 40(4): 65. DOI:10.1007/s11738-018-2640-9 (0)
[72]
ARIEL F, JEGU T, LATRASSE D, et al. Noncoding transcription by alternative RNA polymerases dynamically regulates an auxin-driven chromatin loop[J]. Molecular Cell, 2014, 55(3): 383-396. DOI:10.1016/j.molcel.2014.06.011 (0)
[73]
WANG Yuqiu, FAN Xiuduo, LIN Fang, et al. Arabidopsis noncoding RNA mediates control of photomorphogenesis by red light[J]. Proceedings of the National Academy of Sciences of the United States of America, 2014, 111(28): 10359-10364. DOI:10.1073/pnas.1409457111 (0)
[74]
AMARAL P P, CLARK M B, GASCOIGNE D K, et al. lncRNAdb: A reference database for long noncoding RNAs[J]. Nucleic Acids Research, 2011, 39(Database issue): 146-151. DOI:10.1093/nar/gkq1138 (0)
[75]
LAMESCH P, BERARDINI T Z, LI D, et al. The Arabidopsis information resource (TAIR): Improved gene annotation and new tools[J]. Nucleic Acids Research, 2012, 40(Database issue): 1202-1210. DOI:10.1093/nar/gkr1090 (0)
[76]
SWARBRECK D, WILKS C, LAMESCH P, et al. The Arabidopsis Information Resource (TAIR): Gene structure and function annotation[J]. Nucleic Acids Research, 2008, 36(Database issue): D1009. DOI:10.1093/nar/gkm965 (0)
[77]
CHEN Dijun, YUAN Chunhui, ZHANG Jian, et al. PlantNATsDB: A comprehensive database of plant natural antisense transcripts[J]. Nucleic Acids Research, 2012, 40(Database issue): D1187-1193. DOI:10.1093/nar/gkr823 (0)
[78]
JIN Jingjing, LIU Jun, WANG Huan, et al. PLncDB: Plant long non-coding RNA database[J]. Bioinformatics, 2013, 29(8): 1068-1071. DOI:10.1093/bioinformatics/btt107 (0)
[79]
BU Dechao, YU Kuntao, SUN Silong, et al. NONCODE v3.0: Integrative annotation of long noncoding RNAs[J]. Nucleic Acids Research, 2012, 40(Database issue): D210-D215. DOI:10.1093/nar/gkr1175 (0)
[80]
YI Xin, ZHANG Zhenhai, LING Yi, et al. PNRD: A plant non-coding RNA database[J]. Nucleic Acids Research, 2015, 43(Database issue): D982-989. DOI:10.1093/nar/gku1162 (0)
[81]
PAYTUVÍ GALLART A, HERMOSO PULIDO A, ANIAR MARTINEZ D L I, et al. GREENC: A Wiki-based database of plant lncRNAs[J]. Nucleic Acids Research, 2016, 44(Database issue): D1161-D1166. DOI:10.1093/nar/gkv1215 (0)
[82]
SZCZEŚNIAK M W, ROSIKIEWICZ W, MAKAŁOWSKA I. CANTATAdb: A collection of plant long non-coding RNAs[J]. Plant & Cell Physiology, 2015, 57(1): e8. DOI:10.1093/pcp/pcv201 (0)
[83]
XUAN Hongdong, ZHANG Linzhong, LIU Xueshi, et al. PLNlncRbase: A resource for experimentally identified lncRNAs in plants[J]. Gene, 2015, 573(2): 328-332. DOI:10.1016/j.gene.2015.07.069 (0)
[84]
LIN M F, JUNGREIS I, KELLIS M. PhyloCSF: A comparative genomics method to distinguish protein-coding and non-coding regions[J]. Bioinformatics, 2011, 27(13): i275-i282. DOI:10.1093/bioinformatics/btr209 (0)
[85]
KONG Lei, ZHANG Yong, YE Zhiqiang, et al. CPC: Assess the protein-coding potential of transcripts using sequence features and support vector machine[J]. Nucleic Acids Research, 2007, 35(Web Server issue): W345. DOI:10.1093/nar/gkm391 (0)
[86]
SUN Liang, LUO Haitao, BU Dechao, et al. Utilizing sequence intrinsic composition to classify protein-coding and long non-coding transcripts[J]. Nucleic Acids Research, 2013, 41(17): e166-e166. DOI:10.1093/nar/gkt646 (0)
[87]
TRIPATHI R, PATEL S, KUMARI V, et al. DeepLNC, a long non-coding RNA prediction tool using deep neural network[J]. Network Modeling Analysis in Health Informatics & Bioinformatics, 2016, 5(1): 21. DOI:10.1007/s13721-016-0129-2 (0)
[88]
SUN Kun, CHEN Xiaona, JIANG Peiyong, et al. iSeeRNA: Identification of long intergenic non-coding RNA transcripts from transcriptome sequencing data[J]. BMC Genomics, 2013, 14(S2): S7. DOI:10.1186/1471-2164-14-S2-S7 (0)
[89]
HU Ruifng, SUN Xiaobo. Lncrnatargets: A platform for lncrna target prediction based on nucleic acid thermodynamics[J]. Journal of Bioinformatics and Computational Biology, 2016, 14(04): 1650016. DOI:10.1142/S0219720016500165 (0)
[90]
DESHPANDE S, SHUTTLEWORTH J, YANG J, et al. PLIT: An alignment-free computational tool for identification of long non-coding RNAs in plant transcriptomic datasets[J/OL]. http://xueshu.baidu.com/usercenter/paperj.compbiomed.2018.12.014. DOI: 10.1016/j.compbiomed.2018.12.014. (0)