【文献解析-棉纤维形成全转录组】转录组保留序列揭示了棉花(Gossypium hirsutum L.)中棉绒和绒毛纤维的形成

  • 2019-12-10 13:31:59
  • 106
  • 0

关键词Cotton fiber; lint; fuzz; lncRNA; circRNAs; transcription factor 

英文题目:Transcriptomic repertoires depict the initiation of lint and fuzz fibers in cotton (Gossypium hirsutum L.)

 

  名:Plant biotechnology journal  发表时间:2018.04   IF6.84

作者单位华中农业大学

测序产品:全转录测序(去除miRNA)             

样品来源:棉花

文章类型:研究型

 

英文摘要

 

Cotton fiber is an important natural fiber for the textile industry. The number of fiber initials determines the lint percentage, which is an important factor for cotton fiber yield. Although fiber development has been described by transcriptomic analysis, the mechanism by which the long non-coding RNA manipulate the initiation of lint and fuzz fibers remains unknown. In this study, three lines with different lint percentages were developed by crossing Xu142 with its fiberless mutant Xu142 fl. We collected the epidermal cells from the ovules with attached fibers at 0 and 5 days post-anthesis (DPA) from Xu142, the fiberless mutant Xu142 fl and the three lint percent diversified lines for deep transcriptome sequencing. A total of 2,641 novel genes, 35,802 long non-coding RNAs (lncRNAs) and 2,262 circular RNAs (circRNAs) were identified, of which 645 lncRNAs were preferentially expressed in the fiberless mutant Xu142 fl and 651 lncRNAs were preferentially expressed in the fiber-attached lines. We demonstrated the functional roles of the three lncRNAs in fiber development via a virus-induced gene silencing (VIGS) system. Our results showed that silencing XLOC_545639 and XLOC_039050 in Xu142 fl increased the number of fiber initials on the ovules, but silencing XLOC_079089 in Xu142 resulted in a short fiber phenotype. This study established the transcriptomic repertoires in cotton fiber initiation and provided evidence for the potential functions of lncRNAs in fiber development.

 

研究背景

 

棉纤维是纺织工业重要的天然纤维。纤维初始值的多少决定着棉纤维的成绒率,是影响棉纤维产量的重要因素。尽管已经通过转录组学分析描述了纤维的发育,但是长的非编码RNA操纵棉绒和绒毛纤维起始的机制仍然未知。在这项研究中,通过将Xu142与其无纤维突变体Xu142 fl杂交,形成了具有不同绒毛百分比的三条品系。我们在花后05天(DPA)从Xu142,无纤维突变体Xu142 fl和三个绒毛百分比多样的品系中,从附有纤维的胚珠中收集表皮细胞,用于深转录组测序。总共鉴定出2,641个新基因,35,802个长非编码RNAlncRNA)和2,262个环状RNAcircRNA),其中645lncRNAs在无纤维突变体Xu142 fl中优先表达,651lncRNAs在纤维附着系中优先表达。我们通过病毒诱导的基因沉默(VIGS)系统展示了三种lncRNA在纤维发育中的功能作用。我们的结果表明,使Xu142 fl中的XLOC_545639XLOC_039050沉默会增加胚珠上纤维初始值的数量,但使Xu142中的XLOC_079089沉默会导致短纤维表型。这项研究建立了棉花纤维起始的转录组库,并为lncRNAs在纤维发育中的潜在功能提供了证据。

 

实验设计

关键词Cotton fiber; lint; fuzz; lncRNA; circRNAs; transcription factor 

中文题目:转录组保留序列揭示了棉花(Gossypium hirsutum L.)中棉绒和绒毛纤维的形成

英文题目:Transcriptomic repertoires depict the initiation of lint and fuzz fibers in cotton (Gossypium hirsutum L.)

 

  名:Plant biotechnology journal  发表时间:2018.04   IF6.84

作者单位华中农业大学

测序产品:全转录测序(去除miRNA)             

样品来源:棉花

文章类型:研究型

 

英文摘要

 

Cotton fiber is an important natural fiber for the textile industry. The number of fiber initials determines the lint percentage, which is an important factor for cotton fiber yield. Although fiber development has been described by transcriptomic analysis, the mechanism by which the long non-coding RNA manipulate the initiation of lint and fuzz fibers remains unknown. In this study, three lines with different lint percentages were developed by crossing Xu142 with its fiberless mutant Xu142 fl. We collected the epidermal cells from the ovules with attached fibers at 0 and 5 days post-anthesis (DPA) from Xu142, the fiberless mutant Xu142 fl and the three lint percent diversified lines for deep transcriptome sequencing. A total of 2,641 novel genes, 35,802 long non-coding RNAs (lncRNAs) and 2,262 circular RNAs (circRNAs) were identified, of which 645 lncRNAs were preferentially expressed in the fiberless mutant Xu142 fl and 651 lncRNAs were preferentially expressed in the fiber-attached lines. We demonstrated the functional roles of the three lncRNAs in fiber development via a virus-induced gene silencing (VIGS) system. Our results showed that silencing XLOC_545639 and XLOC_039050 in Xu142 fl increased the number of fiber initials on the ovules, but silencing XLOC_079089 in Xu142 resulted in a short fiber phenotype. This study established the transcriptomic repertoires in cotton fiber initiation and provided evidence for the potential functions of lncRNAs in fiber development.

 

研究背景

 

棉纤维是纺织工业重要的天然纤维。纤维初始值的多少决定着棉纤维的成绒率,是影响棉纤维产量的重要因素。尽管已经通过转录组学分析描述了纤维的发育,但是长的非编码RNA操纵棉绒和绒毛纤维起始的机制仍然未知。在这项研究中,通过将Xu142与其无纤维突变体Xu142 fl杂交,形成了具有不同绒毛百分比的三条品系。我们在花后05天(DPA)从Xu142,无纤维突变体Xu142 fl和三个绒毛百分比多样的品系中,从附有纤维的胚珠中收集表皮细胞,用于深转录组测序。总共鉴定出2,641个新基因,35,802个长非编码RNAlncRNA)和2,262个环状RNAcircRNA),其中645lncRNAs在无纤维突变体Xu142 fl中优先表达,651lncRNAs在纤维附着系中优先表达。我们通过病毒诱导的基因沉默(VIGS)系统展示了三种lncRNA在纤维发育中的功能作用。我们的结果表明,使Xu142 fl中的XLOC_545639XLOC_039050沉默会增加胚珠上纤维初始值的数量,但使Xu142中的XLOC_079089沉默会导致短纤维表型。这项研究建立了棉花纤维起始的转录组库,并为lncRNAs在纤维发育中的潜在功能提供了证据。

 

实验设计




研究结果

 

1. 通过将Xu142Xu142 fl杂交形成不同纤维百分比的棉系

 

为了剖析纤维萌发的分子机制,将无纤维棉突变体Xu142 fl与野生型品种Xu142杂交,产生F2植物,该植物表现出纤维的表型变异。收集了三个具有不同纤维表型的代表性品系进行分析,包括LF,LMLL。棉绒和绒毛并存的棉LF系的种子与母系Xu142相似。 LM棉绒无绒毛,LL系种子的棉绒较少,无绒毛。这三行自交至第十代,LFLL品系成为纯品系,后代没有分离,但LM品系总是产生包含LF,LMLL所有纤维表型的世代,类似于F2种群。为了分析控制LM纤维表型的基因数目,在田间种植了从第十代LM系的一株单株中收集的251个种子,并从每株单株中收集了附着有纤维的成熟种子。表型特征表明,分别将5613164种植物分类为LFLMLL表型,这符合孟德尔遗传定律,比例为121。这表明棉绒无绒毛表型可能受一个或多个连锁基因控制。进一步的分析表明,三株系的种子指数没有显着差异。 LL纤维指数和纤维百分比明显低于LMLF,并且LF纤维指数和纤维百分比高于LM(图1c)。这些结果表明,LL,LMLF系是研究棉纤维发育机理的优良材料。

 


2. LLLMLF及其亲本Xu142Xu142 fl中纤维萌发的观察

 

为了确定LL,LMLF品系之间纤维起始的差异,收集来自这三品系及其亲本品系Xu142,Xu142 fl-101 DPA胚珠,以使用扫描电子显微镜(SEM)进行观察。结果表明,在所有样品的-1 DPA胚珠表皮中均未发现纤维发生。棉纤维起始于0 DPA,伸长于1 DPA。纤维在LF胚珠周围的表面是正常的,类似于其亲本Xu142。然而,在LM的表皮中纤维发生的数量减少,并且在LL的表皮中仅发现少数纤维发生。在Xu142 fl中未发现纤维发生现象。此外,在Xu142LF中纤维伸长正常,但在LMLL中纤维伸长延迟,而在Xu142 fl突变体中未观察到纤维伸长。

 





3. 转录组测序

 

为了建立棉花纤维起始过程中的转录组库,通过使用表皮细胞与附着在0 DPA5 DPA处的表皮细胞(来自Xu142LF,LM,LLXu142 fl)进行了完整的转录组链特异性RNA测序(ssRNA-seq)分析。在针对TM-1的基因组序列进行比对后,发现这些样品中大约有87。27%〜92。20的基因被比对,其中约17.94%〜21。19%是多重比对,而69.18%〜75.19%是唯一比对。为了揭示这些品系中的转录组相似性,基于每个转录本的表达模式和水平,将每个样品的所有转录本用于聚类分析。结果表明,来自LLLMLFXu1420 DPA样品的转录组聚在一起。但Xu142 fl 0 DPA聚类为5 DPA组,这可能是由于Xu142 fl的胚珠上没有纤维起始,另一方面,LL,LMXu142 fl5 DPA样本也没有纤维起始,因此我们推测来自Xu142 fl0 DPA5 DPA的样本聚在一起,可能是因为它们都没有纤维起始导致

分析每个样品中表达的基因数目以鉴定特异性表达的基因。我们发现大多数基因在五个样本的0 DPA41,793 / 49,876)和5 DPA40,302 / 50,468)组中共表达。在24个样本中表达的基因数量在0 DPA样本中为81556个,在5 DPA中为831306个。仅在一个05 DPA样品中特异性表达了从3361,737的数百个基因。

 



4. 新转录区域的发现

 

鉴定了包含4,120个转录本的2,641个新基因。我们发现74%的基因(1954 / 2,641)仅具有一个转录本,13.5%的基因(358 / 2,641)具有两个转录本,12.5%的基因(329/2641)具有两个以上的转录本。

新基因的整体表达水平远低于注释基因。 TCONS_00681513位于D0940684355-D0940687255的棉花基因组区域,并在所有样品中表达,在Xu142_0Xu142_5中具有高表达水平。这表明这些新的转录本可能在棉花纤维发育过程中起重要作用,从而补充了棉花基因组信息。

注释的和新的转录本之间的转录本长度的比较显示,新的转录本比注释的转录本短。另外,我们发现26.7%的注释基因和49.8%的新基因位于与转座子相关的区域(TE-),这表明许多新基因与TE关联。少数具有低表达水平的转录物难以测序和预测。

 

5. lncRNAcircRNA的鉴定

 

为了鉴定lncRNA,将通过转录本组装发现的新转录本进行潜在的编码测试。发现新的编码转录本占大部分(> 60%),其余为新的非编码转录本(3040%)。对于0 DPA5 DPA样品,每个样品中新编码或非编码转录本的比例均相似。在每个样品中鉴定出lncRNA转录物。大多数lncRNA基因只能转录一个转录本,因此转录本的总数比lncRNA基因的总数略大。这些lncRNA中的大多数是lincRNA87.8%),而lncNAT仅占9。7%。

我们还在样品中鉴定了circRNA。在五个棉系的十个样品中共鉴定到2,192circRNA。每个样品中circRNA基因和circRNA转录物的数量如图5a所示。超过53.9%的circRNA位于基因间区域,24.6%位于外显子区域,21。5%位于内含子区域。使用不同的引物和RT-PCR随机选择5circRNA进行验证。结果表明,在所有五个品系中都表达了circRNA D0159391065,在五个品系的5 DPA表皮细胞中都表达了circRNA A1374684225D034815774。此外,以基因组DNAgDNA)为对照,在纤维特异性品系(LM,LFXu142)中检测到circRNA A1285186316,在无纤维品系(Xu142 fl)中检测到A06101091994。在cDNA中检测到CircRNA,但在gDNA中未检测到,表明circRNA的高度可靠性。 circRNA的这种纤维特异性表达可能与棉纤维的起始有关,但这需要进一步验证。

 

6. 转录组学差异分析

 

在五个品系中分析了mRNAlncRNA的特异性表达。使用FPKM值评估五种系在0 DPA5 DPAlncRNA和蛋白质编码基因的表达水平。发现许多转录因子表现出纤维特异性表达模式,例如R2R3-MYB转录因子,WD40重复蛋白和HD-zip IV转录因子。使用qRT-PCR验证Gh_D12G2590GhHOX3),Gh_A13G0689GhMYB106),Gh_D13G0798GhMYB106),Gh_D06G1439GhMYB-like),Gh_D12G1628GhMYB40 ),Gh_D06G0981GhWD40)和Gh_D13G2002GhWD40))。结果表明,这些转录因子在Xu142 fl中不表达,其表达水平与纤维百分比呈正相关。据报道一些转录因子(GhHOX3GhMYB25-like)调节棉纤维的发育,而其他转录因子可能参与棉纤维的发育。

一些lncRNAs和基因在突变体Xu142 fl中优先表达。根据十个样品的FPKM值,热图显示了mRNAlncRNA的特异性表达模式。我们发现许多lncRNAXu142 fl0 DPA5 DPA特异性表达。为了确认lncRNA的表达模式,我们使用qRT-PCRXLOC_016164XLOC_029323XLOC_006504,XLOC_066220XLOC_092283XLOC_071567XLOC_056809XLOC_087972)随机选择了8lncRNA进行表达验证。检测了lncRNA的纤维特异性表达,发现它们在高纤维百分比的品系中具有高表达水平。

蛋白质编码基因与反义lncRNA之间的相互作用是通过RNAplex通过互补碱基配对来预测的。在十个样品中共鉴定到3,483个反义lncRNA-mRNA对。大多数mRNA76.3%)只有一对配对的lncRNA。但是,mRNAlncRNA之间也存在多对。在相互作用的对中,R2R3-MYB转录因子Gh_D06G14390 DPA胚珠的表皮细胞中高度表达。Gh_D06G1439的表达水平与5个品系的皮棉百分比呈正相关。TCONS_00061835通过互补碱基配对与Gh_D06G1439相互作用。在0 DPA胚珠中高表达的十个样品中检测到TCONS_00061835的表达。

位于蛋白质编码基因上游的lncRNA可能与启动子区域或顺式调控元件重叠,并可能在转录或转录后水平调控其附近基因的表达。位于蛋白质编码基因下游的lncRNA可能会启动3\'UTR或下游区域的转录,并可能参与基因间的调控相互作用。为了预测lncRNA的功能,分析了特定lncRNA的上下游基因鉴定了具有纤维特异性表达模式的基因,这些基因可能参与棉纤维的启动。因此,差异表达的基因及其上游/下游差异表达的lncRNAs显著富集。结果表明,基因表达,核酸代谢过程,细胞代谢过程和DNA结合调控等被显著富集

 

7.利用病毒诱导的基因沉默(VIGS)功能分析与纤维起始相关的lncRNA

 

        在以前的研究中已经发现了许多可能调节棉纤维萌发的lncRNA。然而,这些研究未能提供实质性的功能证据。在这项研究中,一些lncRNA被预测根据其特定的表达模式来调节棉纤维的发育。表达分析表明XLOC_545639XLOC_039050Xu142 fl中高表达,而XLOC_079089LLLMLFXu142品系中高表达。因此,我们推测在无纤维突变体Xu142 fl中沉默XLOC_545639XLOC_039050会诱导棉纤维萌生,而在Xu142XLOC_079089沉默会抑制纤维萌生。为了验证这种可能性,使用了一种基于棉叶皱折病毒(CLCrV)的载体,该载体可以有效和持久地使棉花中的基因沉默,从而使lncRNA沉默。 VIGS系统中使用了每个lncRNA的大约500 bp片段可以阻断叶绿素生成的CLCrVCHLI处理用作阳性对照。在这些基因中未显示表达变化的棉花植株用作阴性对照。无纤维突变体Xu142 flXLOC_545639XLOC_039050的沉默导致种子附着了纤维,且与基因表达变化一致。阴性对照(CLCrVCHLI)和无纤维突变体的种子没有附着纤维。与对照和Xu142相比,Xu142XLOC_079089的沉默导致纤维缩短。这些结果表明,三种lncRNAs可能是棉纤维发育中的重要调控因子。

 



文章亮点

 

① 通过病毒诱导的基因沉默(VIGS)系统证明了三种lncRNA在纤维发育中的功能。

② 揭示长链非编码RNA操纵棉绒和绒毛纤维起始的形成机制。

③ 建立了棉纤维起始阶段的转录组序列,为lncRNA在纤维发育中的潜在功能提供了证据。

 


评论

全部评论()
查看更多评论
湖南快乐十分 湖南快乐十分 湖南快乐十分 湖南快乐十分 湖南快乐十分 湖南快乐十分 湖南快乐十分 湖南快乐十分 湖南快乐十分 湖南快乐十分