Analysis of chloroplast genome codon preference in Camellia meiocarpa and Camellia vietnamensis
-
摘要:目的
研究小果油茶和越南油茶中叶绿体基因组密码子的使用模式,分析并揭示两个物种密码子使用偏好性产生的原因,明确两个物种叶绿体基因组中的最优密码子,为油茶基因组研究和良种培育提供理论依据。
方法运用Codon W 1.4.2和在线软件CUSP、MEGA软件等分析处理筛选后的小果油茶和越南油茶各52条CDS序列,获得相对同义密码子使用度(RSCU)、有效密码子数(ENC)、密码子适应指数(CAI)、GC碱基含量等参数,再进行相关性分析、中性绘图分析、ENC-plot分析和PR2-plot偏倚分析,并通过RSCU、△RSCU预测两物种高频、高表达的最优密码子。
结果(1)小果油茶GC含量、ENC与CAI值分别为37.49%、48.561、0.158,越南油茶GC含量、ENC与CAI值分别为37.50%、48.529、0.160,小果油茶中GC1(45.81%) > GC2(38.00%) > GC3(28.64%),越南油茶中GC1(45.88%) > GC2(38.02%) > GC3(28.59%),两物种密码子中GC分布不均,均呈现出偏好首位的特点。(2)小果油茶和越南油茶中分别有23和11个最优密码子,其中分别有22和11个密码子以A或U结尾,表明最优密码子第3位偏好A/U。(3)小果油茶与越南油茶的ENC值分布均在35.64 ~ 61.00之间,且均值相差不大,表明两个油茶品种在密码子的使用上有一定的相似性。(4)中性绘图分析、ENC-plot分析和PR2-plot分析表明:两个油茶物种中叶绿体基因组密码子偏好性主要受到自然选择的影响。
结论小果油茶和越南油茶叶绿体基因组密码子碱基使用偏好性不强,且偏好性主要受到自然选择的影响。小果油茶有23个最优密码子,越南油茶有11个最优密码子,研究结果为进一步探索油茶基因组和良种培育提供理论依据和数据支撑。
Abstract:ObjectiveThis paper investigates the codon usage patterns in chloroplast genomes of Camellia oleifera and C. vietnamensis, analyzes and elucidates the underlying causes of codon usage bias, identifies optimal codons in their chloroplast genomes, so as to provide theoretical foundations and data support for genomic research and breeding of oil tea species.
MethodScreened CDS sequences (52 sequences each from C. oleifera and C. vietnamensis) were analyzed using Codon W 1.4.2, CUSP, MEGA, and other online tools. Parameters including relative synonymous codon usage (RSCU), effective number of codons (ENC), codon adaptation index (CAI), and GC content were calculated. Correlation analysis, neutrality plot analysis, ENC-plot analysis, and PR2-plot bias analysis were performed. High-frequency and highly expressed optimal codons were predicted based on RSCU and ΔRSCU values.
Result(1) C. oleifera exhibited GC content, ENC, and CAI values of 37.49%, 48.561, and 0.158, respectively, while C. vietnamensis showed values of 37.50%, 48.529, and 0.160. Both species displayed uneven GC distribution across codon positions, with GC1 > GC2 > GC3(C. oleifera: GC1 = 45.81%, GC2 = 38.00%, GC3 = 28.64%; C. vietnamensis: GC1 = 45.88%, GC2 = 38.02%, GC3 = 28.59%), indicating a preference for GC at the first codon position. (2) C. oleifera and C. vietnamensis had 23 and 11 optimal codons, respectively, with 22 and 11 of these codons ending in A/U, suggesting a strong preference for A/U at the third codon position.(3) ENC values for both species ranged from 35.64 to 61.00, with minimal differences in mean values, reflecting similarities in codon usage patterns. (4) Neutrality plot, ENC-plot, and PR2-plot analyses revealed that natural selection predominantly influenced codon usage bias in the chloroplast genomes of both species.
ConclusionThe chloroplast genomes of C. oleifera and C. vietnamensis exhibit weak codon usage bias, primarily shaped by natural selection. C. oleifera has 23 optimal codons, while C. vietnamensis has 11 optimal codons. These findings provide critical theoretical and empirical insights for advancing oil tea genomic studies and breeding programs.
-
Keywords:
- Camellia meiocarpa /
- Camellia vietnamensis /
- chloroplast genome /
- codon preference /
- optimal codon
-
植物是依赖于光合作用生存的光能自养型生物,而光合作用的主要场所为叶绿体。叶绿体拥有自身的遗传物质DNA[1],其基因组较小,仅占植株总基因组的10% ~ 20%,呈双链闭环形式,一般为四分体结构[2],包括小单拷贝区(SSC,small single copy region),大单拷贝区(LSC,large single copy region),和两个大小相等、方向相反的反向重复区(IR,inverted repeat region)。大单拷贝区和小单拷贝区被两个反向重复区在中间隔开。叶绿体是半自主细胞器,具有独立的遗传系统,作为光合作用的中心,同时进行着多种生化反应[3]。
密码子在核酸和蛋白质之间起传递的作用[4],其偏好性会受到自然选择、基因突变、碱基组成、遗传进化、基因漂移等多种因素影响[5]。密码子偏好性可影响物种的分子进化、环境适应和基因组特征,进而影响外源基因的表达、反映物种间的进化关系,还可为引种驯化提供重要依据。通过分析密码子中碱基的使用情况,可以推断影响其使用偏好的原因。叶绿体基因组密码子对植物光合作用的机制和代谢调控具有重要意义。此前,已有研究对忍冬属(Lonicera)[6]、车轴草属(Trifolium)[7]、赖草属(Leymus)[8]、梁山慈竹(Dendrocalamus farinosus)[9]、人参(Panax ginseng)和三七(Panax notoginseng)[10]等植物的叶绿体基因组密码子偏好性进行了探讨。目前,关于油茶叶绿体基因组密码子偏好性分析的报道仅限于普通油茶(Camellia oleifera)[11]和香花油茶(Camellia osmantha)[12],研究发现其密码子偏好性不仅受到突变作用的影响,更多地受到自然选择的作用。
油茶属于山茶科(Theaceae)山茶属(Camellia),灌木或中乔木,嫩枝有粗毛,叶革质,花顶生,蒴果球形或卵圆形,与油橄榄(Olea europaea)、油棕(Elaeis guineensis)、椰子(Cocos nucifera)并称世界四大木本油料植物[13],与乌桕(Triadica sebifera)、油桐(Vernicia fordii)、核桃(Juglans regia)并称中国四大木本油料植物[14]。油茶不仅可提炼食用油,还可入药,茶枯还可作为农药、肥料,有提高农田蓄水能力和防治稻田害虫的功能[15]。小果油茶(Camellia meiocarpa)又称小子茶和江西子,因其种子形状与鸡心相似,故又称鸡心子[16]。其生长习性与普通油茶相似,适宜种植在亚热带季风气候的中低海拔山地、丘陵地区。越南油茶(Camellia vietnamensis)分布于中国广东南部、海南、广西靠近越南边界各县,以及越南和老挝。越南油茶是一种在中国广泛栽培的油料树种,栽培面积仅次于普通油茶和小果油茶。小果油茶和越南油茶是油茶资源中的两个重要栽培类型,其栽培面积在全国范围内位居前三,两者在植物学特性、地理分布、果实特征、栽培利用和亲缘关系等方面既存在显著差异,又具有一定的内在联系。借助基因测序、分子标记等现代生物技术手段,能够深入剖析小果油茶和越南油茶之间的遗传差异,为其遗传改良提供坚实的理论基础。通过对小果油茶与越南油茶叶绿体基因组密码子偏好性的研究,可以揭示二者在进化规律和突变方式上的特点,进而阐释这两个品种适应外界环境的分子机制。在此研究基础上,通过对目标基因密码子进行优化,能够显著提高基因的表达效率。这不仅为后续良种培育提供了理论依据,更为将小果油茶的适应性强、抗炭疽病能力强、产量稳定等优良性状与越南油茶生长速度快、种仁含油率高这一优势相结合,培育出更具市场竞争力的新品种奠定了基础。
截至目前,尚未有针对小果油茶和越南油茶这两个油茶近源物种叶绿体基因组密码子使用偏好性的对比研究报道。本研究以市场上常见的小果油茶和越南油茶为研究对象,拟通过相关软件对其叶绿体基因组密码子进行碱基组成分析、中性绘图、ENC-plot绘图、PR2-plot偏倚、最优密码子分析,构建高低表达库,揭示叶绿体基因组密码子的使用偏好性,并探讨影响其偏好性的原因,进而筛选出两物种的最优密码子。研究结果旨在为油茶基因组研究及其良种培育提供理论依据。
1. 材料与方法
1.1 序列材料
在NCBI数据库中下载小果油茶和越南油茶的叶绿体全基因组CDS序列,小果油茶[17]登陆号为NC_058881.1,共85条基因序列156 550 bp。越南油茶[18]登录号为NC_060778.1,共87条基因序列156 999 bp。为减少结果误差,将两个物种的CDS序列进行筛选,剔除重复和长度小于300 bp的序列后[19],选择包含起始密码子(ATG)和终止密码子(TAA、TAG、TGA)的序列[20],最终两物种以各52条CDS序列作为此次分析的基础数据,利用Origin、Excel等软件绘制相关图表[21]。
1.2 研究方法
1.2.1 密码子组成分析
运用Codon W 1.4.2软件、CUSP在线软件(http://emboss.toulouse.inra.fr/cgi-bin/emboss/cusp)、MEGA软件[22]等分析处理剔除相关序列后的CDS序列,得出氨基酸密码子组成数量、同义密码子相对使用度(relative synonymous codon usage,RSCU)、有效密码子数(effective number of codon,ENC)、密码子适应指数(codon bias index,CAI)、各碱基(A、T、G、C)在每一位置的含量以及每一位置的G + C含量。其中,A3、T3、G3、C3为基因中所有密码子第3位碱基A、T、G、C的含量;GC1、GC2、GC3分别为基因中所有密码子(除蛋氨酸、色氨酸和终止密码子外)第1位、第2位、第3位碱基G + C的含量。ENC计算公式为
ENC=2+t+29/(t2+(1-t2)2) 式中:t 为密码子第3位G + C的含量(GC3)。
1.2.2 中性绘图分析
以GC3为横坐标,以 GC1 和 GC2 的均值(GC12)为纵坐标绘制散点图,图中每 1个点代表1个基因的位置,直观体现3个密码子位置之间的相关性[23],初步判断密码子使用偏好性的影响因素[24−25]。若回归曲线斜率较低,表明基因突变对密码子偏好性的影响较小,自然选择在其中发挥了更重要的作用。
表 1 小果油茶与越南油茶叶绿体基因组中GC含量、ENC值和CAI值Table 1. GC content, ENC value and CAI value in chloroplast genes of Camellia meiocarpa and C. vietnamensis物种 A3/% T3/% G3/% C3/% GC1/% GC2/% GC3/% GCall/% ENC CAI 小果油茶 Camellia meiocarpa 39.73 36.96 27.85 23.22 45.81 38.00 28.64 37.49 48.561 0.158 越南油茶 Camellia vietnamensis 39.82 38.74 26.28 22.75 45.88 38.02 28.59 37.50 48.529 0.160 注:T3、C3、A3、G3分别代表基因组中所有密码子第3位碱基T、C、A、G的含量;GC1、GC2、GC3分别代表基因组中所有密码子(除蛋氨酸、色氨酸和终止密码子外)第1位、第2位、第3位碱基G + C的含量;GCall:基因中所有密码子第1位、第2位、第3位碱基G + C含量的平均值;ENC表示有效密码子数;CAI表示密码子适应指数。下同。 1.2.3 ENC-plot绘图分析
以GC3为横坐标,以ENC值为纵坐标使用Origin绘制散点图,并在散点图中绘制ENC值的标准曲线。ENC常被用来衡量单个基因的密码子偏好性大小,取值范围在 20 ~ 61 之间。其值越接近20,认为该基因具有强密码子偏好性,越接近61,认为该基因无密码子偏好性。
当基因ENC值在标准曲线附近时,表明基因密码子使用偏好受突变压力的影响较大;而当 ENC 值偏离标准曲线较远时,表明密码子使用模式受选择压力的影响较大[26−28]。以ENC检测值和ENC标准值两者的差值与ENC标准值的比值作为各基因有效密码子比值,并进行油茶叶绿体基因组有效密码子比值频率分布分析。
1.2.4 PR2-plot偏倚分析
以A3/(A3 + T3)为纵坐标,G3/( G3 + C3)为横坐标绘制散点图,并画出散点图的中心点(A = T且C = G),表示基因两条互补链间不存在任何突变或自然选择上的偏倚,从中心点发出的矢量距离代表该碱基偏移的程度和方向[29]。如果密码子第 3 位碱基使用AT 的频率等于 GC 的频率,则表明基因的密码子使用偏好仅受到突变压力的影响;否则,说明自然选择或两者共同作用影响了密码子的偏好性使用[30]。
1.2.5 最优密码子分析
以ENC值作为高表达和低表达基因的参考依据,将所有基因的CDS序列按照ENC值进行排序,排序前后两端各选取5条基因序列,分别建立高、低表达组。随后计算高、低表达组的RSCU,以 RSCU > 1 的密码子为高频密码子,并计算△RSCU(高、低两组RSCU的差值),△RSCU ≥ 0.08的密码子作为高表达密码子。高频(RSCU > 1)且高表达(△RSCU ≥ 0.08)的密码子确定为油茶叶绿体基因组的最优密码子[31]。
2. 结果与分析
2.1 小果油茶和越南油茶密码子组成特征
小果油茶和越南油茶叶绿体基因组密码子中GC分布不均,均呈现GC1 > GC2 > GC3;两物种A3/T3均远大于G3/C3,表明两种油茶编码基因的密码子中碱基偏好以A/T结尾;CAI理论取值在0 ~ 1之间[32],两物种的CAI值均小于0.17,表明小果油茶与越南油茶的适应性弱(表1)。
在小果油茶与越南油茶叶绿体基因组不同的基因中,ENC值分布在35.640 ~ 61.000之间,两物种ENC均值为48.561和48.529(表2)。ENC值可决定偏好性强弱,以35为标准,低于35为偏好性强,高于35为偏好性弱[33]。因两物种各52条叶绿体基因组序列ENC均大于35,可知两物种叶绿体基因组密码子的偏好性均比较弱。
表 2 小果油茶和越南油茶不同基因密码子的GC含量和ENC值Table 2. GC contents and ENC values of different gene codons of Camellia meiocarpa and C. vietnamensis基因 小果油茶Camellia meiocarpa 越南油茶C. vietnamensis GC1/% GC2/% GC3/% GCall/% ENC GC1/% GC2/% GC3/% GCall/% ENC rps12 51.61 48.39 27.42 44.90 55.31 52.10 50.42 29.41 45.60 45.54 ycf1 43.55 34.68 38.71 30.70 49.34 45.38 33.61 38.66 30.60 49.16 rps7 50.00 45.16 20.16 40.40 45.81 51.26 45.38 20.17 41.70 53.41 ndhB 37.10 30.65 35.48 37.40 50.52 36.97 30.25 36.13 37.00 46.46 ycf2 40.32 31.45 37.90 37.70 53.35 39.50 31.09 36.97 38.80 50.59 rpl2 45.97 42.74 30.65 45.00 57.04 38.98 43.22 25.42 39.00 41.33 psbA 48.39 45.16 31.45 43.40 55.78 47.06 45.38 31.93 43.30 55.79 matK 44.35 22.58 22.58 32.80 47.1 44.54 22.69 23.53 32.80 46.71 atpA 58.06 37.10 20.97 41.40 51.02 57.98 36.13 21.85 41.60 60.37 atpF 45.16 36.29 37.90 38.00 43.37 44.54 35.29 38.66 39.90 48.78 atpI 48.39 37.90 27.42 38.70 56.35 47.90 38.66 28.57 38.70 56.35 rps2 41.13 45.97 27.42 39.70 55.68 41.18 47.06 26.05 39.70 55.68 rpoC2 50.00 34.68 32.26 38.70 56.29 50.42 33.61 31.09 38.80 56.17 rpoC1 48.39 38.71 25.00 38.80 50.15 48.74 37.82 26.05 38.80 50.15 rpoB 41.94 31.45 24.19 39.70 56.80 42.86 31.93 23.53 39.70 56.73 psbD 45.97 48.39 30.65 43.50 54.60 45.38 48.74 31.09 43.50 54.60 psbC 57.26 43.55 35.48 44.90 53.61 57.98 42.86 36.97 43.70 43.75 rps14 43.93 49.07 29.63 42.00 50.66 43.56 47.52 31.68 42.00 50.66 psaB 56.45 45.16 28.23 42.20 48.20 57.14 45.38 26.89 42.20 48.14 psaA 50.00 43.55 37.90 43.60 52.35 49.58 44.54 37.82 43.50 52.29 ycf3 45.97 37.10 28.23 40.80 55.61 44.54 36.97 26.89 39.60 61.00 rps4 53.23 40.32 25.81 39.90 48.7 52.1 40.34 26.89 39.90 48.70 ndhJ 50.81 37.10 31.45 41.30 56.28 52.1 37.82 31.93 39.90 51.41 ndhK 40.32 49.19 22.58 38.10 58.39 40.34 49.58 21.01 36.90 47.24 ndhC 45.53 33.87 24.19 36.30 46.95 47.06 33.61 24.37 35.00 45.99 atpE 50.81 38.71 26.61 39.10 47.78 51.26 36.13 26.89 41.70 55.91 atpB 62.10 41.94 29.03 42.00 44.86 62.18 42.86 31.09 43.30 56.14 rbcL 54.84 47.58 27.42 44.20 48.16 54.62 48.74 27.73 44.20 47.96 accD 35.48 33.06 29.84 36.40 46.69 36.13 31.93 31.09 37.40 51.70 ycf4 38.71 42.74 29.03 38.00 46.79 38.66 44.54 30.25 38.00 55.97 cemA 34.68 23.39 37.10 33.50 52.34 34.45 22.69 38.66 33.50 52.34 petA 52.42 40.32 24.19 39.20 48.56 51.26 39.5 25.21 39.20 48.56 rps18 35.29 43.14 26.47 35.00 35.64 35.29 43.69 26.47 35.00 35.64 rpl20 38.98 43.22 25.42 39.00 41.33 38.98 43.22 25.42 39.00 41.33 clpP 50.81 36.29 27.42 40.60 52.48 57.14 37.82 25.21 41.80 54.64 psbB 50.81 47.58 38.71 44.20 47.41 51.26 48.74 40.34 44.00 47.14 petB 48.39 38.71 31.45 42.80 55.46 47.06 38.66 30.25 41.60 60.80 petD 48.39 40.32 30.65 39.50 44.62 51.26 36.13 26.05 41.20 44.37 rpoA 47.58 41.94 27.42 35.00 59.26 47.9 42.02 25.21 34.90 58.49 rps11 53.23 58.06 20.97 45.60 50.97 52.10 50.42 29.41 45.60 45.54 rps8 42.74 41.13 26.61 39.00 54.31 45.38 33.61 38.66 30.00 49.16 rpl14 56.10 36.59 26.02 41.70 55.31 51.26 45.38 20.17 41.70 53.41 rpl16 52.42 53.23 20.16 42.70 44.20 36.97 30.25 36.13 37.00 46.46 rps3 46.77 29.03 25.81 35.00 47.72 39.50 31.09 36.97 38.80 50.59 rpl22 43.55 38.71 22.58 36.70 57.04 52.10 57.98 20.17 45.60 50.97 ndhF 39.52 34.68 23.39 33.20 50.05 40.34 41.18 26.89 38.20 57.94 ccsA 29.84 33.87 24.19 33.80 59.41 56.30 37.82 26.05 41.70 55.31 ndhE 39.22 33.01 24.51 33.30 50.31 52.94 52.94 19.33 42.70 44.20 ndhG 41.13 33.06 25.00 33.80 61.00 46.22 27.73 26.05 34.60 44.18 ndhI 42.74 39.52 29.84 37.40 55.31 43.70 39.50 23.53 36.70 57.04 ndhA 44.35 37.10 21.77 34.00 41.23 40.34 34.45 22.69 31.70 41.66 ndhH 49.19 37.10 22.58 38.30 58.29 28.57 34.45 24.37 33.80 59.38 对小果油茶与越南油茶叶绿体基因组密码子不同位置上GC含量和ENC值进行关联性分析,结果表明:小果油茶密码子中GCall与GC1、GC2极显著相关,GC1与GC2极显著相关;越南油茶密码子中GCall与GC1、GC2极显著相关,GC1与GC2极显著相关,GC2与GC3显著相关,表明两物种叶绿体基因密码子第1、2位上的碱基组成相似(图1)。
将RSCU值 > 1的密码子作为高频密码子。RSCU分析(表3)显示:小果油茶有28种高频密码子,其中以U或A结尾的分别有12、13个,以G或C结尾的分别有3、0个;越南油茶有30种高频密码子,其中以U或A结尾的分别有14、13个,以G或C结尾的分别有3、0个。因此两物种密码子都偏好以A或U结尾。
表 3 小果油茶和越南油茶不同基因密码子RSCU分析Table 3. RSCU analysis of different gene codons of Camellia meiocarpa and C. vietnamensis氨基酸 小果油茶 Camellia meiocarpa 越南油茶 C. vietnamensis 密码子 数目 RSCU 密码子 数目 RSCU 苯丙氨酸 Phe UUU 795 1.17 UUU 815 1.19 UUC 553 0.83 UUC 520 0.81 亮氨酸 Leu UUA 520 1.51 UUA 535 1.59 UUG 558 1.46 UUG 493 1.44 CUU 478 1.12 CUU 439 1.11 CUC 217 0.52 CUC 214 0.54 CUA 340 0.84 CUA 314 0.86 CUG 254 0.56 CUG 230 0.47 异亮氨酸 Ile AUU 720 1.27 AUU 732 1.33 AUC 436 0.73 AUC 422 0.75 AUA 581 0.99 AUA 548 0.92 蛋氨酸 Met AUG 513 0.96 AUG 463 0.92 缬氨酸 Val GUU 367 1.32 GUU 366 1.44 GUC 172 0.75 GUC 181 0.7 GUA 336 1.21 GUA 312 1.11 GUG 204 0.71 GUG 174 0.69 丝氨酸 Ser UCU 362 1.2 UCU 405 1.04 UCC 250 0.84 UCC 264 0.85 UCA 405 1.65 UCA 422 1.49 UCG 184 0.87 UCG 200 0.81 脯氨酸 Pro CCU 230 1.06 CCU 248 1.16 CCC 146 0.85 CCC 126 0.65 CCA 239 1.19 CCA 265 1.3 CCG 143 0.91 CCG 145 0.88 苏氨酸 Thr ACU 235 1.01 ACU 233 1 ACC 169 0.8 ACC 174 0.73 ACA 297 1.41 ACA 299 1.02 ACG 133 0.79 ACG 133 0.89 丙氨酸 Ala GCU 196 1.1 GCU 233 1.17 GCC 109 0.77 GCC 117 0.99 GCA 188 1.11 GCA 192 1.04 GCG 89 0.87 GCG 76 0.79 酪氨酸 Tyr UAU 595 1.28 UAU 622 1.32 UAC 319 0.68 UAC 313 0.68 终止密码子 TER UAA 403 1.18 UAA 407 1.06 UAG 340 0.91 UAG 365 0.96 组氨酸 His CAU 288 1.26 CAU 315 1.18 CAC 154 0.66 CAC 161 0.66 谷氨酰胺 Gln CAA 446 1.31 CAA 430 1.37 CAG 249 0.69 CAG 215 0.63 天冬酰胺 Asn AAU 636 1.32 AAU 575 1.25 AAC 313 0.68 AAC 322 0.71 赖氨酸 Lys AAA 831 1.25 AAA 824 1.36 AAG 459 0.75 AAG 437 0.64 天冬氨酸 Asp GAU 447 1.31 GAU 451 1.43 GAC 166 0.66 GAC 152 0.57 谷氨酸 Glu GAA 592 1.37 GAA 612 1.33 GAG 280 0.63 GAG 277 0.67 半胱氨酸 Cys UGU 235 0.99 UGU 227 1.04 UGC 232 0.86 UGC 235 0.84 终止密码子 TER UGA 336 0.92 UGA 407 0.98 色氨酸 Trp UGG 421 0.96 UGG 428 0.94 精氨酸 Arg CGU 152 0.7 CGU 149 0.86 CGC 93 0.45 CGC 83 0.4 CGA 214 1.11 CGA 224 1.08 CGG 143 0.74 CGG 147 0.73 丝氨酸 Ser AGU 205 0.85 AGU 227 1.01 AGC 186 0.59 AGC 164 0.57 精氨酸 Arg AGA 383 1.79 AGA 406 1.69 AGG 263 1.81 AGG 251 1.34 甘氨酸 Gly GGU 237 0.9 GGU 249 0.88 GGC 164 0.54 GGC 161 0.56 GGA 333 1.16 GGA 404 1.28 GGG 300 1.33 GGG 284 1.28 注:加粗的表示高频密码子(RSCU > 1)。 2.2 中性绘图分析
中性绘图分析(图2)显示:小果油茶和越南油茶的GC12的取值范围分别为29.0% ~ 55.7%、28.6% ~ 55.0%,GC3的取值范围分别为20.1% ~ 38.7%、19.3% ~ 40.3%;小果油茶和越南油茶的回归曲线斜率分别为-0.137 86和-0.136 17,GC12与GC3呈负相关关系,基因大量分布在坐标轴对角线上方,说明两物种叶绿体基因组密码子使用偏好性受自然选择影响较大。
2.3 ENC-plot分析
ENC-plot分析(图3)显示:小果油茶和越南油茶基因总体分布均较为分散,较多基因距离标准曲线较远且分布于标准曲线下方,表明两物种的密码子使用偏好性受自然选择压力的影响较大。通过计算ENC比值,进一步量化ENC检测值与ENC标准值之间的差异。结果(表4)显示:−0.05 ~ 0.05区间内,小果油茶有14个基因,约占26.9%;越南油茶有18个基因,约占34.6%,这部分基因ENC检测值与ENC标准值较为接近,而小果油茶(73.1%)和越南油茶(65.4%)大部分基因ENC检测值与ENC标准值差异比较大,进一步表明两个物种的密码子使用偏好性主要受自然选择影响。
表 4 ENC比值的频率分布Table 4. Frequency distribution of ENC ratios小果油茶 Camellia meiocarpa 越南油茶 C. vietnamensis 组段 组中值 组数 频率/% 组段 组中值 组数 频率/% −0.15 ~ −0.05 −0.1 2 3.8 −0.15-−0.05 −0.1 4 7.7 −0.05 ~ 0.05 0 14 26.9 −0.05-0.05 0 18 34.6 0.05 ~ 0.15 0.1 27 51.9 0.05-0.15 0.1 21 40.4 0.15 ~ 0.25 0.2 6 11.5 0.15-0.25 0.2 6 11.5 0.25 ~ 0.35 0.3 3 5.8 0.25-0.35 0.3 3 5.8 合计 52 100 合计 52 100 2.4 PR2-plot分析
PR2-plot分析结果(图4)显示:小果油茶和越南油茶的密码子基因大部分分布在右上角,密码子第3位碱基嘧啶碱(A 和 G)的使用频率高于嘌呤碱(T和C),这表明两物种密码子第3位碱基分布不均匀,可以推测自然选择影响了小果油茶和越南油茶叶绿体基因的密码子使用偏好性。
2.5 最优密码子分析
在小果油茶中选择5个高表达基因(ycf4、accD、rps7、atpB、petD)和5个低表达基因(ndhG、ccsA、rpoA、ndhK、ndhH),在越南油茶中选择5个高表达基因(psbC、ndhA、rpl2、rpl20、rps18)和5个低表达基因(ycf3、petB、atpA、ndhH、rpoA)分别进行分析,构建两物种基因的高低表达库(表5)。以RSCU > 1且△RSCU ≥ 0.08为标准筛选最优密码子,其中小果油茶有23个最优密码子,分别为UUU、UUA、UUG、CUU、GUU、GUA、UCU、UCA、CCA、ACU、ACA、GCU、GCA、UAU、UAA、CAU、CAA、AAU、AAA、GAU、GAA、CGA、AGA,以U结尾的有10个,以A结尾的有12个,以G结尾的有1个,以C结尾的有0个。越南油茶有11个最优密码子,分别为UUU、AUU、GUU、UCA、CCU、ACU、GCU、UAA、CAU、AAU、UGU,以U结尾的有9个,以A结尾的有2个,以G、C结尾的有0个。小果油茶和越南油茶的最优密码子均偏好以A或U结尾,这与前面RSCU分析的结果(表3)相一致。
表 5 小果油茶和越南油茶叶绿体基因组的最优密码子分析Table 5. Optimal codons analysis in chloroplast genome of Camellia meiocarpa and C. vietnamensis氨基酸 密码子 小果油茶Camellia meiocarpa 密码子 越南油茶C. vietnamensis 高表达基因 低表达基因 △RSCU 高表达基因 低表达基因 △RSCU 数目 RSCU 数目 RSCU 数目 RSCU 数目 RSCU Phe UUU* 46 1.32 75 1.18 0.14 UUU* 75 1.28 19 1.15 0.13 UUC 26 0.68 46 0.82 −0.14 UUC 40 1.04 20 1.22 −0.18 Leu UUA*** 50 2.12 51 1.47 0.65 UUA 56 1.13 27 1.30 −0.18 UUG* 40 1.43 40 1.21 0.22 UUG 35 0.78 25 0.83 −0.05 CUU** 35 1.24 27 0.81 0.43 CUU 15 0.60 55 0.93 −0.33 CUC 11 0.32 25 0.68 −0.36 CUC 15 1.20 34 1.13 0.07 CUA 22 0.60 33 1.02 −0.42 CUA 13 0.60 59 0.87 −0.27 CUG 10 0.29 25 0.80 −0.51 CUG 8 0.40 49 1.07 −0.67 Ile AUU 60 1.46 72 1.63 −0.17 AUU* 14 1.20 31 0.98 0.22 AUC 38 0.65 26 0.59 0.06 AUC 9 0.60 48 0.95 −0.35 AUA* 46 0.89 37 0.78 0.10 AUA 3 1.00 28 1.00 0.00 Met AUG 45 1.00 45 1.00 0.00 AUG* 12 1.20 46 1.07 0.13 Val GUU* 44 1.39 29 1.23 0.15 GUU* 50 0.86 13 0.64 0.22 GUC 9 0.36 9 0.52 −0.16 GUC 19 0.79 35 0.78 0.01 GUA* 54 1.62 30 1.52 0.10 GUA 9 1.08 83 1.05 0.03 GUG 29 0.63 17 0.72 −0.10 GUG 42 1.05 13 1.03 0.02 Ser UCU* 22 1.31 10 1.14 0.17 UCU 34 1.32 11 1.37 −0.05 UCC*** 16 1.49 2 0.40 1.09 UCC 41 0.83 5 1.44 −0.61 UCA** 16 1.41 19 1.04 0.37 UCA* 32 1.01 19 0.84 0.17 UCG 9 0.51 6 0.93 −0.43 UCG** 34 1.12 6 0.66 0.46 Pro CCU 23 0.91 6 1.24 −0.33 CCU* 16 0.91 5 0.80 0.11 CCC 15 0.92 13 1.25 −0.33 CCC*** 5 2.00 23 1.01 0.99 CCA*** 18 1.31 3 0.80 0.51 CCA 4 0.80 17 0.91 −0.11 CCG 16 0.86 8 0.86 0.01 CCG 6 0.68 8 1.12 −0.44 Thr ACU*** 28 1.61 5 0.95 0.66 ACU* 5 1.13 23 1.00 0.13 ACC 9 0.32 14 1.24 −0.92 ACC 8 1.07 14 1.13 −0.06 ACA*** 36 1.87 8 0.96 0.91 ACA 3 0.80 13 1.05 −0.25 ACG 5 0.19 13 1.03 −0.84 ACG* 7 1.08 8 0.83 0.25 Ala GCU** 30 1.10 12 0.80 0.30 GCU** 22 1.13 5 0.80 0.33 GCC 18 0.94 18 1.30 −0.36 GCC 20 0.80 17 1.17 −0.37 GCA* 29 1.23 16 1.02 0.22 GCA 18 1.03 31 1.02 0.01 GCG 15 0.73 6 1.12 −0.39 GCG 21 0.93 12 1.20 −0.27 Tyr UAU** 33 1.73 48 1.33 0.40 UAU 25 0.68 15 1.09 −0.42 UAC 7 0.27 51 1.12 −0.85 UAC* 43 1.09 20 1.00 0.09 TER UAA* 15 1.44 61 1.29 0.14 UAA* 22 1.11 24 0.97 0.14 UAG 7 0.13 51 1.12 −0.99 UAG 26 0.92 15 1.04 −0.12 His CAU** 12 1.70 29 1.27 0.43 CAU* 36 1.13 80 0.87 0.27 CAC 4 0.30 12 0.73 −0.43 CAC*** 14 1.25 19 0.69 0.55 Gln CAA** 33 1.59 47 1.27 0.32 CAA 9 0.90 31 0.91 −0.01 CAG 14 0.41 29 0.73 −0.32 CAG 19 0.87 43 1.13 −0.27 Asn AAU* 41 1.55 38 1.34 0.21 AAU* 15 1.20 62 1.03 0.17 AAC 17 0.45 18 0.66 −0.21 AAC* 18 1.11 43 1.01 0.11 Lys AAA** 67 1.53 45 1.22 0.32 AAA 9 0.89 33 0.99 −0.11 AAG 20 0.47 27 0.78 −0.32 AAG 1 0.60 35 0.98 −0.38 Asp GAU** 32 1.80 14 1.40 0.40 GAU 21 0.77 17 1.11 −0.34 GAC 8 0.20 9 0.60 −0.40 GAC* 40 1.12 33 1.03 0.10 Glu GAA* 51 1.44 27 1.16 0.28 GAA 28 0.98 45 1.03 −0.04 GAG 16 0.56 25 0.84 −0.28 GAG 16 0.83 18 0.89 −0.06 Cys UGU*** 8 1.22 6 0.69 0.53 UGU*** 30 1.66 6 0.67 0.99 UGC 4 0.38 10 1.31 −0.93 UGC 59 1.19 12 1.22 −0.03 TER UGA*** 15 1.44 25 0.58 0.85 UGA 20 0.72 27 1.10 −0.37 Trp UGG 21 0.80 29 1.00 −0.20 UGG 11 0.53 7 0.65 −0.12 Arg CGU*** 26 2.05 3 0.44 1.61 CGU** 32 1.44 19 1.03 0.42 CGC 4 0.22 8 0.92 −0.70 CGC 3 0.43 28 1.53 −1.10 CGA** 20 1.48 8 1.06 0.41 CGA 6 1.03 18 1.03 0.00 CGG 2 0.10 10 1.13 −1.03 CGG 19 1.11 8 1.04 0.07 Ser AGU** 15 0.98 8 0.52 0.46 AGU 7 0.80 30 0.94 −0.14 AGC 6 0.30 9 0.74 −0.43 AGC 16 1.24 11 1.17 0.08 Arg AGA* 27 1.74 10 1.53 0.21 AGA 4 0.87 11 0.91 −0.04 AGG 7 0.42 8 0.92 −0.50 AGG 3 0.21 22 0.99 −0.77 Gly GGU*** 43 1.54 10 0.95 0.59 GGU 11 0.66 16 0.88 −0.23 GGC 5 0.21 7 0.46 −0.25 GGC* 29 0.87 18 0.73 0.14 GGA 33 1.22 16 1.18 0.04 GGA 23 0.55 29 0.75 −0.20 GGG 28 1.03 3.8 1.41 −0.37 GGG 25 1.20 22 1.29 −0.09 注:*表示0.08 ≤ △RSCU < 0.3,**表示0.3 ≤ △RSCU < 0.5,***表示△RSCU ≥ 0.5,加粗表示最优密码子。 3. 讨 论
叶绿体基因组具有母系遗传的特点,即遗传信息通过母本传递给后代,其序列信息可以揭示物种的起源、进化和亲缘关系,具有进化速率慢、序列较为保守、易受到选择压力影响等特性[34]。叶绿体基因组的密码子偏好性可能受到自然选择、基因突变和基因表达水平等多种因素的影响[35],研究叶绿体基因组的密码子偏好性不仅有助于深入了解植物的遗传特性和进化历程,还能提高基因表达效率,推动基因工程研究与应用,揭示植物适应性与环境响应机制,促进植物资源保护与利用[36],以及拓展生物信息学应用,对植物科学研究和农业生产实践具有重要意义。
研究叶绿体基因组密码子偏好性的过程中,最直观体现偏好性的是密码子使用的频率和碱基的分布,GC3常用于衡量密码子偏好性[37]。本研究小果油茶与越南油茶的GC3含量为28.64%和28.59%,该结果与普通核桃(Juglans regia)、深纹核桃(Juglans sigillate)[31]等相近。前人研究[38−40]表明,单子叶植物偏好G/C结尾,双子叶植物偏好A/T(U)结尾,小果油茶与越南油茶的研究结果符合双子叶植物的这一特性,由此推出,同类物种在进化的过程中遵循着相似的规律。中性绘图结果表明,小果油茶与越南油茶的回归系数分别为−
0.13786 和−0.13617 ,接近于0,表明两物种的密码子偏好性更多受到自然选择的影响,该结果与王鹏良等[11]在普通油茶和郝丙青等[12]在香花油茶中的相关结果一致,这一结果也证实了叶绿体基因组具有进化速率慢、序列较为保守、易受到选择压力影响的特性。结合ENC-plot与PR2-plot分析的结果同样发现,小果油茶与越南油茶叶绿体基因偏好性主要受自然选择的影响,该结果与北沙参(Glehnia littoralis)[41]、葫芦巴(Trigonella foenum-graecum)[42]、甜高粱(Sorghum bicolor)[43]的研究结果一致,与大部分双子叶植物的研究结果保持一致。近年来,国家重视粮油安全,大力发展木本油料作物,油茶作为明星树种,得以大力推广,但油茶病害、虫害日益严重。因此,培育抗病良种有益于油茶提质增产,研究油茶叶绿体基因组可为培育抗病良种助力,进而提高油茶抗逆性。本文对小果油茶和越南油茶叶绿体基因组密码子偏好性进行分析,发现两个物种在碱基组成分析、中性绘图、ENC-plot分析、PR2-plot分析和相关性分析等方面都呈现出极强的相似性,也进一步说明小果油茶与越南油茶存在一定的亲缘关系。该研究结果为未来实现小果油茶与越南油茶优良性状的结合提供了理论依据,通过优化目标基因的密码子,可显著提升基因表达效率,从而为培育更具市场竞争力的优良油茶品种奠定坚实基础。鉴于资源和研究时间的限制,本文聚焦于叶绿体基因组这一关键领域,进行了深入的分析与研究。此外,叶绿体基因组的母系遗传特性使其在某些育种策略中具有独特的优势。通过研究叶绿体基因组的密码子偏好性,能够更深入地挖掘这一特性在育种中的应用潜力。与此同时,植物细胞核基因组在育种过程中也起着至关重要的作用。在未来的研究中,我们将对叶绿体基因组和核基因组展开综合分析,以获取更全面且深入的遗传信息,为育种研究提供更有力的支持。
4. 结 论
小果油茶和越南油茶叶绿体基因组密码子碱基使用偏好性不强,其偏好性主要受到自然选择的影响。本研究在小果油茶中筛选到23个最优密码子,越南油茶中有11个最优密码子。研究成果为进一步探索油茶基因组研究和良种培育提供了坚实的理论依据和数据支撑。
-
表 1 小果油茶与越南油茶叶绿体基因组中GC含量、ENC值和CAI值
Table 1 GC content, ENC value and CAI value in chloroplast genes of Camellia meiocarpa and C. vietnamensis
物种 A3/% T3/% G3/% C3/% GC1/% GC2/% GC3/% GCall/% ENC CAI 小果油茶 Camellia meiocarpa 39.73 36.96 27.85 23.22 45.81 38.00 28.64 37.49 48.561 0.158 越南油茶 Camellia vietnamensis 39.82 38.74 26.28 22.75 45.88 38.02 28.59 37.50 48.529 0.160 注:T3、C3、A3、G3分别代表基因组中所有密码子第3位碱基T、C、A、G的含量;GC1、GC2、GC3分别代表基因组中所有密码子(除蛋氨酸、色氨酸和终止密码子外)第1位、第2位、第3位碱基G + C的含量;GCall:基因中所有密码子第1位、第2位、第3位碱基G + C含量的平均值;ENC表示有效密码子数;CAI表示密码子适应指数。下同。 表 2 小果油茶和越南油茶不同基因密码子的GC含量和ENC值
Table 2 GC contents and ENC values of different gene codons of Camellia meiocarpa and C. vietnamensis
基因 小果油茶Camellia meiocarpa 越南油茶C. vietnamensis GC1/% GC2/% GC3/% GCall/% ENC GC1/% GC2/% GC3/% GCall/% ENC rps12 51.61 48.39 27.42 44.90 55.31 52.10 50.42 29.41 45.60 45.54 ycf1 43.55 34.68 38.71 30.70 49.34 45.38 33.61 38.66 30.60 49.16 rps7 50.00 45.16 20.16 40.40 45.81 51.26 45.38 20.17 41.70 53.41 ndhB 37.10 30.65 35.48 37.40 50.52 36.97 30.25 36.13 37.00 46.46 ycf2 40.32 31.45 37.90 37.70 53.35 39.50 31.09 36.97 38.80 50.59 rpl2 45.97 42.74 30.65 45.00 57.04 38.98 43.22 25.42 39.00 41.33 psbA 48.39 45.16 31.45 43.40 55.78 47.06 45.38 31.93 43.30 55.79 matK 44.35 22.58 22.58 32.80 47.1 44.54 22.69 23.53 32.80 46.71 atpA 58.06 37.10 20.97 41.40 51.02 57.98 36.13 21.85 41.60 60.37 atpF 45.16 36.29 37.90 38.00 43.37 44.54 35.29 38.66 39.90 48.78 atpI 48.39 37.90 27.42 38.70 56.35 47.90 38.66 28.57 38.70 56.35 rps2 41.13 45.97 27.42 39.70 55.68 41.18 47.06 26.05 39.70 55.68 rpoC2 50.00 34.68 32.26 38.70 56.29 50.42 33.61 31.09 38.80 56.17 rpoC1 48.39 38.71 25.00 38.80 50.15 48.74 37.82 26.05 38.80 50.15 rpoB 41.94 31.45 24.19 39.70 56.80 42.86 31.93 23.53 39.70 56.73 psbD 45.97 48.39 30.65 43.50 54.60 45.38 48.74 31.09 43.50 54.60 psbC 57.26 43.55 35.48 44.90 53.61 57.98 42.86 36.97 43.70 43.75 rps14 43.93 49.07 29.63 42.00 50.66 43.56 47.52 31.68 42.00 50.66 psaB 56.45 45.16 28.23 42.20 48.20 57.14 45.38 26.89 42.20 48.14 psaA 50.00 43.55 37.90 43.60 52.35 49.58 44.54 37.82 43.50 52.29 ycf3 45.97 37.10 28.23 40.80 55.61 44.54 36.97 26.89 39.60 61.00 rps4 53.23 40.32 25.81 39.90 48.7 52.1 40.34 26.89 39.90 48.70 ndhJ 50.81 37.10 31.45 41.30 56.28 52.1 37.82 31.93 39.90 51.41 ndhK 40.32 49.19 22.58 38.10 58.39 40.34 49.58 21.01 36.90 47.24 ndhC 45.53 33.87 24.19 36.30 46.95 47.06 33.61 24.37 35.00 45.99 atpE 50.81 38.71 26.61 39.10 47.78 51.26 36.13 26.89 41.70 55.91 atpB 62.10 41.94 29.03 42.00 44.86 62.18 42.86 31.09 43.30 56.14 rbcL 54.84 47.58 27.42 44.20 48.16 54.62 48.74 27.73 44.20 47.96 accD 35.48 33.06 29.84 36.40 46.69 36.13 31.93 31.09 37.40 51.70 ycf4 38.71 42.74 29.03 38.00 46.79 38.66 44.54 30.25 38.00 55.97 cemA 34.68 23.39 37.10 33.50 52.34 34.45 22.69 38.66 33.50 52.34 petA 52.42 40.32 24.19 39.20 48.56 51.26 39.5 25.21 39.20 48.56 rps18 35.29 43.14 26.47 35.00 35.64 35.29 43.69 26.47 35.00 35.64 rpl20 38.98 43.22 25.42 39.00 41.33 38.98 43.22 25.42 39.00 41.33 clpP 50.81 36.29 27.42 40.60 52.48 57.14 37.82 25.21 41.80 54.64 psbB 50.81 47.58 38.71 44.20 47.41 51.26 48.74 40.34 44.00 47.14 petB 48.39 38.71 31.45 42.80 55.46 47.06 38.66 30.25 41.60 60.80 petD 48.39 40.32 30.65 39.50 44.62 51.26 36.13 26.05 41.20 44.37 rpoA 47.58 41.94 27.42 35.00 59.26 47.9 42.02 25.21 34.90 58.49 rps11 53.23 58.06 20.97 45.60 50.97 52.10 50.42 29.41 45.60 45.54 rps8 42.74 41.13 26.61 39.00 54.31 45.38 33.61 38.66 30.00 49.16 rpl14 56.10 36.59 26.02 41.70 55.31 51.26 45.38 20.17 41.70 53.41 rpl16 52.42 53.23 20.16 42.70 44.20 36.97 30.25 36.13 37.00 46.46 rps3 46.77 29.03 25.81 35.00 47.72 39.50 31.09 36.97 38.80 50.59 rpl22 43.55 38.71 22.58 36.70 57.04 52.10 57.98 20.17 45.60 50.97 ndhF 39.52 34.68 23.39 33.20 50.05 40.34 41.18 26.89 38.20 57.94 ccsA 29.84 33.87 24.19 33.80 59.41 56.30 37.82 26.05 41.70 55.31 ndhE 39.22 33.01 24.51 33.30 50.31 52.94 52.94 19.33 42.70 44.20 ndhG 41.13 33.06 25.00 33.80 61.00 46.22 27.73 26.05 34.60 44.18 ndhI 42.74 39.52 29.84 37.40 55.31 43.70 39.50 23.53 36.70 57.04 ndhA 44.35 37.10 21.77 34.00 41.23 40.34 34.45 22.69 31.70 41.66 ndhH 49.19 37.10 22.58 38.30 58.29 28.57 34.45 24.37 33.80 59.38 表 3 小果油茶和越南油茶不同基因密码子RSCU分析
Table 3 RSCU analysis of different gene codons of Camellia meiocarpa and C. vietnamensis
氨基酸 小果油茶 Camellia meiocarpa 越南油茶 C. vietnamensis 密码子 数目 RSCU 密码子 数目 RSCU 苯丙氨酸 Phe UUU 795 1.17 UUU 815 1.19 UUC 553 0.83 UUC 520 0.81 亮氨酸 Leu UUA 520 1.51 UUA 535 1.59 UUG 558 1.46 UUG 493 1.44 CUU 478 1.12 CUU 439 1.11 CUC 217 0.52 CUC 214 0.54 CUA 340 0.84 CUA 314 0.86 CUG 254 0.56 CUG 230 0.47 异亮氨酸 Ile AUU 720 1.27 AUU 732 1.33 AUC 436 0.73 AUC 422 0.75 AUA 581 0.99 AUA 548 0.92 蛋氨酸 Met AUG 513 0.96 AUG 463 0.92 缬氨酸 Val GUU 367 1.32 GUU 366 1.44 GUC 172 0.75 GUC 181 0.7 GUA 336 1.21 GUA 312 1.11 GUG 204 0.71 GUG 174 0.69 丝氨酸 Ser UCU 362 1.2 UCU 405 1.04 UCC 250 0.84 UCC 264 0.85 UCA 405 1.65 UCA 422 1.49 UCG 184 0.87 UCG 200 0.81 脯氨酸 Pro CCU 230 1.06 CCU 248 1.16 CCC 146 0.85 CCC 126 0.65 CCA 239 1.19 CCA 265 1.3 CCG 143 0.91 CCG 145 0.88 苏氨酸 Thr ACU 235 1.01 ACU 233 1 ACC 169 0.8 ACC 174 0.73 ACA 297 1.41 ACA 299 1.02 ACG 133 0.79 ACG 133 0.89 丙氨酸 Ala GCU 196 1.1 GCU 233 1.17 GCC 109 0.77 GCC 117 0.99 GCA 188 1.11 GCA 192 1.04 GCG 89 0.87 GCG 76 0.79 酪氨酸 Tyr UAU 595 1.28 UAU 622 1.32 UAC 319 0.68 UAC 313 0.68 终止密码子 TER UAA 403 1.18 UAA 407 1.06 UAG 340 0.91 UAG 365 0.96 组氨酸 His CAU 288 1.26 CAU 315 1.18 CAC 154 0.66 CAC 161 0.66 谷氨酰胺 Gln CAA 446 1.31 CAA 430 1.37 CAG 249 0.69 CAG 215 0.63 天冬酰胺 Asn AAU 636 1.32 AAU 575 1.25 AAC 313 0.68 AAC 322 0.71 赖氨酸 Lys AAA 831 1.25 AAA 824 1.36 AAG 459 0.75 AAG 437 0.64 天冬氨酸 Asp GAU 447 1.31 GAU 451 1.43 GAC 166 0.66 GAC 152 0.57 谷氨酸 Glu GAA 592 1.37 GAA 612 1.33 GAG 280 0.63 GAG 277 0.67 半胱氨酸 Cys UGU 235 0.99 UGU 227 1.04 UGC 232 0.86 UGC 235 0.84 终止密码子 TER UGA 336 0.92 UGA 407 0.98 色氨酸 Trp UGG 421 0.96 UGG 428 0.94 精氨酸 Arg CGU 152 0.7 CGU 149 0.86 CGC 93 0.45 CGC 83 0.4 CGA 214 1.11 CGA 224 1.08 CGG 143 0.74 CGG 147 0.73 丝氨酸 Ser AGU 205 0.85 AGU 227 1.01 AGC 186 0.59 AGC 164 0.57 精氨酸 Arg AGA 383 1.79 AGA 406 1.69 AGG 263 1.81 AGG 251 1.34 甘氨酸 Gly GGU 237 0.9 GGU 249 0.88 GGC 164 0.54 GGC 161 0.56 GGA 333 1.16 GGA 404 1.28 GGG 300 1.33 GGG 284 1.28 注:加粗的表示高频密码子(RSCU > 1)。 表 4 ENC比值的频率分布
Table 4 Frequency distribution of ENC ratios
小果油茶 Camellia meiocarpa 越南油茶 C. vietnamensis 组段 组中值 组数 频率/% 组段 组中值 组数 频率/% −0.15 ~ −0.05 −0.1 2 3.8 −0.15-−0.05 −0.1 4 7.7 −0.05 ~ 0.05 0 14 26.9 −0.05-0.05 0 18 34.6 0.05 ~ 0.15 0.1 27 51.9 0.05-0.15 0.1 21 40.4 0.15 ~ 0.25 0.2 6 11.5 0.15-0.25 0.2 6 11.5 0.25 ~ 0.35 0.3 3 5.8 0.25-0.35 0.3 3 5.8 合计 52 100 合计 52 100 表 5 小果油茶和越南油茶叶绿体基因组的最优密码子分析
Table 5 Optimal codons analysis in chloroplast genome of Camellia meiocarpa and C. vietnamensis
氨基酸 密码子 小果油茶Camellia meiocarpa 密码子 越南油茶C. vietnamensis 高表达基因 低表达基因 △RSCU 高表达基因 低表达基因 △RSCU 数目 RSCU 数目 RSCU 数目 RSCU 数目 RSCU Phe UUU* 46 1.32 75 1.18 0.14 UUU* 75 1.28 19 1.15 0.13 UUC 26 0.68 46 0.82 −0.14 UUC 40 1.04 20 1.22 −0.18 Leu UUA*** 50 2.12 51 1.47 0.65 UUA 56 1.13 27 1.30 −0.18 UUG* 40 1.43 40 1.21 0.22 UUG 35 0.78 25 0.83 −0.05 CUU** 35 1.24 27 0.81 0.43 CUU 15 0.60 55 0.93 −0.33 CUC 11 0.32 25 0.68 −0.36 CUC 15 1.20 34 1.13 0.07 CUA 22 0.60 33 1.02 −0.42 CUA 13 0.60 59 0.87 −0.27 CUG 10 0.29 25 0.80 −0.51 CUG 8 0.40 49 1.07 −0.67 Ile AUU 60 1.46 72 1.63 −0.17 AUU* 14 1.20 31 0.98 0.22 AUC 38 0.65 26 0.59 0.06 AUC 9 0.60 48 0.95 −0.35 AUA* 46 0.89 37 0.78 0.10 AUA 3 1.00 28 1.00 0.00 Met AUG 45 1.00 45 1.00 0.00 AUG* 12 1.20 46 1.07 0.13 Val GUU* 44 1.39 29 1.23 0.15 GUU* 50 0.86 13 0.64 0.22 GUC 9 0.36 9 0.52 −0.16 GUC 19 0.79 35 0.78 0.01 GUA* 54 1.62 30 1.52 0.10 GUA 9 1.08 83 1.05 0.03 GUG 29 0.63 17 0.72 −0.10 GUG 42 1.05 13 1.03 0.02 Ser UCU* 22 1.31 10 1.14 0.17 UCU 34 1.32 11 1.37 −0.05 UCC*** 16 1.49 2 0.40 1.09 UCC 41 0.83 5 1.44 −0.61 UCA** 16 1.41 19 1.04 0.37 UCA* 32 1.01 19 0.84 0.17 UCG 9 0.51 6 0.93 −0.43 UCG** 34 1.12 6 0.66 0.46 Pro CCU 23 0.91 6 1.24 −0.33 CCU* 16 0.91 5 0.80 0.11 CCC 15 0.92 13 1.25 −0.33 CCC*** 5 2.00 23 1.01 0.99 CCA*** 18 1.31 3 0.80 0.51 CCA 4 0.80 17 0.91 −0.11 CCG 16 0.86 8 0.86 0.01 CCG 6 0.68 8 1.12 −0.44 Thr ACU*** 28 1.61 5 0.95 0.66 ACU* 5 1.13 23 1.00 0.13 ACC 9 0.32 14 1.24 −0.92 ACC 8 1.07 14 1.13 −0.06 ACA*** 36 1.87 8 0.96 0.91 ACA 3 0.80 13 1.05 −0.25 ACG 5 0.19 13 1.03 −0.84 ACG* 7 1.08 8 0.83 0.25 Ala GCU** 30 1.10 12 0.80 0.30 GCU** 22 1.13 5 0.80 0.33 GCC 18 0.94 18 1.30 −0.36 GCC 20 0.80 17 1.17 −0.37 GCA* 29 1.23 16 1.02 0.22 GCA 18 1.03 31 1.02 0.01 GCG 15 0.73 6 1.12 −0.39 GCG 21 0.93 12 1.20 −0.27 Tyr UAU** 33 1.73 48 1.33 0.40 UAU 25 0.68 15 1.09 −0.42 UAC 7 0.27 51 1.12 −0.85 UAC* 43 1.09 20 1.00 0.09 TER UAA* 15 1.44 61 1.29 0.14 UAA* 22 1.11 24 0.97 0.14 UAG 7 0.13 51 1.12 −0.99 UAG 26 0.92 15 1.04 −0.12 His CAU** 12 1.70 29 1.27 0.43 CAU* 36 1.13 80 0.87 0.27 CAC 4 0.30 12 0.73 −0.43 CAC*** 14 1.25 19 0.69 0.55 Gln CAA** 33 1.59 47 1.27 0.32 CAA 9 0.90 31 0.91 −0.01 CAG 14 0.41 29 0.73 −0.32 CAG 19 0.87 43 1.13 −0.27 Asn AAU* 41 1.55 38 1.34 0.21 AAU* 15 1.20 62 1.03 0.17 AAC 17 0.45 18 0.66 −0.21 AAC* 18 1.11 43 1.01 0.11 Lys AAA** 67 1.53 45 1.22 0.32 AAA 9 0.89 33 0.99 −0.11 AAG 20 0.47 27 0.78 −0.32 AAG 1 0.60 35 0.98 −0.38 Asp GAU** 32 1.80 14 1.40 0.40 GAU 21 0.77 17 1.11 −0.34 GAC 8 0.20 9 0.60 −0.40 GAC* 40 1.12 33 1.03 0.10 Glu GAA* 51 1.44 27 1.16 0.28 GAA 28 0.98 45 1.03 −0.04 GAG 16 0.56 25 0.84 −0.28 GAG 16 0.83 18 0.89 −0.06 Cys UGU*** 8 1.22 6 0.69 0.53 UGU*** 30 1.66 6 0.67 0.99 UGC 4 0.38 10 1.31 −0.93 UGC 59 1.19 12 1.22 −0.03 TER UGA*** 15 1.44 25 0.58 0.85 UGA 20 0.72 27 1.10 −0.37 Trp UGG 21 0.80 29 1.00 −0.20 UGG 11 0.53 7 0.65 −0.12 Arg CGU*** 26 2.05 3 0.44 1.61 CGU** 32 1.44 19 1.03 0.42 CGC 4 0.22 8 0.92 −0.70 CGC 3 0.43 28 1.53 −1.10 CGA** 20 1.48 8 1.06 0.41 CGA 6 1.03 18 1.03 0.00 CGG 2 0.10 10 1.13 −1.03 CGG 19 1.11 8 1.04 0.07 Ser AGU** 15 0.98 8 0.52 0.46 AGU 7 0.80 30 0.94 −0.14 AGC 6 0.30 9 0.74 −0.43 AGC 16 1.24 11 1.17 0.08 Arg AGA* 27 1.74 10 1.53 0.21 AGA 4 0.87 11 0.91 −0.04 AGG 7 0.42 8 0.92 −0.50 AGG 3 0.21 22 0.99 −0.77 Gly GGU*** 43 1.54 10 0.95 0.59 GGU 11 0.66 16 0.88 −0.23 GGC 5 0.21 7 0.46 −0.25 GGC* 29 0.87 18 0.73 0.14 GGA 33 1.22 16 1.18 0.04 GGA 23 0.55 29 0.75 −0.20 GGG 28 1.03 3.8 1.41 −0.37 GGG 25 1.20 22 1.29 −0.09 注:*表示0.08 ≤ △RSCU < 0.3,**表示0.3 ≤ △RSCU < 0.5,***表示△RSCU ≥ 0.5,加粗表示最优密码子。 -
[1] 张文达, 赵逸伦, 王湘雨, 等. 再力花叶绿体基因组特征和系统发育分析[J]. 分子植物育种, 2024, 22(3): 1−14. Zhang W D, Zhao Y L, Wang X Y, et al. The characteristics of chloroplast genome and phylogenic analysis of Thalia dealbata Fraser [J]. Molecular Plant Breeding, 2024, 22(3): 1−14.
[2] 段春燕, 王晓凌. 重瓣榆叶梅全叶绿体基因组遗传特征分析[J]. 浙江农林大学学报, 2024, 41(3): 577−585. Duan C Y, Wang X L. Genetic characteristics of whole chloroplast genome in Prunus triloba ‘Multiplex’[J]. Journal of Zhejiang A& F University, 2024, 41(3): 577−585.
[3] 张晶晶, 袁庆, 魏瑶, 等. 忍冬属囊管组植物叶绿体基因组进化分析[J]. 中草药, 2024, 55(9): 3085−3097. Zhang J J, Yuan Q, Wei Y, et al. Evolutionary analysis of chloroplast genomes of Sect. Isika (Lonicera) species[J]. Chinese Traditional and Herbal Drugs, 2024, 55(9): 3085−3097.
[4] 房振西, 季倩, 胡佳栋, 等. 白鼠尾草叶绿体基因组序列特征与系统进化分析[J]. 药学学报, 2024, 59(5): 1484−1493. Fang Z X, Ji Q, Hu J D, et al. Characterization and phylogenetic analysis of the complete chloroplast genome of Salvia apiana Jepson[J]. Acta Pharmaceutica Sinica, 2024, 59(5): 1484−1493.
[5] 季凯凯, 宋希强, 陈春国, 等. 木兰科叶绿体基因组的密码子使用特征分析[J]. 中国农业科技导报, 2020, 22(11): 52−62. Ji K K, Song X Q, Chen C G, et al. Codon usage profiling of chloroplast genome in Magnoliaceae[J]. Journal of Agricultural Science and Technology, 2020, 22(11): 52−62.
[6] 王杰敏, 马东来, 韩晓伟, 等. 24份忍冬属材料叶绿体基因组密码子使用偏好性分析[J]. 植物资源与环境学报, 2023, 32(3): 12−23. Wang J M, Ma D L, Han X W, et al. Analysis on codon usage bias of chloroplast genomes 24 Lonicera materials[J]. Journal of Plant Resources and Environment, 2023, 32(3): 12−23.
[7] 曹克璠, 李本末, 刘嘉伟, 等. 车轴草属叶绿体基因组密码子特征和系统发育分析[J]. 分子植物育种, 2024, 22(4): 1−14. Cao K F, Li B M, Liu J W, et al. Characterization and phylogenetic analysis of the chloroplast genome codons of the genus Trifolium[J]. Molecular Plant Breeding , 2024, 22(4): 1−14.
[8] 刘文丽, 王智勇, 田春育, 等. 赖草属叶绿体基因组密码子偏好性分析[J]. 中国草地学报, 2024, 46(2): 14−23. Liu W L, Wang Z Y, Tian C Y, et al. Codon bias analysis in chloroplast genomes of Leymus species[J]. Chinese Journal of Grassland, 2024, 46(2): 14−23.
[9] 魏亚楠, 龚明贵, 白娜, 等. 梁山慈竹叶绿体基因组密码子偏好性分析[J]. 浙江农林大学学报, 2024, 41(4): 696−705. Wei Y N, Gong M G, Bai N, et al. Analysis of codon preference in chloroplast genome of Dendrocalamus farinosus[J]. Journal of Zhejiang A & F University, 2024, 41(4): 696−705.
[10] 早浩龙, 李奇, 黄珍华, 等. 人参和三七叶绿体基因组密码子偏好性比较分析[J]. 分子植物育种, 2024.22(5): 1−17. Zao H L, Li Q, Huang Z H, et al. Comparative analysis of codon usage bias in chloroplast genome between Panax ginseng and Panax notoginseng[J]. Molecular Plant Breeding, 2024.22(5): 1−17.
[11] 王鹏良, 杨利平, 吴红英, 等. 普通油茶叶绿体基因组密码子偏好性分析[J]. 广西植物, 2018, 38(2): 135−144. Wang P L, Yang L P, Wu H Y, et al. Condon preference of chloroplast genome in Camellia oleifera[J]. Guihaia, 2018, 38(2): 135−144.
[12] 郝丙青, 夏莹莹, 叶航, 等. 香花油茶叶绿体基因组密码子偏好性分析[J]. 中南林业科技大学学报, 2022, 42(9): 178−186. Hao B Q, Xia Y Y, Ye H, et al. Analysis on codon usage bias of the chloroplast genome of Camellia osmantha[J]. Journal of Central South University of Forestry & Technology, 2022, 42(9): 178−186.
[13] 司春灿, 林英, 尚天玉. 油茶根际促生菌的筛选与促生特性[J]. 中南林业科技大学学报, 2024, 44(4): 28−35. Si C C, Lin Y, Shang T Y. Isolation and promoting characteristics of the rhizospheric bacteria of Camellia oleifera Abel[J]. Journal of Central South University of Forestry & Technology, 2024, 44(4): 28−35.
[14] 林水富. 福建省生物柴油原料树种及其可持续开发探讨[J]. 亚热带农业研究, 2012, 8(4): 279−283. Lin S F. On the biodiesel feedstock trees and their sustainable development in Fujian Province[J]. Subtropical Agricultural Research, 2012, 8(4): 279−283.
[15] 邓海艳, 陶丽萍. 油茶产业与乡村振兴的耦合研究: 以湖南邵阳县为例[J]. 武汉轻工大学学报, 2023, 42(6): 27−36. Deng H Y, Tao L P. Study on the coupling oil-tea industry and rural revitalization: taking in Shaoyang County, Hunan Province as an example[J]. Journal of Wuhan Polytechnic University, 2023, 42(6): 27−36.
[16] 李振东, 陈向东, 吴涛, 等. 黎平县小果油茶良种栽培技术[J]. 绿色科技, 2021, 23(3): 103−104,114. Li Z D, Chen X D, Wu T, et al. Cultivation techniques for fine varieties of Camellia meiocarpa in Liping County[J]. Journal of Green Science and Technology, 2021, 23(3): 103−104,114.
[17] Liang H, Qi H, Wang Y, et al. Comparative chloroplast genome analysis of Camellia oleifera and C. meiocarpa: phylogenetic relationships, sequence variation and polymorphism markers[J]. Tropical Plants, 2024, 3(1): 1−12.
[18] Lyu T, Wang Y, Hu Z, et al. The complete chloroplast genome of Camellia vietnamensis, an economic shrub producing edible seed oil[J]. Mitochondrial DNA Part B, 2019, 4(2): 3736−3737. doi: 10.1080/23802359.2019.1681305
[19] 肖明昆, 聂恺宏, 沈绍斌, 等. 复羽叶栾树叶绿体基因组密码子偏好性分析[J]. 西南林业大学学报(自然科学), 2023, 43(3): 56−63. Xiao M K, Nie K H, Shen S B, et al. Analysis of codon usage bias in the chloroplast genome of Koelreuteria bipinnata[J]. Journal of Southwest Forestry University (Natural Science), 2023, 43(3): 56−63.
[20] 辛雅萱, 黎若竹, 李鑫, 等. 杧果叶绿体基因组密码子使用偏好性分析[J]. 中南林业科技大学学报, 2021, 41(9): 148−156,165. Xin Y X, Li R Z, Li X, et al. Analysis on codon usage bias of chloroplast genome in Mangifera indica[J]. Journal of Central South University of Forestry & Technology, 2021, 41(9): 148−156,165.
[21] Novembre J A. Accounting for background nucleotide composition when measuring codon usage bias[J]. Molecular Biology and Evolution, 2002, 19(8): 1390−1394. doi: 10.1093/oxfordjournals.molbev.a004201
[22] Chen C, Chen H, Zhang Y, et al. TBtools: an integrative toolkit developed for interactive analyses of big biological data[J]. Molecular Plant, 2020, 13(8): 1194−1202.
[23] Sueoka N. Directional mutation pressure and neutral molecular evolution[J]. Proceedings of the National Academy of Sciences, 1988, 85(8): 2653−2657. doi: 10.1073/pnas.85.8.2653
[24] 梁皓辉, 符虹宇, 黎钊坪, 等. 小球藻叶绿体基因组密码子偏好性分析[J]. 分子植物育种, 2020, 18(17): 5665−5673. Liang H H, Fu H Y, Li Z P, et al. Analysis on codon usage bias of chloroplast genome from Chlorella[J]. Molecular Plant Breeding, 2020, 18(17): 5665−5673.
[25] 刘慧, 王梦醒, 岳文杰, 等. 糜子叶绿体基因组密码子使用偏性的分析[J]. 植物科学学报, 2017, 35(3): 362−371. Liu H, Wang M X, Yue W J, et al. Analysis of codon usage in the chloroplast genome of Broomcorn millet (Panicum miliaceum L.)[J]. Plant Science Journal, 2017, 35(3): 362−371.
[26] Wright F. The effective number of codons' used in a gene[J]. Gene, 1990, 87(1): 23−29. doi: 10.1016/0378-1119(90)90491-9
[27] Sueoka N. Near homogeneity of PR2-bias fingerprints in the human genome and their implications in phylogenetic analyses[J]. Journal of Molecular Evolution, 2001, 53(4−5): 469−476. doi: 10.1007/s002390010237
[28] Xing Y, Xue N L, Xue P C. Analysis of codon usage pattern in Taenia saginata based on a transcriptome dataset[J]. Parasites & Vectors, 2014, 7(1): 527.
[29] 张妙霞, 赖钟雄, 赵巧阳. 野生香蕉叶片总RNA提取方法研究[J]. 中国农学通报, 2009, 25(14): 51−54. Zhang M X, Lai Z X, Zhao Q Y. The method of total RNA isolation from the wild banana leaves[J]. Chinese Agricultural Science Bulletin, 2009, 25(14): 51−54.
[30] 杜梦雪, 张鑫, 高洁, 等. 紫叶苔(Pleurozia purpurea)线粒体基因组密码子偏好性分析[J]. 河北科技大学学报, 2025, 46(1): 91−99. Du M X, Zhang X, Gao J, et al. Analysis of codon usage bias in the mitochondrial genome of Pleurozia purpurea[J]. Journal of Hebei University of Science and Technology, 2025, 46(1): 91−99.
[31] 朱艳, 韩长志. 普通核桃与深纹核桃中叶绿体基因组密码子使用特征对比[J]. 江苏农业学报, 2024, 40 (8): 1507−1520. Zhu Y , Han C Z. Comparative of codon usage characteristics of chloroplast genome in Juglans regia and Juglans sigillate[J]. Jiangsu Agricultural Journal, 2024, 40 (8): 1507−1520.
[32] Kwak S Y, Lew T T S, Sweeney C J, et al. Chloroplast selective gene delivery and expression in planta using chitosan-complexed single-walled carbon nanotube carriers[J]. Nature Nanotechology, 2019, 14(5): 447−455. doi: 10.1038/s41565-019-0375-4
[33] 李启少, 王正德, 李建运, 等. 棕红悬钩子叶绿体的基因组结构与序列特征分析[J]. 西南林业大学学报(自然科学), 2024, 44(4): 93−105. Li Q S, Wang Z D, Li J Y, et al. Choroplast genome characteristics and comparative analysis of Rubus rufus[J]. Journal of Southwest Forestry University (Natural Science), 2024, 44(4): 93−105.
[34] 高灿, 樊智丰, 马长乐. 黄药大头茶叶绿体基因组密码子偏好性分析[J]. 西南林业大学学报(自然科学), 2023, 43(5): 66-76. Gao C, Fan Z F, Ma C L. Analysis of uodon usage bias in chloroplast genome of Polyspora chrysandra[J]. Journal of Southwest Forestry University (Natural Science), 2024, 43(5): 66-76.
[35] 余涛, 蒲芬, 管芹, 等. 南欧大戟叶绿体基因组密码子偏好性分析[J]. 江苏农业科学, 2023, 51(15): 35−41. Yu T, Pu F, Guan Q, et al. Codon preference analysis of chloroplast genome of Euphorbia peplus[J]. Jiangsu Agricultural Sciences, 2023, 51(15): 35−41.
[36] 吴宪明, 吴松锋, 任大明, 等. 密码子偏性的分析方法及相关研究进展[J]. 遗传, 2007(4): 420−426. Wu X M, Wu S F, Ren D M, et al. The analysis method and progress in the study of codon bias[J]. Hereditas (Beijing), 2007(4): 420−426.
[37] Yue J, Fei D, Hualin W, et al. An extensive analysis on the global codon usage pattern of baculoviruses[J]. Archives of Virology, 2008, 153(12): 2273−2282. doi: 10.1007/s00705-008-0260-1
[38] 杜雨, 李效雄, 贾西贝, 等. 枸杞叶绿体基因组密码子偏好性分析[J]. 中草药, 2024, 55(4): 1316−1325. Du Y, Li X X, Jia X B, et al. Codon preference analysis of chloroplast genome of Chinese wolfberry[J]. Chinese Traditional and Herbal Drugs, 2024, 55(4): 1316−1325.
[39] 李俊霖, 郭淑红, 张强, 等. 蒙古黄芪叶绿体全基因组特征解析及亲缘性分析[J]. 中草药, 2024, 55(7): 2366−2374. Li J L, Guo S H, Zhang Q, et al. Characteristics and phylogenetic analysis of Astragalus membranaceus var. mongholicus chloroplast whole genome[J]. Chinese Traditional and Herbal Drugs, 2024, 55(7): 2366−2374.
[40] 罗瑶, 胡本祥, 张晗, 等. 卵叶远志叶绿体基因组序列特征与系统发育分析[J]. 中草药, 2023, 54(18): 6065−6073. Luo Y, Hu B X, Zhang H, et al. Chloroplast genome sequence characteristics and phylogenetic analysis of Polygala sibirica[J]. Chinese Traditional and Herbal Drugs, 2023, 54(18): 6065−6073.
[41] 赵靖侨, 王杰敏, 石卫红, 等. 北沙参叶绿体基因组密码子偏好性分析[J]. 分子植物育种, 2024, 22(3): 1−20. Zhao J Q, Wang J M, Shi W H, et al. Analysis on codon usage bias of chloroplast genome in Glehnia littoralis[J]. Molecular Plant Breeding, 2024, 22(3): 1−20.
[42] 杜明川, 王伟, 鲍海娟, 等. 葫芦巴叶绿体基因组密码子偏好性分析[J]. 草地学报, 2024, 32(2): 409−418. Du M C, Wang W, Bao H J, et al. Analysis of codon bias in chloroplast genome of Trigonella foenum-graecum[J]. Acta Agrestia Sinica, 2024, 32(2): 409−418.
[43] 洪森荣, 林顺来, 李盈萍, 等. 甜高粱叶绿体基因组特征及密码子偏好性分析[J]. 草地学报, 2023, 31(12): 3636−3650. Hong S R, Lin S L, Li Y P, et al. Analysis of the complete chloroplast genome sequence characteristics and its code usage bias of Sorghum bicolor[J]. Acta Agrestia Sinica, 2023, 31(12): 3636−3650.