Processing math: 0%
  • Scopus收录期刊
  • CSCD(核心库)来源期刊
  • 中文核心期刊
  • 中国科技核心期刊
  • F5000顶尖学术来源期刊
  • RCCSE中国核心学术期刊
高级检索

毛果杨丝氨酸蛋白酶抑制子PtrSPI的抗虫能力分析

遇文婧, 杨帅, 黄颖, 刁桂萍

遇文婧, 杨帅, 黄颖, 刁桂萍. 毛果杨丝氨酸蛋白酶抑制子PtrSPI的抗虫能力分析[J]. 北京林业大学学报, 2021, 43(9): 51-58. DOI: 10.12171/j.1000-1522.20210163
引用本文: 遇文婧, 杨帅, 黄颖, 刁桂萍. 毛果杨丝氨酸蛋白酶抑制子PtrSPI的抗虫能力分析[J]. 北京林业大学学报, 2021, 43(9): 51-58. DOI: 10.12171/j.1000-1522.20210163
Yu Wenjing, Yang Shuai, Huang Ying, Diao Guiping. Analysis of insect resistance ability of the serine protease inhibitor PtrSPI from Populus tomentosa[J]. Journal of Beijing Forestry University, 2021, 43(9): 51-58. DOI: 10.12171/j.1000-1522.20210163
Citation: Yu Wenjing, Yang Shuai, Huang Ying, Diao Guiping. Analysis of insect resistance ability of the serine protease inhibitor PtrSPI from Populus tomentosa[J]. Journal of Beijing Forestry University, 2021, 43(9): 51-58. DOI: 10.12171/j.1000-1522.20210163

毛果杨丝氨酸蛋白酶抑制子PtrSPI的抗虫能力分析

基金项目: 中央高校基本科研业务费专项(2572020BA08)
详细信息
    作者简介:

    遇文婧,博士,副研究员。主要研究方向:森林保护。Email:ywjlinda2008@163.com 地址:150040黑龙江省哈尔滨市南岗区哈平路134号

    责任作者:

    刁桂萍,博士,副教授。主要研究方向:森林保护。Email:dgp2003@126.com 地址:150040黑龙江省哈尔滨市香坊区和兴路26号

  • 中图分类号: S763.1

Analysis of insect resistance ability of the serine protease inhibitor PtrSPI from Populus tomentosa

  • 摘要:
      目的  研究毛果杨丝氨酸蛋白酶抑制子PtrSPI的抗虫功能,为开发新型林木抗虫生物农药奠定基础。
      方法  本研究通过研究毛果杨丝氨酸蛋白酶抑制子基因PtrSPI的启动子及其在舞毒蛾幼虫取食胁迫下的表达模式,分析PtrSPI基因功能;利用真核重组蛋白PtrSPI饲喂舞毒蛾幼虫,观察记录幼虫的取食量、体质量和死亡率,并测定取食后的幼虫体内丝氨酸蛋白酶活性,探讨PtrSPI蛋白的抗虫能力。
      结果  结果表明毛果杨丝氨酸蛋白酶抑制子基因PtrSPI的启动子区域共包含5个与植物抗病虫相关的元件;经舞毒蛾幼虫取食后,毛果杨叶片的PtrSPI基因呈先降后升的表达模式,且在取食30 h达到峰值,为空白对照的2.03倍;高质量浓度重组蛋白PtrSPI(300和500 mg/mL)对舞毒蛾幼虫的取食量和体质量有显著的抑制作用,而且分别在取食4和6 d后舞毒蛾幼虫死亡率均达到60%以上,而幼虫体内丝氨酸蛋白酶的活性在取食初期显著上升。
      结论  本研究验证了毛果杨丝氨酸蛋白酶抑制子PtrSPI的抗虫能力,可为进一步研发新型无公害抗虫生物农药提供理论基础和研究材料。
    Abstract:
      Objective  To lay the foundation of the development of new insect-resistant biological pesticides in trees, the insect-resistant function of the serine protease inhibitor PtrSPI of Populus tomentosa was studied.
      Method  To analyze the function of serine protease inhibitor gene PtrSPI, the promoter and the expression pattern under feeding stress of Lymantria dispar larvaes of the gene PtrSPI in P. tomentosa were studied. To discuss the anti-insect ability of PtrSPI, the food intake, the body mass, the mortality and the serine protease enzyme activities of L. dispar larvae were studied after using the eukaryotic recombinant protein PtrSPI feeding L. dispar larvaes.
      Result  The results showed that 5 elements related to plant resistance to disease and insects were in the promoter region of the serine protease inhibitor gene PtrSPI of P. tomentosa; the expression pattern of the gene PtrSPI in P. tomentosa leaves was firstly decreased and then increased after being fed by L. dispar larvae, and the peak was 2.03 times of the control at 30 h; under the high concentration of recombinant protein (300 and 500 mg/mL), the food intake and the body mass of L. dispar larvaes were significantly inhibited, the mortality of L. dispar larvaes was up to more than 60% after 4 and 6 days, respectively, and the activities of the serine protease in L. dispar larvaes were significantly increased at the beginning of feeding.
      Conclusion  This study verifies the insect resistance of the serine protease inhibitor PtrSPI of P. tomentosa, and it provides theoretical basis and research materials for further research and development of new non-pollution and insect-resistance biological pesticides.
  • 地面激光雷达(Terrestrial Laser Scanning,TLS)获取点云数据方便快捷,能够较好地反映林下垂直结构,基于这一特性有研究者将其应用于林分参数提取[1]、树干点检测[23]、单木分割和建模[46]等研究。根据TLS林分点云分离出地面、树干和枝叶等类别可为数字高程模型构建、单木定位[6]、胸径和树高反演[1]等研究提供重要依据,所以将点云按类别快速分离在林业研究中具有重要意义。

    点云分类任务主要包括特征构造和特征识别。构造特征是点云分类的基础,多年来,研究者们一直在致力于构造适当的点特征用以描述点与点之间的差异。根据构造策略的不同,构造点特征的方法大致分为两类,一类通过计算直方图的方法来描述点特征[79];另一类通过点与其近邻的相关关系构造几何特征。前者解译性较差,研究者不能从这些特征中直观地解读其所表征的三维特性,且特征维度较高,至少有33维[8],因而很少用于点云分类研究。通过近邻关系构造的特征几何含义明显,研究者可以从中解读其表征的几何含义[12],特征维度相对较低,应用较为广泛。如将近邻点投影到水平的二维平面中构造特征D2DRλ,2D[1011];通过近邻点协方差矩阵特征值的不同组合来挖掘其所表征的几何含义[1214];通过计算近邻点的法向量和曲率构造特征[1516]。构造好特征之后需要寻找适当的方法进行特征识别,成熟的机器学习算法能够快速分离不同特征对应的类别,所以有较多的研究者选择用机器算法学习点特征以达到点云高精度分类的目的。Hackel等[15]和Becker等[17]的研究中分别构造了16和15个几何特征训练随机森林,分类准确率分别为0.90和0.84。上述方法均构造了较高维度的特征,而特征维度较高容易使得特征之间的相关关系复杂化,降低分类器对特征的敏感度,增加特征构造时间和内存消耗[11]

    为了解决地面激光雷达点云分类特征维度较高的问题,本研究以TLS扫描的蒙古栎(Quercus mongolica)人工林数据为基础,通过对原始点云滤波处理后采用快速KDtree搜索近邻点,用近邻点分别计算协方差矩阵特征值、法向量、曲率、方差和最大高程差构造5个几何特征训练分类器。为了表明上述特征在TLS林分点云分类中具有较高的稳定性,本研究分别用Hackel等[15]和Becker等[17]使用的随机森林和本研究引入的xgboost这两个成熟的分类器进行训练,然后选用表现优异的分类器模型分离测试集点云。上述方法旨在构造一组稳健且维度较低的几何特征用于点云分类,以期达到快速分离林分点云的目的。

    本研究数据用地面激光雷达(表1)扫描蒙古栎人工林获取,点间距最小为2 mm,扫描树型完整,扫描时间为2016年6月1日,共架设5个扫描站(图1a),站间平均间距20 m,其中S1扫描站设为360°全景扫描,其余4站(S2、S3、S4、S5)为定向扫描。该蒙古栎人工林(图1b)地势平坦、树种单一且垂直结构较好、林分单木间隔为3 m左右,枝叶间存在遮挡,灌木较少,林分平均密度为2 500株/hm2,平均树高和胸径分别为9.98 m和13.55 cm。

    表  1  三维激光扫描仪技术参数
    Table  1.  Technical parameters of TLS
    参数 Parameter数值 Value
    点位精度 Position precision6 mm
    距离精度 Resolution of distance4 mm
    角度分辨率 Resolution of angle12″
    颜色及波长 Color and wavelengthGreen/532 nm
    扫描距离 Scanning range300 m
    扫描速率 Scanning velocity50 000 点/s
    50 000 points/s
    扫描光斑直径 Scanning spot diameter4.5 mm (0 ~ 50 m)
    下载: 导出CSV 
    | 显示表格
    图  1  扫描站和蒙古栎人工林
    Figure  1.  Scanning stations and plantation of Mongolian oak

    用以训练分类器的样本通常分为训练样本、验证样本和测试样本3类。训练样本用于训练分类器;验证样本和训练样本均采集自同一样本集,验证样本常用做比较不同分类器的性能。本研究将验证集准确率较高的分类器用于测试样本的分类。本研究的5个站点TLS林分点云数据几何特征相近,全景扫描相较于定向扫描数据量丰富,所以本研究的训练样本和验证样本分别是从标记好的全景扫描数据中随机采集1 000 000和10 000个点获得,测试样本为剩余4个站点中任选1站的点云数据。

    本研究的5站数据坐标系均由相对独立的笛卡尔坐标系定义(图2),坐标原点O为扫描仪中心所在的空间位置,XY轴互相垂直,其所确定的平面为水平平面,Z轴指向由右手法则确定。使用激光雷达进行数据采集时,若空间中存在一点P,其在上述坐标系中的空间距离为OP,那么P点的空间坐标即为OP向量在XYZ轴3个方向上的分量。

    图  2  数据坐标系
    Figure  2.  Data coordinate system

    在林分点云分类任务中,同一类别的点云具有相似的特征,所以特征的构造对点云分类准确率有决定性作用。本研究构造的5个几何特征定义如下:

    Rλ,2D=λ2,2Dλ1,2DV=1|nZ|Cλ=λ3λ1+λ2+λ3σZKNN=1k1ki=1(ZiˉZ)(ZiˉZ)ΔZKNN=Zmax (1)

    式中:λ1 > λ2 > λ3 ≥ 0表示点和近邻点协方差矩阵的特征值,λ1, 2D > λ2, 2D≥ 0表示近邻点在XY坐标的特征值,Rλ, 2D指近邻点在水平投影中第二特征值与第一特征值的比值;V是垂直度;nZ是邻近点法线向量Z轴方向分量;Cλ是点与近邻点构成曲面的曲率;{\sigma _{Z_{\rm{KNN}}}}是近邻点在Z方向的方差;\Delta {Z_{\rm{KNN}}}是近邻点在Z方向的最大距离,KNN表示快速KDtree搜索的近邻值,Zi \bar Z分别表示近邻点的Z坐标值和Z坐标均值,ZmaxZmin分别表示近邻点最大和最小Z坐标值。

    图3abc分别为全景扫描站中截取的3个类别林分激光雷达点云。由图3可知,本研究的地面点平面特性较好,树干点的垂直特性显著,枝叶点形状不规则且离散特性较差。为不失一般性,表2给出了用全景扫描点云计算3个类别几何特征的均值。特征Rλ,2D与近邻点在XY轴投影的离散程度相关,近邻点云分布集中则其值较小,反之则较大;地面点XY方向分布较为分散,故特征Rλ,2D较大,趋近1;树干点在水平投影面呈月牙形,故其值较小,趋近0;枝干离散特性不稳定,故其值趋近0.5。特征V与近邻点逼近曲面的法向量相关,地面的曲面法向量近似平行于Z轴,树干的曲面法向量近似垂直于Z轴,故地面与树干的特征V分别趋近0和1;枝叶的近邻点法向量分布不规律,故其特征V介于地面与树干之间。特征Cλ用于衡量近邻点逼近曲面的弯曲程度,在3个类别中,地面弯曲程度较小,故Cλ最小;枝叶近邻点比树干近邻点分布集中,故其曲率相对较大;树干曲率介于两者之间。特征{\sigma _{Z_{\rm{KNN}}}}和ΔZKNN仅与近邻点的Z方向分布相关,分布越集中其值越小,反之越大;地面点Z方向差异最小分布集中,故其特征{\sigma _{Z_{\rm{KNN}}}}和ΔZKNN最小;树干Z方向差异比地面大但比枝叶均匀,故枝叶特征{\sigma _{Z_{\rm{KNN}}}}和ΔZKNN值最大,树干特征{\sigma _{Z_{\rm{KNN}}}}与ΔZKNN值介于地面与枝叶之间。

    图  3  全景扫描站中截取的3个类别点云
    Figure  3.  3 categories of point clouds intercepted in the panoramic scanning station
    表  2  全景扫描不同类别点云的特征均值
    Table  2.  Mean features of different kinds of points from full scanning
     类别 CategoryRλ,2DVCλ\scriptstyle{{\sigma _{Z_{\rm{KNN}}}}}ΔZKNN
    地面 Ground0.732 40.012 90.012 70.000 10.047 3
    树干 Stem0.183 50.873 20.047 20.002 40.142 8
    枝叶 Branch and leaf0.471 50.281 50.085 20.005 90.212 8
    注:Rλ,2D是近邻点在水平投影中第二特征值与第一特征值的比值,V是垂直度,Cλ是点与近邻点构成曲面的曲率,\scriptstyle{{\sigma _{Z_{\rm{KNN}}}}}是近邻点在Z方向的方差,ΔZKNN是近邻点在Z方向的最大距离。Notes: Rλ,2D is the ratio of the second eigenvalue to the first eigenvalue in the horizontal projection of the neighboring points, V is the verticality, Cλ is the curvature of the surface formed by the neighboring points, \scriptstyle{{\sigma _{Z_{\rm{KNN}}}}} is the variance of the neighboring points in the Z direction, ΔZKNN is the maximum distance of the neighboring points in the Z direction.
    下载: 导出CSV 
    | 显示表格

    点近邻计算要考虑两个重要因素:(1)依据近邻点计算的点特征质量;(2)搜索近邻的算法效率。

    在本研究中点云密度与扫描距离呈负相关变化,即距离扫描仪较近的点云密度较大,距离扫描仪较远点云密度较小。一般而言,近邻点云可以基于定半径和定近邻个数进行搜索,前者受点云密度影响较大,点云密度小定半径搜索的点数量较少计算的特征不具代表性;点云密度大定半径搜索点数量急剧增加则降低算法运算效率。通常学者考虑基于K近邻搜索点云[11,1416],这样不仅保证搜索点云个数,而且受点云密度影响较小。当遍历点云数据搜索近邻点时,若近邻点数量相近则其对应的几何特征差异较小;近邻点数量较大则容易搜索到较多其他类别点云促使计算的几何特征失真,所以本研究的K值拟在20 ~ 200范围内,以30为步长分别取值,并进行最优K值探究。

    随着计算机科学的进步,相近样本的搜索效率也取得长足的发展。早期研究者通过计算单样本与所有样本之间的最近距离搜索近邻样本,即KNN搜索[18]。KNN算法的效率与样本的数量呈线性关系,随着样本数量和特征维度的增加其对计算机内存的要求逐渐增高,该算法容易陷入维度灾难。而后研究者又提出了维度递归二叉树的方法搜索最近样本,即KDtree。KDtree算法依据二分类思想按维度迭代分割样本所在空间,直到每个最后一棵树仅由一个元素构成,然后采用回溯方法查找临近点,当近邻点数量达到阈值或近邻点最大距离达到阈值则查找结束。本研究数据量较大,故采用改进的快速KDtree[19]搜索点云K近邻,其算法效率相较于传统KDtree取得了巨大进步。当然也有基于Octree搜索近邻的方法[20]

    分类器的分类精度往往取决于构造的特征,即特征对类别的表征能力决定了分类器的上限。如果两个成熟分类器均能够有效分离地面、树干和枝叶则表明本研究构造的几何特征具有较高的稳定性。本研究分别取Hackel等[15]和Becker等[17]研究中选用的随机森林[21]与近年来在分类比赛中表现优异的xgboost[22]这两个分类器进行比较研究。

    Breiman[21]在文章中对随机森林做如下定义:随机森林是一种包含多个决策树的分类器,每棵树针对输入X给出其所属类别的判断。\left\{ {h\left( {X,{{\varTheta} _m}} \right)} \right.,m = 1,2, \cdots , M\}h\left( {X,{{\varTheta} _m}} \right)是分类器对输入X所属类别做出判断;Θ是一组随机向量,其取决于树的结构;M是决策树的数量。随机森林有3个特性:(1)对输入的N个样本采用bagging方式进行重新采集。(2)节点特征采样,这个策略可以防止过拟合,提高分类器的泛化能力。(3)每棵树都使用贪心算法尽量增长到最大深度。

    随机森林的边缘函数(Mg)定义如下:

    {\rm{Mg}} = a{v_m}I\left( {{h_m}\left( X \right) = Y} \right) - \mathop {\max }\limits_{j \ne Y} a{v_m}I\left( {{h_m}\left( X \right) = j} \right) (2)

    式中:I()是判断函数,hmX)为决策树对样本的判断,m为决策树索引,X表示输入,Y表示类别标签,avm表示所有决策树正确判断的均值,\mathop {\max }\limits_{j \ne Y} a{v_m}表示最多错判的均值。

    该公式的含义是所有决策树正确判断的均值与最多错判均值的差,差值越大表明分类器的置信度越高。

    xgboost是梯度提升决策树[23](Gradient Boosted Decision Trees,GBDT)的改进,也是基于决策树的训练,xgboost相较于GBDT在训练方法上做了较大的改进。其优点如下:(1)引入正则化项,该策略能够防止分类器过拟合;(2)采用剪枝技术,保证算法精度;(3)目标函数采用泰勒展开式的二项逼近;(4)支持并行计算,提高运算效率。

    xgboost优化的目标函数(OBJ)定义如下:

    \begin{aligned} {\rm{OBJ}} =& - \dfrac{1}{2}\displaystyle\sum\limits_{j = 1}^T {\dfrac{{{{\left( {\displaystyle\sum\limits_{i \in {I_j}} {{g_i}} } \right)}^2}}}{{\displaystyle\sum\limits_{i \in {I_j}} {{h_i}} + \lambda }}} + \gamma T \\ {w_j^*} =& - \dfrac{{\displaystyle\sum\limits_{i \in {I_j}} {{g_i}} }}{{\displaystyle\sum\limits_{i \in {I_j}} {{h_i}} + \lambda }} \end{aligned} (3)

    式中:gihi为目标函数的梯度,γλ是目标函数的优化参数,T是决策树的叶子节点数,Ij是训练样本所在的叶子索引,w_j^*是第j个叶子节点的权重。

    训练好分类器之后,需要对其表现做出定性的评价,在机器学习中衡量分类器性能的定义如下:

    \begin{aligned} A =& \dfrac{{{C_N}}}{{{T_N}}}\\ P =& \dfrac{{{C_{N_i}}}}{{{P_{N_i}}}}\\ R =& \dfrac{{{C_{N_i}}}}{{{T_{N_i}}}}\\ F_{1{\rm{score}}} =& 2\dfrac{{PR}}{{P + R}}\\ M_{F_{1{\rm{score}}}} =& \dfrac{1}{n}\displaystyle\mathop \sum \limits_{i = 1}^n F_{1{\rm{score}}} \end{aligned} (4)

    式中:APRF1score M_{F_{1{\rm{score}}}}分别表示分类器的准确率、查准率、召回率、F1分数和F1分数均值。CN表示正确估计的样本数,TN表示样本总量,{C_{N_i}} 表示类别i中正确估计的样本数量, {P_{N_i}}表示估计为类别i的总量, {T_{N_i}}表示实际为类别i的总量,n表示样本类别个数。

    A用于分类器表现直观估计,PR用于评价分类器在某类上的表现。由于难以用两个量衡量分类器在某一类别上的表现,研究者引入F1score。通常还采用 M_{F_{1{\rm{score}}}}衡量分类器的总体表现,其值越大表示分类器分类效果越好。

    用分类器处理点云分类任务时,研究者常常考虑在不影响分类器精度前提下,兼顾特征计算速度和分类器训练速度。图4ab分别展示了随着K值的变化随机森林算法在数据集上的表现。由图4a可知,快速KDtree近邻搜索的时间与K值近似线性关系;在用特征训练分类器时发现随着K值的增大,训练时间逐渐减小,当K大于140时训练用时趋于稳定。

    图  4  快速KDtree搜索用时和随机森林的训练统计量
    Figure  4.  Statistics of random forest training and fast KDtree search

    图4b中分别绘制了随着K值增大分类器在训练样本、验证样本和测试样本上的表现。随着K值的增大,分类器训练准确率逐渐增长,在达到0.96时趋于稳定。测试准确率随着K值的增长也不断提高,当K大于80时,准确率趋于平稳,且在K为140时,准确率达到最大值。随机森林的训练精度总是比测试精度大了近0.03,且在K为140时差值最小,说明随机森林存在轻微的过拟合现象。综上所述,本研究采用K为140的快速KDtree搜索近邻点云。

    在用机器学习处理点云分类时,一组好的特征能够适应多种分类器,即分类器的分类精度很大程度上取决于构造的特征。本研究中随机森林和xgboost均由50个决策树组成,决策树分裂最大深度为6层。由表3可知,xgboost和随机森林在林分点云分类中均有较好的表现,测试集的准确率分别达到0.936 3和0.932 1。仔细分析不难发现,xgboost在每个类别的查准率、召回率、F1scoreM_{F_{1{\rm{score}}}} 均比随机森林有千分级的优势。由2.1节分析可知,随机森林存在轻微的过拟合现象,xgboost在目标函数中引入了正则化项,其在训练中能够较好地控制分类器过拟合,所以xgboost有较好的泛化能力。综合准确率和 M_{F_{1{\rm{score}}}}可知,xgboost的表现略优于随机森林,但两个分类器在本研究构造的特征中均能够较好地完成分类任务。

    表  3  多分类器分类统计量
    Table  3.  Labeling statistics of different classifiers
    分类器
    Classifier
    准确率
    Precision
    类别
    Category
    正确估计
    Right
    estimation
    估计数量
    Number of estimation
    真实数量
    Real
    number
    查准率
    Precision ratio
    召回率
    Recall ratio
    F1分数
    F1 score
    F1分数均值
    Mean F1 score
    xgboost0.936 3 地面
    Ground
    362 553371 882374 8430.974 90.967 20.971 00.942 5
    树干
    Stem
    704 596746 743774 0390.943 60.910 30.926 6
    枝叶
    Branch and leaf
    828 648906 250875 9630.914 40.946 00.929 9
    随机森林
    Random forest
    0.932 1 地面
    Ground
    362 718373 029374 8430.972 40.967 70.970 00.938 9
    树干
    Stem
    699 419744 994774 0390.938 80.903 60.920 9
    枝叶
    Branch and leaf
    825 283906 852875 9630.910 10.942 10.925 8
    下载: 导出CSV 
    | 显示表格

    由2.2节分析可知相较于随机森林,xgboost分类性能较好,所以本节结合xgboost的分类结果进行讨论。图5a图5b分别为用于分类的训练样本和基于xgboost分类结果标记的测试样本,其中颜色绿、红、灰分别代表枝叶、树干、地面。表4为测试样本点云分类的混淆矩阵和错估统计,在混淆矩阵中每行表示分类器在该类别的预测分布,每列的和表示类别总量。表5的列表示每个类别的分类占比。

    图  5  训练样本和xgboost的分类结果
    Figure  5.  Training sets and classification results of xgboost
    表  4  测试样本的混淆矩阵和错估统计
    Table  4.  Confusion matrix and the statistics of wrong estimation in test sets
    类别 Category地面 Ground树干 Stem枝叶 Leaf错估量 Wrong estimation错估占比 Ratio of wrong estimation/%
    地面 Ground362 553 1 9907 3399 3290.46
    树干 Stem2 171704 596 39 976 42 147 2.08
    枝叶 Branch and leaf10 149 67 453 828 648 77 602 3.83
    总和 Total374 873 774 039 875 963 129 078 6.37
    下载: 导出CSV 
    | 显示表格
    表  5  测试样本的类别间的估计准确率统计
    Table  5.  Statistics in estimation accuracy of different classes in test sets
    类别 Category地面 Ground树干 Stem枝叶 Branch and leaf
    地面 Ground96.71 0.260.84
    树干 Stem0.5891.03 4.56
    枝叶 Branch and leaf2.718.7194.60
    下载: 导出CSV 
    | 显示表格

    通过对图5b所示结果进行分析发现,分类器正确标记了测试集中大多类别点云,而且能够有效分离冠层中的树干点,但在地面处分类器容易将部分地面点云错分为枝叶,而在枝叶处分类器容易将部分点云错分为树干。

    结合表4表5可知,分类器正确标记地面、树干和枝叶的准确率分别为96.71%、91.03%和94.60%,错估数据量分别占测试样本总量的0.46%、2.08%和3.83%。2.2节中指出xgboost的准确率为93.63%,由此分析可知其中近6%的错估率来自树干和枝叶的影响。由于树干和枝叶的关系紧密,在树干产生枝干处点近邻构造的空间特征相似度较高,所以分类器容易产生错误估计;分类器能够较好地分离地面,但由于地面起伏和部分落叶的影响分类器在地面与枝叶间也容易产生部分错误估计。由表5可知,类别树干中8.71%的点被错估为枝叶,类别枝叶中4.56%的点被错估为树干,类别地面中2.71%的点被错估为枝叶。

    为了解决地面激光雷达点云分类特征维度较高的问题,本研究依据近邻点的相关关系构造了5个几何特征,借助随机森林和xgboost分类器实现了TLS点云高精度分类,所得结论如下:

    (1)适当的K近邻构造特征有利于提高分类器性能。本研究样地林间间距适中,点云密度与距扫描仪距离呈负相关变化,在使用本研究点云构造K近邻的几何特征训练分类器时发现:随着K值的增大分类器训练准确率不断提高且训练时间逐渐减小,并都慢慢趋于平稳。

    (2)本研究构造的几何特征在林分点云分类任务中有较高的稳定性。使用本研究TLS数据构造特征训练的随机森林和xgboost均能正确标记大多数点云。

    (3)在空间上相近的类别间分类器容易产生错误估计。错分的点云大多在地面与树干或树干与枝叶空间上相交处,这两处点搜索的K近邻多包含两种类别点云。

    本研究构造了5个几何特征,xgboost的训练和测试准确率分别为0.96和0.93,类别错估占比介于0.46% ~ 3.83%之间。Hackel等[15]和Becker等[17]在其研究中分别构造了16和15个几何特征用于随机森林训练。在Hackel等的研究中分类器的测试准确率为0.90,本研究的值比其提高了0.03;本研究的训练准确率与Becker等的研究结果相近(0.95),其测试准确率为0.84,比本研究少0.09,类别间的错估占比介于1.1% ~ 18.9%之间,说明本研究在保证点云分类准确率的基础上,达到了降低特征维度的目的。

    在保证分类器估计准确率的前提下,本研究在处理点云分类任务时极大地降低了用于训练的特征维度,但对在空间上相近的点云识别能力较低。因此,在接下来的研究中,我们将继续探索构造特征的方法,以期能够更好地完成林分点云分类任务。

  • 图  1   PtrSPI基因的启动子功能元件分析

    Figure  1.   Cis elements of PtrSPI gene promoter analysis

    图  2   毛果杨叶片PtrSPI基因在舞毒蛾幼虫取食胁迫下的表达特性

    CK. 未取食叶片;T. 舞毒蛾幼虫取食后的叶片。不同大写字母表示同一处理下不同时间点间的差异显著性(P < 0.05);不同小写字母表示同一时间点不同处理间的差异显著性(P < 0.05)。CK, the unfed leaves are used as control; T, the leaves are fed by L. dispar larvae. Different capital letters mean the significance of different time in the same treatment (P < 0.05); different lowercase letters mean the significance among different treatments at the same times (P < 0.05).

    Figure  2.   Expression feature of PtrSPI gene of P. trichocarpa under feeding stress of L. dispar larvaes

    图  3   重组蛋白PtrSPI对舞毒蛾幼虫取食量的影响

    A. 50 mg/mL质量浓度重组蛋白及对照;B. 100 mg/mL质量浓度重组蛋白及对照;C. 300 mg/mL质量浓度重组蛋白及对照;D. 500 mg/mL质量浓度重组蛋白及对照。大写字母表示同一处理下不同时间点间的差异显著性(P < 0.05);小写字母表示同一时间点不同处理间的差异显著性(P < 0.05)。CK50、CK100、CK300、CK500分别表示不同质量浓度(50、100、300、500 mg/mL)的转空载体酵母发酵液。 下同。A, 50 mg/mL recombinant protein and the control; B, 100 mg/mL recombinant protein and the control; C, 300 mg/mL recombinant protein and the control; D, 500 mg/mL recombinant protein and the control. Capital letters mean the significance of different time in the same treatments (P < 0.05); lowercase letters mean the significance among different treatments at the same time (P < 0.05). CK50, CK100, CK300, CK500 mean different mass concentrations (50, 100, 300, 500 mg/mL) of fermentation broth of the yeast containing empty vector,respectively. The same below.

    Figure  3.   Effects of recombinant protein PtrSPI on the consumption of L. dispar larvaes

    图  4   重组蛋白PtrSPI对舞毒蛾幼虫体质量的影响

    A. 50 mg/mL质量浓度重组蛋白及对照;B. 100 mg/mL质量浓度重组蛋白及对照;C. 300 mg/mL质量浓度重组蛋白及对照;D. 500 mg/mL质量浓度重组蛋白及对照。A, 50 mg/mL recombinant protein and control; B, 100 mg/mL recombinant protein and control; C, 300 mg/mL recombinant protein and control; D, 500 mg/mL recombinant protein and control.

    Figure  4.   Effects of recombinant protein PtrSPI on the body mass of L. dispar larvaes

    图  5   重组蛋白PtrSPI对舞毒蛾幼虫死亡率的影响

    A. 50 mg/mL质量浓度重组蛋白及对照;B. 100 mg/mL质量浓度重组蛋白及对照;C. 300 mg/mL质量浓度重组蛋白及对照;D. 500 mg/mL质量浓度重组蛋白及对照。A, 50 mg/mL recombinant protein and the control; B, 100 mg/mL recombinant protein and the control; C, 300 mg/mL recombinant protein and the control; D, 500 mg/mL recombinant protein and the control.

    Figure  5.   Effects of recombinant protein PtrSPI on the mortality rate of L. dispar larvaes

    图  6   不同处理下舞毒蛾幼虫体内丝氨酸蛋白酶活性

    A. 50 mg/mL质量浓度重组蛋白及对照;B. 100 mg/mL质量浓度重组蛋白及对照;C. 300 mg/mL质量浓度重组蛋白及对照;D. 500 mg/mL质量浓度重组蛋白及对照。A, 50 mg/mL recombinant protein and the control; B, 100 mg/mL recombinant protein and the control; C, 300 mg/mL recombinant protein and the control; D, 500 mg/mL recombinant protein and the control.

    Figure  6.   Activities of serine protease in L. dispar larvaes under different treatments

    表  1   RT-qPCR引物

    Table  1   RT-qPCR primers

    基因 Gene基因全称 Total name引物 Primer序列(5′—3′) Sequence (5′−3′)
    PtrSPI Serine proteinase inhibitor gene Ptr1 AAGGAATGGGTGGTCAGCAA
    Ptr2 GGGACTAGGATTGGTGTCGC
    Actin Reference gene Act1 AACATGGGATTGTTAGCAACTGG
    Act2 TCCATCACCAGAATCCAGCACA
    18S rRNA Reference gene R1 CGAAGACGATCAGATACCGTCCTA
    R2 TTTCTCATAAGGTGCTGGCGGAGT
    下载: 导出CSV
  • [1] 孙红, 周艳涛, 李晓东, 等. 2020年全国主要林业有害生物发生情况及2021年发生趋势预测[J]. 中国森林病虫, 2021, 40(2):45−48.

    Sun H, Zhou Y T, Li X D, et al. The occurrence of major forest pests in China in 2020 and the occurrence trend forecast in 2021[J]. Forest Pest and Disease, 2021, 40(2): 45−48.

    [2] 吕云彤, 张琪慧, 苑冉, 等. 中国森林害虫化学防治研究进展[J]. 环境昆虫学报, 2018, 40(3):543−552.

    Lü Y T, Zhang Q H, Yuan R, et al. Advances in chemical control for forest pests of China[J]. Journal of Environmental Entomology, 2018, 40(3): 543−552.

    [3]

    Johana C, Misas V, Renier L, et al. Papein-like cysteine proteases as hubs in plant immunity[J]. New Phytologist, 2016, 4: 902−907.

    [4]

    Remya P P, Kannan V M. Screening of plant seeds for protease inhibitor against larval gut proteases of Spodoptera Mauritia (boisd.) (Lepidoptera: noctuidae)[J]. International Journal of Agriculture Sciences, 2019, 2: 7773−7776.

    [5] 赵丽芳, 陶美林, 潘国庆. 丝氨酸蛋白酶抑制剂超家族的研究进展[J]. 蝉业科学, 2016, 42(3):532−540.

    Zhao L F, Tao M L, Pan G Q. Advances in serine protease inhibitors (serpin) superfamily[J]. Science of Sericulture, 2016, 42(3): 532−540.

    [6] 孙新菊. 低温处理下的白玉菇丝氨酸蛋白酶的活性及分子特性[J]. 江苏农业科学, 2015, 43(9):270−272.

    Sun X J. Activity and molecular characteristics of sproteinase of Hypsizygus marmoreus treated by low temperature[J]. Jiangsu Agricultural Sciences, 2015, 43(9): 270−272.

    [7]

    Nicole M, Vladimir G, Bernhard S, et al. Characterization of novel insect associated peptidases for hydrolysis of food proteins[J]. European Food Research and Technology, 2015, 240(2): 431−439. doi: 10.1007/s00217-014-2342-5

    [8] 李雪. 半胱氨酸蛋白酶抑制剂相关基因SRAC1的功能分析[D]. 泰安: 山东农业大学, 2016.

    Li X. Function analysis of cystatin-associated gene SRAC1[D]. Antai: Shandong Agricultural University, 2016.

    [9]

    Savic J, Nikolic R, Banjac N, et al. Beneficial implications of sugar beet proteinase inhibitor BvSTI on plant architecture and salt stress tolerance in Lotus corniculatus L.[J/OL]. Journal of Plant Physiology, 2019, 243: 153055 [2021−02−11]. https://doi.org/10.1016/j.jplph.2019.153055.

    [10] 王长春, 刘真真, 叶涛, 等. 蛋白酶抑制子在植物与病原物互作中的作用[J]. 浙江师范大学学报, 2019, 42(2):190−194.

    Wang C C, Liu Z Z, Ye T, et al. The role of protease inhibitors in the interaction between plants and pathogens[J]. Journal of Zhejiang Normal University, 2019, 42(2): 190−194.

    [11] 杨帅, 黄颖, 王志英, 等. 毛果杨丝氨酸蛋白酶抑制剂基因的克隆及真核表达[J]. 东北林业大学学报, 2020, 48 (5): 88−98.

    Yang S, Huang Y, Wang Z Y, et al. Cloning and eukaryotic expression of a PtrSPI gene from Populus trichocarpa[J]. Journal of Northeast Forestry University, 2019, 2020, 48 (5): 88−98.

    [12] 朱琨, 翟莹, 于海伟, 等. 大豆GmNCED5基因非生物胁迫响应及生物信息分析[J/OL]. 大豆科学, 2021 [2021−05−27]. https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CAPJ&dbname=CAPJLAST&filename=DDKX20210526001&v=j7LtoqI9wdecn1GRgp7ZM%25mmd2FWuRmF9%25mmd2BxuQnMGKV7WEEj1rMLJg5FMs8L8ht3buP6eI.

    Zhu K, Zhai Y, Yu H W, et al. Response of soybean GmNCED5 gene under abiotic stress and its bioinformatics analysis [J/OL]. Soybean Science, 2021 [2021−05−27]. https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CAPJ&dbname=CAPJLAST&filename=DDKX20210526001&v=j7LtoqI9wdecn1GRgp7ZM%25mmd2FWuRmF9%25mmd2BxuQnMGKV7WEEj1rMLJg5FMs8L8ht3buP6eI.

    [13] 李豆, 苏功博, 胡晓晴, 等. 白桦BpSPL6基因启动子的克隆及表达分析[J/OL]. 北京林业大学学报, 2021: 1−9 [2021−06−13]. https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CAPJ&dbname=CAPJLAST&filename=BJLY20210610000&v=VOz5fs4kSA7FoO8WWRdDy1eYWNL4kqN1cvWnimOH9efoz4xTnEZnTkV2rwvlqgzW.

    Li D, Su G B, Hu X Q, et al. Cloning and expression analysis of BpSPL6 promoter from Betula platyphylla [J/OL]. Journal of Beijing Foresty University, 2021: 1−9 [2021−06−13]. https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CAPJ&dbname=CAPJLAST&filename=BJLY20210610000&v=VOz5fs4kSA7FoO8WWRdDy1eYWNL4kqN1cvWnimOH9efoz4xTnEZnTkV2rwvlqgzW.

    [14] 张璐鑫. 低温胁迫对小麦根系生理及茎基腐病致病菌含量影响[D]. 保定: 河北农业大学, 2020.

    Zhang L X. Effects of low temperature stress on root physiology and pathogen content of stem base rot of wheat[D]. Baoding: Hebei Agricultural University, 2020.

    [15]

    Huang Y, Mijiti G, Wang Z Y. Functional analysis of the class II hydrophobin gene HFB2-6 from the biocontrol agent Trichoderma asperellum ACCC30536[J]. Microbiological, 2015, 171: 8−20. doi: 10.1016/j.micres.2014.12.004

    [16]

    Paola Z, Chiara F, Milena F, et al. Determination of anti-p52 IgM and anti-gB IgG by ELISA as a novel diagnostic tool for detection of early and late phase of primary human cytomegalovirus infections during pregnancy[J]. Journal of Clinical Virology, 2019, 120: 38−43. doi: 10.1016/j.jcv.2019.09.006

    [17] 李欣悦, 王振越, 曹传旺. LdNPV对CO2胁迫下舞毒蛾生长发育及生化酶活性影响[J]. 北京林业大学学报, 2019, 41(9):139−146.

    Li X Y, Wang Z Y, Cao C W. Effects of LdNPV on growth, development and biochemical enzymatic activities of Lymantria dispar under CO2 concentration stress[J]. Journal of Beijing Forestry University, 2019, 41(9): 139−146.

    [18] 王雯. 丝氨酸蛋白酶ACYPI4531在豌豆免疫防御反应中的作用研究[D]. 杨凌: 西北农业科技大学, 2019.

    Wang W. The role of serine protease ACYP4531 in immune responses of the pea aphid, Acythosiphon pisum[D]. Yangling: Northwest A&F University, 2019.

    [19] 刘会香, 张星耀. 植物蛋白酶抑制剂及其在林木抗虫基因工程中的应用[J]. 林业科学, 2005, 43(3):148−156. doi: 10.3321/j.issn:1001-7488.2005.03.025

    Liu H X, Zhang X Y. Plant protease inhibitors their application on forest tree resisting pest genetic engineering[J]. Scientia Silvae Sinicae, 2005, 43(3): 148−156. doi: 10.3321/j.issn:1001-7488.2005.03.025

    [20]

    Zhu J, He Y, Yan X M, et al. Duplication and transcriptional divergence of three Kunitz protease inhibitor genes that modulate insect and pathogen defenses in tea plant (Camellia sinensis)[J]. Horticulture Research, 2019, 6(1): 126. doi: 10.1038/s41438-019-0208-5

    [21] 谢可方, 董爱武, 忻骅, 等. 大豆KUNITZ型胰蛋白酶抑制剂的稳定性及抗虫性研究[J]. 复旦学报(自然科学版), 2002, 41(6):631−634.

    Xie K F, Dong A W, Xin H, et al. A study of the stability and insect resistance of soybean KUNTIZ-type trypsin inhibitor[J]. Journal of Fudan University (Natural Science), 2002, 41(6): 631−634.

    [22]

    Saikhedkar N S, Joshi R S, Yadav A K, et al. Phyto-inspired cyclic peptides derived from plant Pin-II type protease inhibitor reactive center loops for crop protection from insect pests[J]. Biochimica et Biophysica Acta, 2019, 1863(8): 1254−1262. doi: 10.1016/j.bbagen.2019.05.003

    [23]

    Guimaraes L C, Oliveira C F R, Marangoni S, et al. Purification and characterization of a Kunitz inhibitor from Poincianella pyramidalis with insecticide activity against the Mediterranean flour moth[J]. Pesticide Biochemistry and Physiology, 2015, 118: 1−9. doi: 10.1016/j.pestbp.2014.12.001

    [24]

    Raha O, Arwa B, Hanan A A, et al. Production of a biopesticide on host and non-host serine protease inhibitors for red palm weevil in palm trees[J]. Saudi Journal of Biological Sciences, 2020, 27(10): 2803−2808. doi: 10.1016/j.sjbs.2020.06.048

    [25]

    Fabio K T, Walter R T. Molecular insights into mechanisms of lepidopteran serine proteinase resistance to natural plant defenses[J]. Biochemical and Biophysical Research Communications, 2015, 467(4): 885−891. doi: 10.1016/j.bbrc.2015.10.049

    [26]

    Bendre A D, Ramasamu S, Suresh C G. Analysis of Kunitz inhibitors from plants for comprehensive structural and functional insights[J]. International Journal of Biological Macromolecules, 2018, 113: 933−943. doi: 10.1016/j.ijbiomac.2018.02.148

    [27]

    Bhattacharyya A, Rai S, Babu C R. A trypsin and chymotrypsin inhibitor from Caesalpinia bonduc seeds: Isolation, partial characterization and insecticidal properties[J]. Plant Physiology and Biochemistry, 2007, 45: 169−177. doi: 10.1016/j.plaphy.2007.02.003

    [28]

    Leo F R, Bonadé-BOTTINO M A, Ceci L R, et al. Opposite effects on Spodoptera littoralis larvae of high expression level of a trypsin proteinase inhibitor in transgenic plants[J]. Plant Physiology, 1998, 118(3): 997−1004. doi: 10.1104/pp.118.3.997

    [29]

    Patston P A, Gettins P G W. Significance of secondary structure predictions on the reactive center loop region of seprins: a model for the folding of serpins into a metastablestate[J]. FEBS Letters, 1996, 383(1−2): 87−92. doi: 10.1016/0014-5793(96)00231-1

    [30] 冯玮. 植物蛋白酶抑制剂研究进展概述[J]. 生物学教学, 2020, 45(12):61−63. doi: 10.3969/j.issn.1004-7549.2020.12.026

    Feng W. Review on the research progress of plant protease inhibitor[J]. Biology Teaching, 2020, 45(12): 61−63. doi: 10.3969/j.issn.1004-7549.2020.12.026

  • 期刊类型引用(0)

    其他类型引用(1)

图(6)  /  表(1)
计量
  • 文章访问数:  1063
  • HTML全文浏览量:  378
  • PDF下载量:  42
  • 被引次数: 1
出版历程
  • 收稿日期:  2021-04-29
  • 修回日期:  2021-06-16
  • 网络出版日期:  2021-07-13
  • 发布日期:  2021-10-14

目录

/

返回文章
返回