Processing math: 54%
  • Scopus收录期刊
  • CSCD(核心库)来源期刊
  • 中文核心期刊
  • 中国科技核心期刊
  • F5000顶尖学术来源期刊
  • RCCSE中国核心学术期刊
高级检索

基于MaxEnt模型对舞毒蛾全球适生区的预测及分析

王艳君, 高泰, 石娟

王艳君, 高泰, 石娟. 基于MaxEnt模型对舞毒蛾全球适生区的预测及分析[J]. 北京林业大学学报, 2021, 43(9): 59-69. DOI: 10.12171/j.1000-1522.20200416
引用本文: 王艳君, 高泰, 石娟. 基于MaxEnt模型对舞毒蛾全球适生区的预测及分析[J]. 北京林业大学学报, 2021, 43(9): 59-69. DOI: 10.12171/j.1000-1522.20200416
Wang Yanjun, Gao Tai, Shi Juan. Prediction and analysis of the global suitability of Lymantria dispar based on MaxEnt[J]. Journal of Beijing Forestry University, 2021, 43(9): 59-69. DOI: 10.12171/j.1000-1522.20200416
Citation: Wang Yanjun, Gao Tai, Shi Juan. Prediction and analysis of the global suitability of Lymantria dispar based on MaxEnt[J]. Journal of Beijing Forestry University, 2021, 43(9): 59-69. DOI: 10.12171/j.1000-1522.20200416

基于MaxEnt模型对舞毒蛾全球适生区的预测及分析

基金项目: 国家自然科学基金项目(31770687)
详细信息
    作者简介:

    王艳君。主要研究方向:植物检疫。Email:yjunwang@foxmail.com 地址:100083 北京市海淀区清华东路35号北京林业大学林学院

    责任作者:

    石娟,教授,博士生导师。主要研究方向:植物检疫。Email:shi_juan@263.net 地址:同上

  • 中图分类号: S763

Prediction and analysis of the global suitability of Lymantria dispar based on MaxEnt

  • 摘要:
      目的  舞毒蛾是一种食叶性的国际性检疫害虫,给世界上许多国家和地区造成了严重的经济损失。该研究筛选出限制舞毒蛾分布的环境变量,利用MaxEnt软件预测舞毒蛾当前及未来气候条件下的全球适生区范围,明确舞毒蛾在不同气候条件下的适生区变化。
      方法  利用ArcGIS软件设置缓冲区筛选舞毒蛾在全球的分布点数据;利用MaxEnt、SPSS和ArcGIS软件根据环境变量贡献率、刀切法和变量相关性分析对生物气候变量、月总降水量、月平均最高温度和月平均最低温度4种环境变量进行筛选;利用R软件计算调控倍频和特征组合等因子调整MaxEnt模型参数;利用MaxEnt模型预测当前和未来不同情境条件下舞毒蛾全球适生区的分布范围。
      结果  经过缓冲区筛选得到734个舞毒蛾的分布点数据;MaxEnt模型结果中,测试遗漏率与理论遗漏率吻合度高,而且模型AUC值为0.940;MaxEnt模型预测当前条件下舞毒蛾在全球的高、中度适生区主要集中在欧洲的大部分地区,北美洲中东部,亚洲的东西部,而非洲、大洋洲和南美洲分布较少。此外,舞毒蛾在未来气候条件下北半球适生区的边界向北偏移,北美洲以及欧亚大陆的高、中度适生区的面积扩增明显。
      结论  舞毒蛾的分布受多种环境变量影响,并且温度和降水与舞毒蛾的特定发育阶段相吻合。MaxEnt模型的预测结果能够反映舞毒蛾在全球的分布特征。该研究可为防治舞毒蛾和制定相关检疫措施提供理论依据。
    Abstract:
      Objective  Lymantria dispar (Linnaeus) is a leaf-eating international quarantine pest, which has caused serious economic losses to many countries and regions in the world. In this study, environmental variables limiting the distribution of Lymantria dispar were screened out, and MaxEnt software was used to predict the global adaptation range of Lymantria dispar under current and future climatic conditions, so as to clarify the adaptation range of Lymantria dispar under different climatic conditions.
      Method  We used ArcGIS software to set up buffer zones to screen the global distribution data of Lymantria dispar. We used MaxEnt, SPSS and ArcGIS software to screen four kinds of environmental variables, i.e. biological climate variable, monthly total precipitation, monthly mean maximum temperature and monthly mean minimum temperature, according to the contribution rate of environmental variables, knife cutting method and variable correlation analysis. We used R software to calculate the regularization multiplier and feature classes and other factors to adjust the parameters of MaxEnt model. We used MaxEnt model to predict the global distribution range of Lymantria dispar under current and future climatic conditions.
      Result  The distribution data of 734 Lymantria dispar were obtained by buffer screening. In the MaxEnt model results, the test omission rate was in high agreement with the theoretical omission rate, and the AUC value of the model was 0.940. MaxEnt model predicted that Lymantria dispar was mainly distributed in most parts of Europe, central and eastern North America, western and eastern Asia, and less in Africa, Oceania and South America under current conditions. In addition, Lymantria dispar boundaries in the northern hemisphere will shift to the north under future climatic conditions, and the areas of high and moderate adaptability in North America and Eurasia will expand significantly.
      Conclusion  The distribution of Lymantria dispar is influenced by a variety of environmental variables and temperature and precipitation are consistent with the specific development stage of Lymantria dispar. The predicted results of MaxEnt model can reflect the distribution characteristics of Lymantria dispar in the world. This study can provide theoretical basis for prevention and control of Lymantria dispar and establishment of relevant quarantine measures.
  • 我国野生动物种类繁多,分布广泛,其中国家一级保护动物约97种,二级保护动物约320种,野生动物资源已经成为我国重要的战略资源。对野生动物进行监测是野生动物保护管理工作的重要组成,利用红外自动感应相机、无线遥感等技术[1-3]对野生动物进行图像监测是当前最有效的手段之一。这种方法可以提供野生动物的种群分布、物种多样性等信息,但是存在着人工识别效率低,监测周期长的问题。因此,采用机器学习技术对野生动物图像进行自动检测与识别成为当前的研究热点。

    曾陈颖[4]提出了一种基于BP神经网络的大熊猫(Ailuropoda melanoleuca)识别方法。Okafor[5]等提出一种基于深层学习与视觉词汇袋的野生动物识别方法,该方法使用灰度、颜色信息和不同的空间汇集方法来完成训练过程。但是利用红外自动感应相机监测野生动物时,由于相机布设在野外,拍摄时易受到动物本身的行为、周围环境和气候的影响,成像条件较差,导致识别的准确率低,因此学者们开始专注于解决由复杂环境背景导致的低识别率的问题。Villa等[6]在文章中指出:图像包含的复杂背景信息对于识别的效果存在一定的影响,需要依靠准确的分割算法来提高识别准确率。Yu等[7]将动物体从待训练图像中手动提取出来,这使得其对自建数据库的识别准确率提高到82%。近些年,深度学习理论的成熟与大数据的积累,为深度学习的应用提供了实践基础[8]。在此基础上,通过应用深度学习理论构建了多种深度学习网络,并在ImageNet数据集上取得了极高的识别准确率。这些深度网络模型包括AlexNet[9]、VGG Net[10]、GoogleNet[11]、Deep Residual Net[12]和DenseNet[13]等,与此同时,这些网络模型也被用于大熊猫、长颈鹿(Giraffa camelopardalis)等野生动物[14]的图像识别。

    就目前而言,深度神经网络已在动物图像的识别上广泛应用,Chen等[15]使用自动图形切割算法分割野生动物区域,再使用深度卷积神经网络对20种野生动物进行识别,得到较好的识别精度。相比其他深度网络,近年兴起的DCNN(深度卷积神经网络)直接由数据本身得到特征和表达关系的自我学习,对图像具有极强的数据特征抽象能力,因此可以适应环境变化下的对象识别。目前,DCNN已在手写字符识别[16]、行为识别[17]以及农作物识别[18-19]等方面获得了较好的效果,但是针对红外相机监测图像的检测与识别的研究仍面临着准确率低的问题。

    针对以上问题,本研究提出一种基于目标检测与卷积神经网络(ROI-CNN)的野生动物监测图像的自动识别方法,通过基于回归算法的目标检测方法将野生动物所在区域从红外监测图像中分割出来,建立ROI图像数据库;将原始图像和ROI图像输入双通道卷积神经网络进行基于全局-局部的自动识别,最终实现高准确率的野生动物物种识别。

    2010—2016年间,项目组在内蒙古赛罕乌拉国家级自然保护区,利用红外感应触发相机对野生动物进行图像监测,获得了上千张野生动物监测图像,构建了野生动物监测图像数据库。监测图像均为24位RGB真彩色图像,分辨率为2 560 × 1 920。本研究从中选择了5种常见的国家级陆生保护动物[20]为研究对象,包括马鹿(Cervus elaphus)、斑羚(Naemorhedus goral)、狍(Capreolus capreolus)、猞猁(Lynx lynx)和野猪(Sus scrofa)。表 1为图像数据库中5种动物的图像数量。

    表  1  野生动物图像样本数据库
    Table  1.  Wildlife image sample database
    图像数量
    Image number
    马鹿
    Red deer
    斑羚
    Goral

    Roe deer
    猞猁
    Lynx
    野猪
    Boar
    白天
    Day time
    542 574 498 186 69
    黑夜
    Night time
    322 75 267 50 85
    总图像
    Total images
    864 649 765 236 154
    下载: 导出CSV 
    | 显示表格

    红外自动感应相机在野外捕捉到的野生动物图像鲜有如图 1a所示的理想状况,监测图像通常会受到环境、动物行为和相机硬件的影响,存在如图 1b所示的遮挡问题,如图 1cd所示的曝光以及动物颜色与背景难区分等问题,这些问题都会给图像监测中野生动物的检测与识别带来困难。

    图  1  野生动物监测图像的常见情形
    Figure  1.  Common situations of wildlife monitoring images

    除此之外,红外自动感应相机也会因其他因素影响导致误触发拍摄大量无效图像,在训练中过大的数据量会导致检测与识别的效率低下。基于以上问题,本研究提出将ROI提取技术加入到野生动物图像的检测与识别中,减少复杂背景对动物识别的影响,同时提高模型训练的效率。

    针对复杂背景对野生动物图像中动物的检测识别带来的影响,本研究采用一种基于回归算法的目标检测技术对图像中野生动物所在区域进行检测与分割。

    回归检测算法网络DarkNet-19由19个卷积层、5个最大值池化层构成,首先将图像尺寸修改为448×448,输入网络进行预测,网络输出为S×S×(B×5+C)的张量,其中S为划分网格数,B为网络预测边框数,C为类别个数。然后将整幅图像划分为S×S个网格(grid cell),每个网格预测B个检测边界框(bounding boxes),以及每个框的置信度(confidence),每个检测边界框包含5个参数(xywh和confidence)。(x, y)代表检测边界框的中心相对其母网格的位置,(w, h)为检测边界框的宽和高。置信度confidence计算公式如下:

    confidence=Pr( Object )×IOU (1)
    IOU=area(BBdtBBgt)area(BBdtBBgt) (2)

    式中:Pr(Object)为边界框包含目标物体的概率;IOU为检测框与标准框的交并比值;BBgt为基于训练标签的参考标准框;BBdt为检测边界框;area()表示面积。

    本文中使用的S=7,即将输入图像首先分为49个网格,每个网格预测2个检测边界框,在算法中每个框包含xywh、confindence这5个数值,此处仅做野生动物区域回归,不做物种的具体类别预测,因此C取1,最后的输出是7×7×(2×5+1)的张量。采用误差平方和作为损失函数(loss):

    loss=λ coord S2i=0Bj=0Iobjij[(xiˆxi)2+(yiˆyi)2]+λ coord S2i=0Bj=0Iobjij[(wiˆwi)2+(hihi)2] (3)

    式中:λcoord为定位误差的权重;xiyiwihi是第i个网格的位置以及宽和高;ˆxi,ˆyi,ˆwi,ˆhi是参考标准框的参数值。Iijobj表示第i个网格中第j个负责预测的预测值(predictor)。

    在每一张图像中,会存在很多并不包含物体的网格,这些网格的置信度为0,它们的训练梯度远大于包含物体中心的部分网格,很可能会覆盖掉它们的梯度更新,使得模型不稳定,导致网络的发散。针对这个问题,本研究给定位误差更大的权重,使λcoord=5,同时减小不包含物体中心网格的置信度误差的权重,包含物体中心网格的置信度误差则保持不变。

    按照检测得到的野生动物所在区域的坐标(包含左上角坐标[x1, y1]和右下角坐标[x2, y2])对图像(图 2a)进行切割,输出如图 2b的目标区域图像,建立ROI图像库,为下一步的野生动物的自动识别提供数据基础。为了更精确地提取目标物种的特征,本研究需要目标检测算法的准确率达到90%以上才可进行后续的模型训练。

    图  2  野生动物图像目标检测分割
    Figure  2.  Target detection segmentation for wildlife images

    VGGNet是DCNN的典型代表,其3×3小卷积核的设计思想使得网络的参数更少,且在具有1 000个分类的大规模图像数据集ImageNet[21]的分类和定位上的适用性已得到了充分的验证,因此本研究以此为基础设计针对野生动物监测图像的识别网络。图 3为16个权重层的网络结构。

    图  3  VGG16网络架构
    注:COV3-64表示卷积核大小为3 × 3,通道数为64的卷积层;COV3-128表示卷积核大小为3 × 3,通道数为128的卷积层;COV3-256表示卷积核大小为3 × 3,通道数为256的卷积层;COV3-512表示卷积核大小为3 × 3,通道数为512的卷积层;MAXPOOL表示采用最大值池化;FC-4096表示通道数为4096的全连接层;FC-1000表示通道数为1000的全连接层;分类层采用softmax函数。
    Figure  3.  VGG16 network architecture
    Notes: COV3-64 represents a convolution layer with a convolutional kernel of 3×3 and a convolutional layer with 64 channels. COV3-128 represents a convolution layer with a convolutional kernel of 3×3 and a convolutional layer with 128 channels. COV3-256 represents a convolution layer with a convolutional kernel of 3×3 and a convolutional layer with 256 channels. COV3-512 represents a convolution layer with a convolutional kernel of 3×3 and a convolutional layer with 512 channels. MAXPOOL indicates that the maximum pool is used.FC-4096 denotes a fully connected layer with a channel number of 4096. FC-1000 denotes a fully connected layer with a channel number of 1000;the classification layer uses softmax function.

    VGGNet的输入为224×224的RGB图像,图像经过网络的处理,输出其属于每个类别的概率。VGGNet架构的核心由卷积层和池化层交替构成。其中前5部分分别由多个卷积核大小为3×3的卷积层构成,第6部分为3个全连接(fully-connected, FC)层。卷积层的主要作用是提取特征[22],即包含一组经数据驱动进行自主学习的卷积核,又称特征提取器。针对不同的特征提取密集度,卷积核用固定大小的卷积步幅与输入做卷积运算,经由激活函数变换后构成卷积特征图,代表对输入图像特征的响应。输出的特征图通常表示为:

    aln=f(m(al1m×klm,n)+bln) (4)

    式中:anl为第l层(当前层)的第n个特征图,aml-1为第(l-1)层(上一层)的第m个特征图,km, nl表示作用于2个特征图之间的卷积核,f(x)为激活函数,bnl代表偏置项。

    池化层用于特征映射和降维,本研究中采用最大值池化,对卷积特征图进行下采样后构成池化特征图,通常表示为:

    aln=f(rln×1s2s×sal1n+bln) (5)

    式中:s是选取的下采样模板,rnl为模板的权值。

    经过多层级联后,全连接层对最后一个池化层输出的特征图作矢量变换,构成特征向量输送到分类层。

    基于上文提到的技术与方法,提出一种基于ROI-CNN的野生动物监测图像自动识别方法,首先采用基于回归算法的目标检测技术对图像中野生动物所在的区域进行检测,实现自动的分割与裁剪,得到以动物为主体的图像集(ROI图像);提出一种双通道模型,将未经感兴趣区域提取的图像和ROI图像同时导入VGGNet进行训练,基于ImageNet数据库进行微调,最后接入分类器输出最终的识别结果。图 4为算法流程图。

    图  4  算法流程图
    Figure  4.  Algorithm flow chart

    图 5所示为构建的基于VGG16的双通道网络模型,其中包括网络通道G1与网络通道G2。将未经感兴趣区域提取的图像数据库与经感兴趣区域提取后的ROI图像数据库作为训练样本,分别输入G1与G2,以softmax作为分类器,分别输出预测概率矩阵PG1PG2

    图  5  双通道网络模型
    Figure  5.  Dual-channel network model
    \boldsymbol{P}_{\mathrm{G} 1}=\left[P_{1\_1}, P_{1\_2}, P_{1\_3}, P_{1\_4}, P_{1\_5} \right] (6)
    \boldsymbol{P}_{\mathrm{G} 2}=\left[P_{2\_1}, P_{2\_2}, P_{2\_3}, P_{2\_4}, P_{2\_5}\right] (7)

    式中:Pi_j表示网络输出的预测概率,i∈{1,2},分别对应网络通道G1与G2;j∈{1,2,3,4,5},分别对应5种被预测的物种。PG1PG2n=5的行向量,概率矩阵满足各类预测概率之和为1,即满足:

    \sum\limits_{j=1}^{5} P_{i j}=1 (8)

    最后通过分类概率融合将概率矩阵PG1PG2相加取平均值,得到最终的识别概率矩阵Q,并输出矩阵中概率最大值所对应的物种作为识别的结果。

    Q=\frac{\boldsymbol{P}_{\mathrm{G} 1}+\boldsymbol{P}_{\mathrm{C} 2}}{2} (9)

    本研究的硬件平台为E5-2620 CPU,两块GTX 1080ti GPU的工作站,软件为Ubuntu16.04操作系统、Python2.7的编程环境、Tensorflow1.3.0的深度学习框架。

    首先采用1.2节介绍的基于回归的目标检测技术训练野生动物目标检测器。从样本库中随机选择每类野生动物图片的80%作为训练样本,使用labelImg作为图像标定软件,对训练集图像中的野生动物区域进行人工标定。以Darknet-19作为特征提取网络,采用随机梯度下降法(SGD)为优化函数,初始学习率为0.001,冲量(momentum)为0.9,训练批次(batch size)为8。训练过程迭代次数为1 200次,图 6为训练准确率的变化图。训练集准确率在训练迭代1 200次后达到97%以上,将数据库中其余20%的样本作为验证集,最终验证集准确率为96.6%。这说明野生动物目标检测器满足90%的准确率要求,可以用来提取监测图像中野生动物所在区域。

    图  6  目标检测算法训练准确率
    Figure  6.  Training accuracy chart of the target detection algorithm

    训练VGG16网络模型时,采用随机梯度下降(stochastic gradient descent, SGD)算法进行优化实验,学习率采用步进阶梯调节策略step。网络模型训练参数如表 2所示。

    表  2  网络模型训练参数
    Table  2.  Training parameters of the network model
    参数类型
    Parameter type
    批量数据
    Batch data
    优化算法
    Optimization algorithm
    初始学习率
    Initial learning rate
    迭代次数
    Epochs
    损失函数
    Loss function
    值或方法Value or method 64 随机梯度下降
    Stochastic gradient descent
    0.001 50 交叉熵函数Cross entropy function
    下载: 导出CSV 
    | 显示表格

    为了丰富图像训练集,更好地提取图像特征,提高模型泛化能力,本研究在训练过程中采用仿射变换和裁剪等方式对样本图像进行数据扩充,将原有训练样本数据扩充5倍。将图像数据库中的每类野生动物图像分成训练集、测试集和验证集。其中训练集和测试集分别占每类动物图像总数的70%和30%,随机从图像数据库中产生20%作为验证集。

    选定平均识别精度的平均值MAP[23](mean average precision)来评价识别模型的好坏,MAP的计算公式如式(10):

    \operatorname{MAP}=\frac{\sum\limits_{q=1}^{5} \operatorname{Ave} P(q)}{5} (10)

    式中:q为野生动物物种的编号,P(q)为野生动物监测图像中第q类物种的识别精度,AveP(q)为第q类物种的平均识别精度(average precision,AP),MAP为5种物种的平均识别精度的均值。

    本研究算法中采用的网络结构是VGG16,为了验证不同网络结构对算法识别效果的影响,用VGG19结构代替VGG16进行训练识别,将两种结构下的训练效果进行对比。

    图 7所示为两种结构下的模型在训练时损失函数值和准确率随迭代次数的变化,两种模型的训练均在40次迭代之后开始趋于稳定。对5种野生动物的识别效果以及训练的MAP值和验证时最大MAP值的对比如表 3所示。

    图  7  损失函数值(a)和准确率(b)随迭代次数的变化
    Figure  7.  Variations of loss fuction values (a) and accuracy (b)with epoch changing
    表  3  不同物种的AP值与不同模型的MAP值
    Table  3.  AP value of different species and MAP value of varied models
    算法类别
    Algorithm class
    AP MAP(测试)
    MAP(test)
    最大MAP(验证)
    Max. MAP(validation)
    马鹿
    Red deer
    斑羚
    Goral

    Roe deer
    猞猁
    Lynx
    野猪
    Boar
    VGG19 0.87 0.82 0.82 0.83 0.81 0.83 0.87
    本研究算法Algorithm in this research 0.94 0.91 0.91 0.88 0.92 0.91 0.94
    注:AP代表平均识别精度,MAP代表平均识别精度的均值。Notes: AP is average identification precision, and MAP is mean AP.
    下载: 导出CSV 
    | 显示表格

    表 3中,2~6列为不同物种测试集的平均识别精度AP,第7列为测试集5种物种的平均识别精度的均值MAP,第8列为训练过程中,验证集的最大MAP值。综合分析图 7表 3可得:1)无论采用哪种结构,验证时的最大MAP值和测试时的MAP值相差较小,说明模型没有产生欠拟合或者过拟合的问题;2)训练时,相比于VGG19结构,VGG16结构下的损失函数值下降更快,稳定后的损失函数值更低,训练效率较高;3)两种结构下的测试准确率差值较小,但是VGG16结构下的测试准确率始终高于VGG19;4)针对研究中这5种野生动物,VGG16结构下的模型识别效果均优于VGG19,且最高的准确率差值达到11%;5)验证时,VGG16结构的最大MAP值为0.94,而VGG19结构的最大MAP值仅为0.87。

    VGG19网络相较于VGG16虽然具有更深的网络层数,但网络层数越深,网络反向传播的梯度相关性越差,造成梯度弥散现象,所以并非网络层数越深,识别效果越优。综上所述,本研究采用VGG16结构的模型,使得训练效果更优,训练效率更高,能够得到更高的MAP值,更加适合于红外自动感应相机下野生动物监测图像的物种识别。

    R-CNN、Fast R-CNN[24]是DCNN初期应用算法中的主流方法,其思想也影响了目前大量的检测模型网络。R-CNN的核心思想是从输入图像中选出上千个候选框,对每个候选框做卷积运算以及特征提取,再使用分类器判别其类别;而Fast R-CNN则是只对输入图像做一次卷积运算得到特征图,找到每个候选框在特征图上的映射,再提取出特征输入分类器进行判别。这两种算法都是在输入图像上划分出大量的候选框进行处理,本研究算法则是对输入图像进行处理,分割出目标所在的区域,再进行之后的模型训练以及识别分类。为了证明本研究提出算法的有效性,在野生动物监测图像集上,分别利用4种算法对5种野生动物进行物种识别,图 8所示为不同算法准确率的对比,其MAP值的对比如表 4所示。

    图  8  4种模型下的5种野生动物测试准确率
    Figure  8.  Test accuracy of five kinds of wildlife under four models
    表  4  不同算法的MAP
    Table  4.  MAP of different algorithms
    算法类别
    Algorithm class
    VGG16 R-CNN Fast R-CNN 本研究算法
    Algorithm in this research
    最大MAP(验证)
    Max.MAP(validation)
    0.672 0.803 0.895 0.931
    MAP(测试)
    MAP(test)
    0.656 0.762 0.856 0.912
    下载: 导出CSV 
    | 显示表格

    综合分析图 8表 4可得:1)训练时,针对5种野生动物,本研究算法的训练效果相比于VGG16、R-CNN与Fast R-CNN均为最佳,测试时MAP的值也最高;2)与单独的VGG16结构相比,本研究算法对5种野生动物的测试准确率均高出20%以上,验证时的最大MAP值高出0.259,证明对图像进行ROI提取能够降低复杂背景信息对图像识别的影响,得到更好的识别效果;3)对于狍的准确率,本研究算法比R-CNN的准确率高出18%,狍的图像质量较差,动物本身与背景经常难以区分,说明本研究算法比R-CNN更好地减少了背景对图像识别的影响;4)与Fast R-CNN的表现相比,由于马鹿图像质量较好,大多比较清晰、辨识度高,受背景影响较小,本研究算法在马鹿的识别上仅高出2%,相比之下,背景更为复杂的猞猁、野猪、斑羚和狍图像的识别上,本研究算法的准确率就比Fast R-CNN提高了8%、5%、6%、7%,也说明了本研究算法在处理背景复杂的图像上优于Fast R-CNN,能够达到更高的识别准确率;5)验证时,本研究算法的最大MAP值最大,VGG16的最小,与识别效果的比较关系相对应,且对于4种算法,验证时的最大MAP值和测试时的MAP值的差值均较小,再次证明训练没有产生过拟合的问题。

    综上所述,与VGG16、R-CNN与Fast R-CNN相比,本研究算法在马鹿、猞猁、野猪、斑羚和狍的红外相机监测图像的检测与识别上具有更高的精度,图像初期的检测分割处理减少了无效背景的影响,对于树木遮挡、光线变化有较好的鲁棒性,更加满足野生动物监测图像识别的要求。

    针对红外自动感应相机在野外环境下拍摄的野生动物监测图像,提出一种基于ROI-CNN的图像自动识别方法,利用基于回归算法的目标检测与全局-局部的双通道卷积神经网络,有效克服复杂背景信息对野生动物监测图像物种识别的干扰。通过实验分析,采用VGG16作为卷积网络的测试准确率最高,对内蒙古赛罕乌拉国家级自然保护区内5种陆生野生动物的平均识别率均可达到90%左右。为了验证本研究算法的有效性,设计了与VGG16、R-CNN、Fast R-CNN算法的对比试验,与5种野生动物的测试准确率和MAP值进行对比,实验结果表明:针对全部5种野生动物,本研究提出算法的测试准确率最高,达到更高的测试MAP值,识别效果最优。

  • 图  1   R包ENMeval结果

    L. 线性;Q. 二次;H. 片段化;P. 乘积型;T. 阈值。L、LQ、LQP、QHP、LQH、LQHP、QHPT、LQHPT为不同的特征组合。L, linear; Q, quadratic; H, hinge; P, product; T, threshold. L, LQ, LQP, QHP, LQH, LQHP, QHPT, LQHPT are different characteristic combinations.

    Figure  1.   Results of ENMeval of R package

    图  2   遗漏率

    Figure  2.   Omission rates

    图  3   环境变量对预测舞毒蛾分布的重要度

    Figure  3.   Importance of environmental variables for predicting the distribution of Lymantria dispar

    图  4   存在概率与环境变量的响应曲线

    红色代表均值,蓝色代表标准差。Red represents mean value, blue represents SD.

    Figure  4.   Response curves between probability of presence and environmental variables

    图  5   当前气候条件下舞毒蛾在全球的分布点(A)及潜在分布(B)

    Figure  5.   Global distribution (A) and potential distribution (B) of Lymantria dispar under current climatic conditions

    图  6   ssp126气候模式下舞毒蛾在全球的潜在分布

    Figure  6.   Future species distribution models of Lymantria dispar on global scale under ssp126 climate scenarios predicted by MaxEnt

    图  7   ssp245气候模式下舞毒蛾在全球的潜在分布

    Figure  7.   Future species distribution models of Lymantria dispar on global scale under ssp245 climate scenarios predicted by MaxEnt

    图  8   ssp370气候模式下舞毒蛾在全球的潜在分布

    Figure  8.   Future species distribution models of Lymantria dispar on global scale under ssp370 climate scenarios predicted by MaxEnt

    图  9   ssp585气候模式下舞毒蛾在全球的潜在分布

    Figure  9.   Future species distribution models of Lymantria dispar on global scale under ssp585 climate scenarios predicted by MaxEnt

    图  10   多种气候排放场景及时间段下MaxEnt模型预测舞毒蛾在全球的适生区面积

    Figure  10.   MaxEnt models predicting suitability areas of Lymantria dispar on global scale under climate scenarios and time periods

    表  1   MaxEnt参数设置值

    Table  1   Parameter setting values of MaxEnt

    选项
    Option
    参数 Parameter
    默认值
    Default value
    设置值
    Setting value
    随机选取测试集比例
    Random text percentage
    025
    重复训练次数
    Number of repetitions
    110
    最大重复次数
    Maximum number of repetitions
    5005000
    下载: 导出CSV

    表  2   影响舞毒蛾分布的环境变量及其贡献率

    Table  2   Environmental variables affecting Lymantria dispar distribution and their contribution rates

    编号 No.气候变量 Climatic variable贡献率 Contribution rate/%
    Bio2 温差月均值 Monthly mean temperature difference 3.7
    Bio9 最干季度平均温度 Mean temperature of driest quarter 1.2
    Bio10 最暖季度平均温度 Mean temperature of warmest quarter 37.9
    Bio14 最干月降水量 Precipitation of driest month 39.9
    Bio16 最湿季度降水量 Precipitation of wettest quarter 3.8
    Prec3 3月平均降水量 Average precipitation in March 13.5
    下载: 导出CSV

    表  3   多种气候情景的AUC值

    Table  3   AUC values under various climatic scenarios

    气候情景
    Climate change scenario
    年份
    Year
    AUC值
    AUC value
    当前
    Current
    当前 Current 0.940
    低强迫情景 ssp126
    Low compulsion scenario ssp126
    2021—2040 0.940
    2041—2060 0.944
    2061—2080 0.942
    2081—2100 0.943
    中等强迫情景ssp245
    Moderate compulsion scenario ssp245
    2021—2040 0.943
    2041—2060 0.943
    2061—2080 0.944
    2081—2100 0.944
    中等至高等强迫情景ssp370
    Moderate to high compulsive scenario ssp370
    2021—2040 0.942
    2041—2060 0.941
    2061—2080 0.942
    2081—2100 0.943
    高等强迫情景ssp585
    High compulsion scenario ssp585
    2021—2040 0.945
    2041—2060 0.941
    2061—2080 0.944
    2081—2100 0.943
    下载: 导出CSV
  • [1] 张丽茹. 舞毒蛾的生物学特性及综合防治技术[J]. 现代农业科技, 2020(6):116−117. doi: 10.3969/j.issn.1007-5739.2020.06.072

    Zhang L R. Biological characteristics and comprehensive control techniques of Lymantira dispar[J]. Modern Agricultural Science and Technology, 2020(6): 116−117. doi: 10.3969/j.issn.1007-5739.2020.06.072

    [2]

    Keena M A, Côté M, Grinberg P S, et al. World distribution of female flight and genetic variation in Lymantria dispar (Lepidoptera: Lymantriidae)[J]. Environmental Entomology, 2008, 37(3): 636−649. doi: 10.1603/0046-225X(2008)37[636:WDOFFA]2.0.CO;2

    [3] 钱路, 安榆林, 徐梅, 等. 舞毒蛾不同地理种群基于AFLP分子标记的遗传分析[J]. 林业科学, 2011, 47(10):104−110. doi: 10.11707/j.1001-7488.20111016

    Qian L, An Y L, Xu M, et al. AFLP analysis of different geographic populations of the gypsy moth, Lymantria dispar (Lepidoptera: Lymantriidae)[J]. Scientia Silvae Sinicae, 2011, 47(10): 104−110. doi: 10.11707/j.1001-7488.20111016

    [4]

    Luque G M, Bellard C, Bertelsmeier C, et al. The 100th of the world’s worst invasive alien species[J]. Biological Invasions, 2014, 16(5): 981−985. doi: 10.1007/s10530-013-0561-5

    [5] 谵运清, 安输林, 刘翔, 等. 由亚洲型舞毒蛾检疫问题引发的几点思考[J]. 植物检疫, 2012, 26(4):76−78.

    Zhan Y Q, An Y L, Liu X, et al. Some thoughts on quarantine of Gypsy moth in Asia[J]. Plant quarantine, 2012, 26(4): 76−78.

    [6]

    Srivastava V, Griess V C, Keena M A. Assessing the potential distribution of Asian gypsy moth in Canada: a comparison of two methodological approaches[J]. Sentific Reports, 2020, 10(22): 1−10.

    [7]

    Phillips S J, Anderson R P, Schapire R E. Maximum entropy modeling of species geographic distributions[J]. Ecological Modelling, 2006, 190(3/4): 231−259.

    [8]

    Merow C, Smith M J, Silander J A. A practical guide to MaxEnt for modeling species’ distributions: what it does, and why inputs and settings matter[J]. Ecography, 2013, 36(10): 1058−1069. doi: 10.1111/j.1600-0587.2013.07872.x

    [9]

    Phillips S J, Dudík M. Modeling of species distributions with MaxEnt: new extensions and a comprehensive evaluation[J]. Ecography, 2008, 31(2): 161−175. doi: 10.1111/j.0906-7590.2008.5203.x

    [10]

    Elith J, Phillips S J, Hastie T, et al. A statistical explanation of MaxEnt for ecologists[J]. Diversity & Distributions, 2011, 17(1): 43−57.

    [11] 王运生, 谢丙炎, 万方浩, 等. ROC曲线分析在评价入侵物种分布模型中的应用[J]. 生物多样性, 2007(4):365−372. doi: 10.3321/j.issn:1005-0094.2007.04.005

    Wang Y S, Xie B Y, Wan F H, et al. Application of ROC curve analysis in evaluating the performance of alien species’ potential distribution models[J]. Biodiversity Science, 2007(4): 365−372. doi: 10.3321/j.issn:1005-0094.2007.04.005

    [12] 李一琳, 丁长青. 基于GIS和MaxEnt技术对濒危物种褐马鸡的保护空缺分析[J]. 北京林业大学学报, 2016, 38(11):34−41.

    Li Y L, Ding C Q. Reserve gap analysis of endangered brown eared pheasant (Crossoptilon mantchuricum) through GIS and MaxEnt technology[J]. Journal of Beijing Forest University, 2016, 38(11): 34−41.

    [13] 赵佳强, 石娟. 基于新型最大熵模型预测刺槐叶瘿蚊(双翅目: 瘿蚊科)在中国的适生区[J]. 林业科学, 2019, 55(2):118−127.

    Zhao J Q, Shi J. Prediction of the potential geographical distribution of Obolodiplosis robiniae (Diptera: Cecidomyiidae) in China based on a novel Maximum Entropy model[J]. Scientia Silvae Sinicae, 2019, 55(2): 118−127.

    [14] 黄梦伊, 赵佳强, 石娟. 基于MaxEnt对桉树枝瘿姬小蜂在中国发生趋势的预测[J]. 北京林业大学学报, 2020, 42(11):64−71.

    Huang M Y, Zhao J Q, Shi J. Predicting occurrence tendency of Leptocybe invasa in China based on MaxEnt[J]. Journal of Beijing Forestry University, 2020, 42(11): 64−71.

    [15]

    Fang W, Duo W, Ge G, et al. Potential distributions of the invasive barnacle scale Ceroplastes cirripediformis (Hemiptera: Coccidae) under climate change and implications for its management[J]. Journal of Economic Entomology, 2021, 114(1): 82−89. doi: 10.1093/jee/toaa245

    [16] 张春华, 和菊, 孙永玉, 等. 基于MaxEnt模型的紫椿适生区预测[J]. 北京林业大学学报, 2017, 39(8):33−41.

    Zhang C H, He J, Sun Y Y, et al. Distributional change in suitable areas for Toona sureni based on MaxEnt model[J]. Journal of Beijing Forest University, 2017, 39(8): 33−41.

    [17] 吕汝丹, 何健, 刘慧杰, 等. 羽叶铁线莲的分布区与生态位模型分析[J]. 北京林业大学学报, 2019, 41(2):70−79.

    Lü R D, He J, Liu H J, et al. Distribution and niche modeling analysis of Clematis pinnata[J]. Journal of Beijing Forestry University, 2019, 41(2): 70−79.

    [18]

    Inoue M N, Suzuki-Ohno Y, Haga Y, et al. Population dynamics and geographical distribution of the gypsy moth, Lymantria dispar, in Japan[J]. Forest Ecology and Management, 2019, 434: 154−164. doi: 10.1016/j.foreco.2018.12.022

    [19] 姜彤, 吕嫣冉, 黄金龙, 等. CMIP6模式新情景(SSP-RCP)概述及其在淮河流域的应用[J]. 气象科技进展, 2020, 10(5):102−109. doi: 10.3969/j.issn.2095-1973.2020.05.016

    Jiang T, Lü Y R, Huang J L, et al. New scenarios of CMIP6 model (SSP-RCP) and its application in the Huaihe river basin[J]. Advances in Meteorological Science and Technology, 2020, 10(5): 102−109. doi: 10.3969/j.issn.2095-1973.2020.05.016

    [20] 张丽霞, 陈晓龙, 辛晓歌. CMIP6情景模式比较计划(ScenarioMIP)概况与评述[J]. 气候变化研究进展, 2019, 15(5):519−525. doi: 10.12006/j.issn.1673-1719.2019.082

    Zhang L X, Chen X L, Xin X G. Short commentary on CMIP6 scenario model intercomparison project (ScenarioMIP)[J]. Climate Change Research, 2019, 15(5): 519−525. doi: 10.12006/j.issn.1673-1719.2019.082

    [21]

    Sillero N. What does ecological modelling model? A proposed classification of ecological niche models based on their underlying methods[J]. Ecological Modelling, 2011, 222(8): 1343−1346. doi: 10.1016/j.ecolmodel.2011.01.018

    [22] 朱耿平, 刘强, 高玉葆. 提高生态位模型转移能力来模拟入侵物种的潜在分布[J]. 生物多样性, 2014, 22(2):223−230. doi: 10.3724/SP.J.1003.2014.08178

    Zhu G P, Liu Q, Gao Y B. Improving ecological niche model transferability to predict the potential distribution of invasive exotic species[J]. Biodiversity Science, 2014, 22(2): 223−230. doi: 10.3724/SP.J.1003.2014.08178

    [23]

    Phillips S J, Anderson R P, Dudík M, et al. Opening the black box: an open-source release of Maxent[J]. Ecography, 2017, 40(7): 887−893. doi: 10.1111/ecog.03049

    [24] 刘洋, 石娟. 气候变化背景下埃及吹绵蚧在中国的适生区预测[J]. 植物保护, 2020, 46(1):108−117.

    Liu Y, Shi J. Prediction of potential geographical distribution of Icerya aegyptiaca in China under climate change[J]. Plant Protection, 2020, 46(1): 108−117.

    [25]

    Muscarella R, Galante P J, Soley-Guardia M, et al. ENMeval: an R package for conducting spatially independent evaluations and estimating optimal model complexity for Maxent ecological niche models[J]. Methods in Ecology & Evolution, 2015, 5(11): 1198−1205.

    [26]

    Shcheglovitova M, Anderson R P. Estimating optimal complexity for ecological niche models: a jackknife approach for species with small sample sizes[J]. Ecological Modelling, 2013, 269: 9−17.

    [27]

    Zhong Q, Zhang J E, Ditommaso A, et al. Predicting invasions of Wedelia trilobata (L.) Hitchc. with MaxEnt and GARP models[J]. Journal of Plant Research, 2015, 128: 763−775. doi: 10.1007/s10265-015-0738-3

    [28]

    Pearson R G, Raxworthy C J, Nakamura M, et al. Original article: predicting species distributions from small numbers of occurrence records: a test case using cryptic geckos in Madagascar[J]. Journal of Biogeography, 2007, 34(1): 102−117.

    [29]

    Liu Y, Shi J. Predicting the potential global geographical distribution of two icerya species under climate change[J]. Forests, 2020, 11(6): 1−19.

    [30] 赵晓冏, 巩娟霄, 赵莎莎, 等. 样本量及其空间分布对物种分布模型的影响[J]. 兰州大学学报: 自然科学版, 2018, 54(2):70−77.

    Zhao X J, Gong J X, Zhao S S, et al. Impact of sample size and spatial distribution on species distribution model[J]. Journal of Lanzhou University: Natural Sciences, 2018, 54(2): 70−77.

    [31]

    Morey A C, Venette R C. Minimizing risk and maximizing spatial transferability: challenges in constructing a useful model of potential suitability for an invasive insect[J]. Annals of the Entomological Society of America, 2020, 113(2): 100−113. doi: 10.1093/aesa/saz049

    [32] 闻连仁, 赵春芝, 张洪彦, 等. 舞毒蛾生物学特性观察[J]. 吉林林业科技, 1989(2):34−37.

    Wen L R, Zhao C Z, Zhang H Y, et al. Observation on biological characteristics of Lymantria dispar[J]. Journal of Jilin Forestry Science and Technology, 1989(2): 34−37.

    [33] 卢小雨, 陈洪俊, 陈乃中, 等. 亚洲型舞毒蛾在北美的适生性[J]. 昆虫知识, 2009, 46(3):398−402, 495.

    Lu X Y, Chen H J, Chen N Z, et al. Potential geographic distribution of Asian gypsy moth, Lymantria dispar, in north America[J]. Chinese Bulletin of Entomology, 2009, 46(3): 398−402, 495.

    [34]

    Heikkinen R K, Luoto M, Araújo M B, et al. Methods and uncertainties in bioclimatic envelope modelling under climate change[J]. Progress in Physical Geography, 2006, 30(6): 751−777. doi: 10.1177/0309133306071957

    [35]

    Sinclair S J, White M D, Newell G R. How useful are species distribution models for managing biodiversity under future climates?[J]. Ecology & Society, 2010, 15(1): 175−183.

  • 期刊类型引用(13)

    1. 柯澳,王宇聪,胡博宇,林琦,李勇,双丰. 基于图像的野生动物检测与识别综述. 计算机系统应用. 2024(01): 22-36 . 百度学术
    2. 陈明,王善勤. 基于改进YOLOv5s算法和自适应决策的野猪检测方法. 湖南工业职业技术学院学报. 2024(04): 19-24 . 百度学术
    3. 杨帆. 基于人工智能下的野生动物识别研究与应用. 中国高新科技. 2024(16): 72-74 . 百度学术
    4. 杨拂晓,费龙,闫泰辰. 基于深度学习的野生动物图像识别研究综述. 北京测绘. 2024(09): 1237-1242 . 百度学术
    5. 戴天虹,刘超. 基于改进EfficientDet的雪豹红外相机图像检测方法. 哈尔滨理工大学学报. 2023(02): 108-116 . 百度学术
    6. 杨雪珂,蒙金超,冯悦恒,林婷婷,王兆君,刘辉. 基于残差卷积神经网络模型的勺嘴鹬动作识别. 热带生物学报. 2023(05): 481-489 . 百度学术
    7. 齐建东,马鐘添,张德怀,田赟. 基于BS-ResNeXt-50的密云地区野生动物图像识别. 林业科学. 2023(08): 112-122 . 百度学术
    8. 杨琴,安见才让. 遮挡条件下的动物目标检测方法研究进展. 信息技术与信息化. 2023(12): 189-192 . 百度学术
    9. 王翰霖,文帅,白俊,李东睿,罗概,林玉成. 红外相机监测目标物种的一种自动化检测方法:以绿尾虹雉为例. 四川动物. 2022(04): 361-369 . 百度学术
    10. 李艳杰,召玉龙. 自然保护区亚洲象活动行为监测方法研究. 绿色科技. 2021(22): 63-64+79 . 百度学术
    11. 陈建促,王越,朱小飞,李章宇,林志航. 融合多特征图的野生动物视频目标检测方法. 计算机工程与应用. 2020(07): 221-227 . 百度学术
    12. 谢将剑,杨俊,邢照亮,张卓,陈新. 多特征融合的鸟类物种识别方法. 应用声学. 2020(02): 199-206 . 百度学术
    13. 宫一男,谭孟雨,王震,赵国静,蒋沛林,蒋仕铭,张鼎基,葛剑平,冯利民. 基于深度学习的红外相机动物影像人工智能识别:以东北虎豹国家公园为例. 兽类学报. 2019(04): 458-465 . 百度学术

    其他类型引用(20)

图(10)  /  表(3)
计量
  • 文章访问数:  1822
  • HTML全文浏览量:  473
  • PDF下载量:  209
  • 被引次数: 33
出版历程
  • 收稿日期:  2020-12-23
  • 修回日期:  2021-01-27
  • 网络出版日期:  2021-04-27
  • 发布日期:  2021-10-14

目录

/

返回文章
返回