高级检索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于卷积神经网络的高分二号影像林分类型分类

江涛 王新杰

江涛, 王新杰. 基于卷积神经网络的高分二号影像林分类型分类[J]. 北京林业大学学报, 2019, 41(9): 20-29. doi: 10.13332/j.1000-1522.20180342
引用本文: 江涛, 王新杰. 基于卷积神经网络的高分二号影像林分类型分类[J]. 北京林业大学学报, 2019, 41(9): 20-29. doi: 10.13332/j.1000-1522.20180342
Jiang Tao, Wang Xinjie. Convolutional neural network for GF-2 image stand type classification[J]. Journal of Beijing Forestry University, 2019, 41(9): 20-29. doi: 10.13332/j.1000-1522.20180342
Citation: Jiang Tao, Wang Xinjie. Convolutional neural network for GF-2 image stand type classification[J]. Journal of Beijing Forestry University, 2019, 41(9): 20-29. doi: 10.13332/j.1000-1522.20180342

基于卷积神经网络的高分二号影像林分类型分类

doi: 10.13332/j.1000-1522.20180342
基金项目: 国家重点研发计划项目(2017YFC050410101),中央高校基本科研业务费专项(BLJD200907、JD2010-2)
详细信息
    作者简介:

    江涛。主要研究方向:林业遥感与信息技术。Email:taoorwell@bjfu.edu.cn  地址:100083 北京市海淀区清华东路35号北京林业大学林学院

    通讯作者:

    王新杰,教授。主要研究方向:森林资源监测和林业遥感。Email:xinjiew@bjfu.edu.cn  地址:同上

  • 中图分类号: S771.8

Convolutional neural network for GF-2 image stand type classification

  • 摘要: 目的基于遥感影像的林分类型分类在现代林业中是一项重要的应用。本文试图构建一个基于高分二号(GF-2)影像林分类型分类的卷积神经网络(CNN)模型,探索CNN在遥感图像像素级分类这一领域的发展潜力。方法以GF-2卫星遥感影像为数据源,利用Tensorflow(一种开源用于机器学习的框架)构建4种不同图像斑块大小(m = 5,7,9,11)为输入的CNN,同时以传统的神经网络模型——多层感知器(MLP)为基准,比较不同图像斑块大小下的CNN分类图的分类效果和分类精度。结果实验分类结果表明:CNN(m = 9)得出最高的分类精确度,总体精度比MLP和CNN(m = 5,7,11)分别高出10.91%和6.55%、1.3%、2.54%。分类图的可视化结果也表明CNN(m = 9)更好地解决了“椒盐现象”与过度平滑后的边界不确定性问题。结论CNN能够在利用高分影像光谱特征的同时充分挖掘影像的空间特征,从而提高分类精度,同时在利用CNN基于遥感影像分类时,根据数据源以及地物的特点选择合适的图像斑块大小作为输入是提高分类精度与分类效果的关键措施。
  • 图  1  MLP和CNN(m = 9)的结构框架

    Figure  1.  Architecture of the CNN (m = 9) and MLP

    图  2  CNN(m = 9)在训练阶段准确率与损失值图

    Figure  2.  Accuracy (left) and loss (right) of the CNN (m = 9) in stage of training

    图  3  两幅研究区子图在不同分类系统下的分类结果

    Figure  3.  Two image subsets (A and B) in study area with classification results (Columns from left to right represent the original images, the MLP classification and CNN (m = 5, 7, 9, 11) classification correspondingly)

    表  1  研究区分类类别描述及其训练、验证和测试样本大小

    Table  1.   Description of class at study with training, validation and testing samples size

    林分类型
    Stand type
    详细描述
    Descriptions
    训练样本
    Train sample
    验证样本
    Validation sample
    测试样本
    Test sample
    灌草
    Shrub
    林中草地、生长大量灌草的伐后林地、布满杂草的林道
    Grass glade, nonforested land with large amount bushes and grasses,
    forest road with large shrubs
    1 653 525 690
    马尾松
    Masson pine
    不同龄级的马尾松林,主要是近熟林和成熟林
    Masson pine forest with different age classes,
    mainly half-mature forest and mature forest
    2 008 661 1 289
    其他阔叶林
    Other broadleaf
    一些阔叶树,主要是由木荷组成的林带、
    散生的泡桐以及其他阔叶树种组成的混交林
    Some broadleaf trees, including schima used as fire belt,
    scattered paulownia and other mixed broadleaf forest
    1 823 590 1 190
    裸地
    Bare soil
    主要是几乎不含植被的农业用地和林业用地
    Cropland and forest land with low percentage or no vegetation
    1 653 575 347
    杉木林
    Chinese fir
    不同龄级的杉木林,主要是幼龄林、中龄林和成熟林
    Chinese fir forest with different age classes, including young forest,
    half-mature forest and mature forest
    2 743 943 1 548
    下载: 导出CSV

    表  3  基于CNN生成的混淆矩阵(m = 5)

    Table  3.   Confusion matrix using the CNN (m = 5)

    林分类型 Stand type地面真实点 Ground truth (pixel)
    灌草 Shrub马尾松林 Masson pine其他阔叶林 Other broadleaf裸地 Bare soil杉木林 Chinese fir
    灌草 Shrub619 0300 0 0
    马尾松林 Masson pine 01 190 0 0 53
    其他阔叶林 Other broadleaf 67 0873 0 1
    裸地 Bare soil 0 0 0337 0
    杉木林 Chinese fir 4 131 17 101 350
    生产者精度 Producer’s accuracy/% 89.71 90.83 73.36 97.12 96.15
    用户精度 User’s accuracy/% 67.36 95.74 92.77100 89.29
    下载: 导出CSV

    表  4  基于CNN生成的混淆矩阵(m = 7)

    Table  4.   Confusion matrix using the CNN (m = 7)

    林分类型 Stand type地面真实点 Ground truth (pixel)
    灌草 Shrub马尾松林 Masson pine其他阔叶林 Other broadleaf裸地 Bare soil杉木林 Chinese fir
    灌草 Shrub620 0 126 0 0
    马尾松林 Masson pine 01 263 0 0 9
    其他阔叶林 Other broadleaf 69 01 064 0 1
    裸地 Bare soil 0 0 0325 0
    杉木林 Chinese fir 1 58 0 221 647
    生产者精度 Producer’s accuracy/% 89.86 95.61 89.41 93.66 96.65
    用户精度 User’s accuracy/% 83.11 97.45 92.76100 94.37
    下载: 导出CSV

    表  5  基于CNN生成的混淆矩阵(m = 9)

    Table  5.   Confusion matrix using the CNN (m = 9)

    林分类型 Stand type地面真实点 Ground truth (pixel)
    灌草 Shrub马尾松林 Masson pine其他阔叶林 Other broadleaf裸地 Bare soil杉木林 Chinese fir
    灌草 Shrub605 0 59 0 0
    马尾松林 Masson pine 01 288 0 0 30
    其他阔叶林 Other broadleaf 78 111 095 0 19
    裸地 Bare soil 0 0 0342 0
    杉木林 Chinese fir 7 13 36 51 355
    生产者精度 Producer’s accuracy/% 87.68 98.17 92.02 98.56 96.51
    用户精度 User’s accuracy/% 91.11 97.72 91.02100 95.69
    下载: 导出CSV

    表  2  基于MLP生成的混淆矩阵

    Table  2.   Confusion matrix using the MLP

    林分类型 Stand type地面真实点 Ground truth (pixel)
    灌草 Shrub马尾松林 Masson pine其他阔叶林 Other broadleaf裸地 Bare soil杉木林 Chinese fir
    灌草 Shrub515 0340 0 0
    马尾松林 Masson pine 01 200 0 0 130
    其他阔叶林 Other broadleaf169 0844 0 20
    裸地 Bare soil 0 0 0342 2
    杉木林 Chinese fir 6 121 6 51 252
    生产者精度 Producer’s accuracy/% 74.64 90.84 70.92 98.56 89.17
    用户精度 User’s accuracy/% 60.23 90.23 81.70 99.42 90.07
    下载: 导出CSV

    表  6  基于CNN生成的混淆矩阵

    Table  6.   Confusion matrix using the CNN (m = 11)

    林分类型 Stand type地面真实点 Ground truth (pixel)
    灌草 Shrub马尾松林 Masson pine其他阔叶林 Other broadleaf裸地 Bare soil杉木林 Chinese fir
    灌草 Shrub531 0 1 0 0
    马尾松林 Masson pine 01 262 0 0 52
    其他阔叶林 Other broadleaf120 41 137 0 24
    裸地 Bare soil 0 0 0293 0
    杉木林 Chinese fir 39 37 52 541 328
    生产者精度 Producer’s accuracy/% 76.96 96.85 95.55 84.44 94.59
    用户精度 User’s accuracy/% 99.81 96.04 88.48100 87.95
    下载: 导出CSV

    表  7  不同分类系统分类精度对比利用每种类别的Fscore、OA和Kappa

    Table  7.   Classification accuracy comparison amongst MLP, CNN (m = 5), CNN (m = 7), CNN (m = 9) and CNN (m = 11) for study area using per-class F score, overall accuracy and kappa coefficient (The bold font highlights the greatest classification accuracy per row)

    林分类型 Stand type分类器 Classifier
    MLPCNN (m = 5)CNN (m = 7)CNN (m = 9)CNN (m = 11)
    灌草 Shrub0.666 70.769 40.863 50.893 60.869 1
    马尾松林 Masson pine0.905 30.928 20.965 20.979 40.964 4
    其他阔叶林 Other broadleaf0.759 30.819 30.910 60.915 20.918 8
    裸地 Bare soil0.989 90.985 40.967 30.992 70.915 6
    杉木林 Chinese fir0.896 20.925 90.955 00.961 00.911 5
    总体精度 Overall accuracy/%83.8788.2393.4894.7892.24
    Kappa 系数 Kappa coefficient0.790 40.847 10.914 90.931 80.897 9
    下载: 导出CSV
  • [1] 樊文锋, 李鸿洲, 温奇, 等. 高分二号卫星影像正射纠正精度分析[J]. 测绘通报, 2016(9):63−66.

    Fan W F, Li H Z, Wen Q, et al. Research on accuracy of digital Ortho Rectification of GF-2 image[J]. Bulletin of Surveying and Mapping, 2016(9): 63−66.
    [2] 陈业培, 孙开敏, 白婷, 等. 高分二号影像融合方法质量评价[J]. 测绘科学, 2017,42(11):35−40.

    Chen Y P, Sun K M, Bai T, et al. Quality assessment on image fusion methods for GF-2 data[J]. Science of Surveying and Mapping, 2017,42(11): 35−40.
    [3] Mountrakis G, Im J, Ogole C. Support vector machines in remote sensing: a review[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2011, 66(3): 247−259. doi:  10.1016/j.isprsjprs.2010.11.001
    [4] Rodriguez-Galiano V F, Chica-Olmo M, Abarca-Hernandez F, et al. Random forest classification of Mediterranean land cover using multi-seasonal imagery and multi-seasonal texture[J]. Remote Sensing of Environment, 2012, 121: 93−107. doi:  10.1016/j.rse.2011.12.003
    [5] Mas J F, Flores J J. The application of artificial neural networks to the analysis of remotely sensed data[J]. International Journal of Remote Sensing, 2008, 29(3): 617−663. doi:  10.1080/01431160701352154
    [6] Kumar U, Kerle N, Punia M, et al. Mining land cover information using multilayer perceptron and decision tree from MODIS data[J]. Journal of the Indian Society of Remote Sensing, 2010, 38(4): 592−603. doi:  10.1007/s12524-011-0061-y
    [7] Hu F, Xia G, Hu J, et al. Transferring deep convolutional neural networks for the scene classification of high-resolution remote sensing imagery[J]. Remote Sensing, 2015, 7(11): 14680−14707. doi:  10.3390/rs71114680
    [8] 葛芸, 江顺亮, 叶发茂, 等. 基于ImageNet预训练卷积神经网络的遥感图像检索[J]. 武汉大学学报(信息科学版), 2018, 43(1):67−73.

    Ge Y, Jiang S L, Ye F M, et al. Remote sensing image retrieval using pre-trained convolutional neural networks based on ImageNet[J]. Geomatics and Information Science of Wuhan University, 2018, 43(1): 67−73.
    [9] 姚相坤, 万里红, 霍宏, 等. 基于多结构卷积神经网络的高分遥感影像飞机目标检测[J]. 计算机工程, 2017,43(1):259−267. doi:  10.3969/j.issn.1000-3428.2017.01.045

    Yao X K, Wan L H, Huo H, et al. Airplane object detection in high resolution remote sensing imagery based on multi-structure convolutional neural network[J]. Computer Engineering, 2017,43(1): 259−267. doi:  10.3969/j.issn.1000-3428.2017.01.045
    [10] 黄洁, 姜志国, 张浩鹏, 等. 基于卷积神经网络的遥感图像舰船目标检测[J]. 北京航空航天大学学报, 2017,43(9):1841−1848.

    Huang J, Jiang Z G, Zhang H P, et al. Ship object detection in remote sensing images using convolutional neural networks[J]. Journal of Beijing University of Aeronautics and Astronautics, 2017,43(9): 1841−1848.
    [11] Ren Y, Zhu C, Xiao S. Small object detection in optical remote sensing images via modified faster R-CNN[J]. Applied Sciences, 2018, 8(5): 813. doi:  10.3390/app8050813
    [12] Sharma A, Liu X, Yang X, et al. A patch-based convolutional neural network for remote sensing image classification[J]. Neural Networks, 2017, 95: 19−28. doi:  10.1016/j.neunet.2017.07.017
    [13] 付秀丽, 黎玲萍, 毛克彪, 等. 基于卷积神经网络模型的遥感图像分类[J]. 高技术通讯, 2017,27(3):203−212. doi:  10.3772/j.issn.1002-0470.2017.03.002

    Fu X L, Li L P, Mao K B, et al. Remote sensing image classification based on CNN model[J]. Chinese High Technology Letters, 2017,27(3): 203−212. doi:  10.3772/j.issn.1002-0470.2017.03.002
    [14] Zhang C, Pan X, Li H, et al. A hybrid MLP-CNN classifier for very fine resolution remotely sensed image classification[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2018, 140: 133−144. doi:  10.1016/j.isprsjprs.2017.07.014
    [15] 曹林林, 李海涛, 韩颜顺, 等. 卷积神经网络在高分遥感影像分类中的应用[J]. 测绘科学, 2016,41(9):170−175.

    Cao L L, Li H T, Han Y S, et al. Application of convolutional neural networks in classification of high resolution remote sensing imagery[J]. Science of Surveying and Mapping, 2016,41(9): 170−175.
    [16] 陈广胜, 陈守玉, 景维鹏, 等. 基于遗传算法与全卷积网络的遥感影像像素级分类方法[J]. 小型微型计算机系统, 2018,39(7):1590−1595. doi:  10.3969/j.issn.1000-1220.2018.07.041

    Chen G S, Chen S Y, Jing W P, et al. Remote sensing image pixel-level classification with genetic algorithm and fully convolutional network[J]. Journal of Chinese Computer Systems, 2018,39(7): 1590−1595. doi:  10.3969/j.issn.1000-1220.2018.07.041
    [17] Yue J, Mao S, Li M. A deep learning framework for hyperspectral image classification using spatial pyramid pooling[J]. Remote Sensing Letters, 2016, 7(9): 875−884. doi:  10.1080/2150704X.2016.1193793
    [18] 李竺强, 朱瑞飞, 高放, 等. 三维卷积神经网络模型联合条件随机场优化的高光谱遥感影像分类[J]. 光学学报, 2018,38(8):404−413.

    Li Z Q, Zhu R F, Gao F, et al. Hyperspectral remote sensing image classification based on three-dimensional convolution neural network combined with conditional random field optimization[J]. Act Optica Sinica, 2018,38(8): 404−413.
    [19] Längkvist M, Kiselev A, Alirezaie M, et al. Classification and segmentation of satellite orthoimagery using convolutional neural networks[J]. Remote Sensing, 2016, 8(4): 329. doi:  10.3390/rs8040329
    [20] Fassnacht F E, Latifi H, Stereńczak K, et al. Review of studies on tree species classification from remotely sensed data[J]. Remote Sensing of Environment, 2016, 186: 64−87. doi:  10.1016/j.rse.2016.08.013
    [21] Dalponte M, Bruzzone L, Gianelle D. Tree species classification in the Southern Alps based on the fusion of very high geometrical resolution multispectral/hyperspectral images and LiDAR data[J]. Remote Sensing of Environment, 2012, 123: 258−270. doi:  10.1016/j.rse.2012.03.013
    [22] 王妮, 彭世揆, 李明诗. 基于树种分类的高分辨率遥感数据纹理特征分析[J]. 浙江农林大学学报, 2012,29(2):210−217. doi:  10.3969/j.issn.2095-0756.2012.02.010

    Wang N, Peng S K, Li M S. High-resolution remote sensing of texture images for tree species classification[J]. Journal of Zhejiang A & F University, 2012,29(2): 210−217. doi:  10.3969/j.issn.2095-0756.2012.02.010
    [23] 傅锋, 王新杰, 汪锦, 等. 高分二号影像树种识别及龄组划分研究[J]. 国土资源遥感, 2019, 31(2):118−124.

    Fu F, Wang X J, Wang J, et al. Tree species and age groups classification based on GF-2 image[J]. Remote Sensing for Land and Resources, 2019, 31(2): 118−124.
    [24] 李丹, 柯樱海, 宫辉力, 等. 基于高分辨率遥感影像的城市典型乔木树种分类研究[J]. 地理与地理信息科学, 2016,32(1):84−89. doi:  10.3969/j.issn.1672-0504.2016.01.016

    Li D, Ke Y H, Gong H L, et al. Urban tree species classification with machine learning classifier using WorldView-2 imagery[J]. Geography and Geo-Information Science, 2016,32(1): 84−89. doi:  10.3969/j.issn.1672-0504.2016.01.016
  • [1] 张恒硕, 查同刚, 张晓霞.  晋西黄土区退耕年限对土壤物理性质的影响 . 北京林业大学学报, 2020, 42(6): 123-133. doi: 10.12171/j.1000-1522.20190087
    [2] 赵凯, 李金航, 徐程扬.  侧柏人工林林分结构与色彩斑块间的耦合关系 . 北京林业大学学报, 2019, 41(1): 82-91. doi: 10.13332/j.1000-1522.20180316
    [3] 陈莹, 董灵波, 刘兆刚.  帽儿山天然次生林主要林分类型最优树种组成 . 北京林业大学学报, 2019, 41(5): 118-126. doi: 10.13332/j.1000-1522.20190013
    [4] 朱方嫣, 沈文娟, 李明诗.  基于WorldView2和GF-2的面向对象多指标综合植被变化分析 . 北京林业大学学报, 2019, 41(11): 54-65. doi: 10.13332/j.1000-1522.20180435
    [5] 刘嘉政, 王雪峰, 王甜.  基于多特征融合和CNN模型的树种图像识别研究 . 北京林业大学学报, 2019, 41(11): 76-86. doi: 10.13332/j.1000-1522.20180366
    [6] 张佳楠, 张建军, 张海博, 孙若修, 张守红, 杨云斌.  晋西黄土区典型林分水源涵养能力评价 . 北京林业大学学报, 2019, 41(8): 105-114. doi: 10.13332/j.1000-1522.20180173
    [7] 王晓松, 杨刚.  一种融合聚类和分类算法的树木图像多目标优化分割方法 . 北京林业大学学报, 2018, 40(12): 124-131. doi: 10.13332/j.1000-1522.20180160
    [8] 刘文定, 李安琪, 张军国, 谢将剑, 鲍伟东.  基于ROI-CNN的赛罕乌拉国家级自然保护区陆生野生动物自动识别 . 北京林业大学学报, 2018, 40(8): 123-131. doi: 10.13332/j.1000-1522.20180141
    [9] 樊星火, 葛红艳, 张参参, 邓文平, 陈伏生, 卜文圣.  江西省生态公益林典型林分土壤肥力状况研究 . 北京林业大学学报, 2018, 40(11): 84-92. doi: 10.13332/j.1000-1522.20180084
    [10] 黎宏祥, 王彬, 王玉杰, 王云琦.  不同林分类型对土壤团聚体稳定性及有机碳特征的影响 . 北京林业大学学报, 2016, 38(5): 84-91. doi: 10.13332/j.1000-1522.20150427
    [11] 刘怀鹏, 安慧君, 王冰, 张秋良.  基于递归纹理特征消除的WorldView-2树种分类 . 北京林业大学学报, 2015, 37(8): 53-59. doi: 10.13332/j.1000-1522.20140311
    [12] 赵冰清, 王云琦, 赵晨曦, 余蔚青, 刘辉.  重庆缙云山4种典型林分的大气颗粒物浓度差异及不同大气条件影响研究 . 北京林业大学学报, 2015, 37(8): 76-82. doi: 10.13332/j.1000-1522.20150008
    [13] 赵中华, 惠刚盈, 胡艳波, 李远发, 王宏翔.  基于大小比数的林分空间优势度表达方法及其应用 . 北京林业大学学报, 2014, 36(1): 78-82.
    [14] 黄儒乐, 吴江, 韩宁.  林火烟雾图像自动识别中的模式分类器选择 . 北京林业大学学报, 2012, 34(1): 92-95.
    [15] 李春干, 邵国凡.  Landsat7 ETM+图像用作SPOT5图像森林分类的辅助数据研究 . 北京林业大学学报, 2010, 32(4): 1-5.
    [16] 李萍, 王兵, 戴伟, 王丹, 邓宗付, 赵超.  亚热带几种林分类型的土壤肥力评价研究 . 北京林业大学学报, 2010, 32(3): 52-58.
    [17] 田国恒, 王德强, 谷建才, 谭绪泉, 陆贵巧.  塞罕坝机械林场不同林分类型空间结构的比较 . 北京林业大学学报, 2010, 32(3): 80-83.
    [18] 张立华, 林益明, 叶功富, 殷亮, 周海超.  不同林分类型叶片氮磷含量、氮磷比及其内吸收率 . 北京林业大学学报, 2009, 31(5): 67-72.
    [19] 吕瑞恒, 刘勇, 于海群, 李国雷, 刘辉, 王玉江.  北京山区不同林分类型土壤肥力的研究 . 北京林业大学学报, 2009, 31(6): 159-163.
    [20] 许景伟, 李黎, 索安宁, 张春晓, 焦雯珺, 周艳萍, 吴家兵, 于海霞, 于文吉, 孙志蓉, 邵杰, 高克昌, 金则新, 吕文华, 李俊, 宋先亮, 马玲, 张建军, 郎璞玫, 郑景明, 陆平, 武林, 奚如春, 雷妮娅, 周睿, 刘足根, 张志山, 李传荣, 郑红娟, 戴伟, 赵文喆, 张小由, 蔡锡安, 葛剑平, 盖颖, 韦方强, 李钧敏, 朱清科, 赵广杰, 陈勇, 饶兴权, 于志明, 陈少良, 余养伦, 毕华兴, 马履一, Kwei-NamLaw, 翟明普, 纳磊, 关德新, 赵秀海, 习宝田, 朱教君, 袁小兰, 朱艳燕, 杨永福, 方家强, 王文全, ClaudeDaneault, 张弥, 樊敏, 谭会娟, 王瑞刚, 李增鸿, 张宇清, 赵平, 曾小平, 崔鹏, 江泽慧, 李笑吟, 李俊清, 贾桂霞, 张春雨, 王天明, 于波, 马履一, 夏良放, 贺润平, 袁飞, 李庆卫, 韩士杰, 邓宗付, 陈雪梅, 王卫东, 吴秀芹, 王贺新, 郭孟霞, 张欣荣, 李丽萍, 殷宁, 唐晓军, 刘丽娟, 何明珠, 刘鑫, 王旭琴, 于贵瑞, 王月海, 蒋湘宁, 江杰, 郑敬刚, 吴记贵, 孔俊杰, 熊颖, 毛志宏, 王娜, 聂立水, 王瑞辉, 林靓靓, 李新荣, 孙晓敏, 葛剑平, 王贵霞, 董治良, 郭超颖.  甘肃小陇山森林生物量研究 . 北京林业大学学报, 2007, 29(1): 31-36.
  • 加载中
图(3) / 表 (7)
计量
  • 文章访问数:  1506
  • HTML全文浏览量:  1362
  • PDF下载量:  78
  • 被引次数: 0
出版历程
  • 收稿日期:  2018-10-25
  • 修回日期:  2019-03-15
  • 网络出版日期:  2019-08-07
  • 刊出日期:  2019-09-01

基于卷积神经网络的高分二号影像林分类型分类

doi: 10.13332/j.1000-1522.20180342
    基金项目:  国家重点研发计划项目(2017YFC050410101),中央高校基本科研业务费专项(BLJD200907、JD2010-2)
    作者简介:

    江涛。主要研究方向:林业遥感与信息技术。Email:taoorwell@bjfu.edu.cn  地址:100083 北京市海淀区清华东路35号北京林业大学林学院

    通讯作者: 王新杰,教授。主要研究方向:森林资源监测和林业遥感。Email:xinjiew@bjfu.edu.cn  地址:同上
  • 中图分类号: S771.8

摘要: 目的基于遥感影像的林分类型分类在现代林业中是一项重要的应用。本文试图构建一个基于高分二号(GF-2)影像林分类型分类的卷积神经网络(CNN)模型,探索CNN在遥感图像像素级分类这一领域的发展潜力。方法以GF-2卫星遥感影像为数据源,利用Tensorflow(一种开源用于机器学习的框架)构建4种不同图像斑块大小(m = 5,7,9,11)为输入的CNN,同时以传统的神经网络模型——多层感知器(MLP)为基准,比较不同图像斑块大小下的CNN分类图的分类效果和分类精度。结果实验分类结果表明:CNN(m = 9)得出最高的分类精确度,总体精度比MLP和CNN(m = 5,7,11)分别高出10.91%和6.55%、1.3%、2.54%。分类图的可视化结果也表明CNN(m = 9)更好地解决了“椒盐现象”与过度平滑后的边界不确定性问题。结论CNN能够在利用高分影像光谱特征的同时充分挖掘影像的空间特征,从而提高分类精度,同时在利用CNN基于遥感影像分类时,根据数据源以及地物的特点选择合适的图像斑块大小作为输入是提高分类精度与分类效果的关键措施。

English Abstract

江涛, 王新杰. 基于卷积神经网络的高分二号影像林分类型分类[J]. 北京林业大学学报, 2019, 41(9): 20-29. doi: 10.13332/j.1000-1522.20180342
引用本文: 江涛, 王新杰. 基于卷积神经网络的高分二号影像林分类型分类[J]. 北京林业大学学报, 2019, 41(9): 20-29. doi: 10.13332/j.1000-1522.20180342
Jiang Tao, Wang Xinjie. Convolutional neural network for GF-2 image stand type classification[J]. Journal of Beijing Forestry University, 2019, 41(9): 20-29. doi: 10.13332/j.1000-1522.20180342
Citation: Jiang Tao, Wang Xinjie. Convolutional neural network for GF-2 image stand type classification[J]. Journal of Beijing Forestry University, 2019, 41(9): 20-29. doi: 10.13332/j.1000-1522.20180342
  • 林分类型是森林资源调查中一个重要的调查因子,对森林经营管理与生态保护起着重要作用。林分中树种的组成与分布将直接影响森林的生长与收获,对不同树种组成的林分采取的经营措施也不相同。在生态保护问题中,了解森林的树种多样性,有助于理解各物种在生态系统中起到的生态作用。通过实地踏查获取大区域的树种组成信息成本较高,周期较长。遥感数据能够及时有效地获取大区域的地面信息,并且随着遥感技术的发展,遥感影像在空间、光谱、时间分辨率上都有巨大的提升,借助遥感手段获取林分的类型以及观测森林面积的消长已经成为一个重要的研究方向。

    高分二号(GF-2)卫星是我国高分系列卫星中首颗空间分辨率优于1 m的光学遥感卫星,也是我国目前分辨率最高的民用陆地观测卫星。由于高分二号卫星影像在拥有较多地物光谱信息的同时包含丰富的空间纹理信息,因此高分二号卫星影像被广泛应用在土地利用调查、矿产资源开发、农作物产量及生长检测和森林资源调查等任务中。不少学者在对高分二号影像预处理方面,包括正射矫正和图像融合等技术上进行了大量的研究[1-2],为推动高分二号影像的应用做出了贡献。

    在影响影像分类精度研究中,数据源的重要性不言而喻,但在另一方面,选择合适的分类算法也显得尤为关键。林分类型分类问题在本质上是属于分类问题,在早期的分类研究中,一些分类算法如监督分类中的最大释然法(maximum likelihood classification)和非监督分类中的聚类算法(K-means)被广泛应用于分类任务中。但在近十几年,随着计算机技术的发展,一些新兴的分类算法,如支持向量机(support vector machine,SVM)[3]、随机森林(random forset)[4]和神经网络,这些非参数的机器学习分类算法相较于传统的分类方法能够取得较好的分类效果,其中神经网络模型由于参数多、数据拟合程度高、模型可调控性好等特点,对神经网络模型的研究一直在持续。神经网络模型是受到人类大脑的运作机制而启发产生的。在人的视觉大脑皮层中,包含数以百万的神经元,神经元之间的连接数以亿计,因此能够处理复杂的图像识别任务[5]。多层感知器(multilayer perceptron,MLP)是一种传统的典型神经网络模型,被设计用来处理复杂的分类与回归预测任务。在早期的研究中,MLP在基于遥感影像的土地利用与土地分类任务中取得了良好的效果[6]。然而,MLP由于自身较浅的网络结构,很难学习到图像的深度特征,并且随着神经元个数以及网络层数的增加,容易出现过拟合现象。随着神经科学的发展,一种能够进行深度学习的神经网络——卷积神经网络(convolutional neural network,CNN)正发挥着越来越重要的作用,CNN正在计算机视觉与模式识别等相关领域取得令人瞩目的效果。由于遥感图像获取方式的特点,结合遥感数据源的CNN相关研究正在蓬勃发展,最初CNN在遥感图像方面的应用是在图像检索与场景分类上,Hu等[7]利用迁移学习理念,从几种预先训练的大型网络中提取图像特征信息,用于遥感图像场景分类,在几种公开数据集上的测试效果都很好。葛芸等[8]通过在ImageNet数据集上预先训练4种卷积神经网络模型,将其运用于遥感图像检索,结果表明预先训练的卷积神经网络能有效改进遥感图像检索性能。基于CNN遥感图像目标检测也有较大的发展,姚相坤等[9]和黄洁等[10]利用CNN能够提取复杂图像特征的能力,将CNN用于舰船与飞机等识别度较高的物体检测任务中取得较高的检测精度。Ren等[11]利用修正后的Faster R-CNN提高了小物体在遥感影像上检测的精度。然而,不同于场景分类和目标检测任务,当需要在遥感影像上获取地物的分布特点和范围时,需要对遥感影像上的每一个像元进行准确分类。因此,探究CNN在遥感影像像元级分类中的潜力成为了一个热门的研究方向。但由于遥感数据源形式多样,不同的数据结构会导致CNN的输入与结构存在较大差异。Sharma等[12]提出一种以图像斑块大小为5作为输入的CNN,对Landsat8影像进行分类并取得较好的分类效果。付秀丽等[13]基于Landsat TM5数据源,以图像斑块大小为32作为输入构建CNN,对影像进行分类,最终实验精度表明CNN分类精度明显高于与之对比的SVM算法。对于高分辨率卫星影像,例如worldview2,Zhang等[14]构建了一种MLP与CNN相结合的分类器,对城市与郊区两种不同类型的地物进行分类,使得分类效果得到较大的提高。曹林林等[15]基于Quickbird数据源采用面向对象的分类方法,对比CNN和SVM两种分类算法的分类精度,实验结果表明CNN的分类精度明显高于SVM。陈广胜等[16]提出基于遗传算法和卷积网络分类方法,对高分辨率遥感影像进行基于光谱−空间−语义特征分类,实验结果表明提出的分类方法对不同类别样本的分类精度都有较大提升。在高光谱数据研究中,降低数据的维度,选取合适的波段是处理高光谱遥感影像分类的关键。Yue等[17]展示了一种结合主成分分析、深度卷积神经网络与逻辑回归的学习框架,对高光谱遥感影像进行分类,取得了较好的分类效果。李竺强等[18]提出一种适合高光谱分类的三维卷积神经网络模型,模型框架充分利用高光谱影像中像素空间领域信息与光谱信息,在测试数据集上达到很高的分类精度。Längkvist等[19]设计实验探究了不同超参数组合的CNN对遥感影像分割与分类的影响,对CNN网络结构的搭建有重要参考价值。

    利用遥感影像进行植被分类的研究也在不断深入,包括不同数据源与不同分类算法的比较[20]。Dalponte等[21]通过将高密度激光雷达(light detection and ranging,LiDAR)数据分别和高光谱与多光谱数据进行融合,对比两种不同融合方式对树种分类准确度的影响, 实验结果表明高光谱影像与高密度LiDAR的融合方式取得较高的分类精度。多光谱影像数据由于在获取和数据处理方面相较于高光谱数据和LiDAR数据更为简单, 早期的研究以多光谱影像数据为主,但由于光谱分辨率较低,研究的方向侧重在探究影像的纹理信息与利用灰度共生矩阵(gray level co-occurrence)提取影像纹理特征用于分类是大多数学者研究的方向,主要集中在对纹理特征的筛选[22]、纹理方向[23]以及移动窗口大小[24]对分类结果的影响。利用CNN网络自提取影像高级空间特征用于分类的研究还较少,尚有发展的潜力。

    本文主要研究以MLP为基准、对比不同图像斑块大小为输入的CNN对高分二号影像林分类型分类的影响。利用开源的机器学习框架Tensorflow搭建CNN与MLP模型,以高分二号4波段地物反射率数据作为样本,探究CNN模型在高分二号卫星遥感影像分类上的表现。具体探讨的问题:(1)比较两种神经网络(CNN和MLP),在高分影像林分类型分类上的分类效果;(2)比较不同图像斑块大小为输入的CNN的分类效果,得出适合基于高分二号卫星影像林分类型分类的CNN。

    • 本实验选取福建省三明市将乐县国有林场周边的部分林分。实验区域林分内有针叶林与阔叶林两种林分类型。针叶林主要是各个龄级的杉木(Cunninghamia lanceolate)和马尾松(Pinus massoniana);阔叶林中包含木荷(Schima superba)和泡桐(Paulownia),还有其他的阔叶树散生在路边或沟谷。根据实际调查与分类要求,本文的林分类型分类包括灌草、马尾松林、其他阔叶林、裸地和杉木林。

      遥感影像的数据源是高分二号卫星的全色与多光谱影像。成像时间是2017年5月14日。多光谱扫描仪获得的数据含4个光谱波段和一个全色波段。光谱波段包括蓝(450 ~ 520 nm)、绿(520 ~ 590 nm)、红(630 ~ 690 nm)和近红外(770 ~ 890 nm)。全色波段的空间分辨率为1.0 m,光谱波段的分辨率为4.0 m。在遥感图像的预处理阶段,首先将高分二号影像的全色与多光谱影像利用自带的RPC信息和数字高程模型进行正射校正处理,然后将多光谱影像在ENVI中利用FLAASH模块进行大气校正处理,最后利用Gran-Schmidt将全色与多光谱影像进行融合获得0.96 m的高分多光谱融合影像。

      本实验根据森林资源小班调查图和地面样地调查数据获取训练样本和测试样本,用于模型的输入与精度的验证。森林资源小班调查图由当地的林业部门提供,样地调查数据根据小班分布图设置样地,对样地内树木进行树种鉴别,测量胸径和树高以及利用GPS定位。在遥感影像上选取感兴趣区(ROIs),将样本分为训练样本和测试样本,并利用Python中scikit-learn将训练数据打乱并按照3∶1拆分为训练数据和验证数据(表1),用于在训练模型的过程中判断是否过拟合和验证。

      表 1  研究区分类类别描述及其训练、验证和测试样本大小

      Table 1.  Description of class at study with training, validation and testing samples size

      林分类型
      Stand type
      详细描述
      Descriptions
      训练样本
      Train sample
      验证样本
      Validation sample
      测试样本
      Test sample
      灌草
      Shrub
      林中草地、生长大量灌草的伐后林地、布满杂草的林道
      Grass glade, nonforested land with large amount bushes and grasses,
      forest road with large shrubs
      1 653 525 690
      马尾松
      Masson pine
      不同龄级的马尾松林,主要是近熟林和成熟林
      Masson pine forest with different age classes,
      mainly half-mature forest and mature forest
      2 008 661 1 289
      其他阔叶林
      Other broadleaf
      一些阔叶树,主要是由木荷组成的林带、
      散生的泡桐以及其他阔叶树种组成的混交林
      Some broadleaf trees, including schima used as fire belt,
      scattered paulownia and other mixed broadleaf forest
      1 823 590 1 190
      裸地
      Bare soil
      主要是几乎不含植被的农业用地和林业用地
      Cropland and forest land with low percentage or no vegetation
      1 653 575 347
      杉木林
      Chinese fir
      不同龄级的杉木林,主要是幼龄林、中龄林和成熟林
      Chinese fir forest with different age classes, including young forest,
      half-mature forest and mature forest
      2 743 943 1 548
    • MLP是一种将输入数据以一种前馈方式映射到输出的网络。这种网络由相互连接的多层神经元组成,包括输入层、隐藏层和输出层(图1)。人工神经元的类型取决于激活函数,感知器和sigmoid都是激活函数,每个神经元的输出处理方式取决于激活函数,例如感知器的输出是0或1,而sigmoid神经元的输出是0到1中的任意一个数,这一点有利于机器学习。通常,激活函数的神经元输出形式是:

      图  1  MLP和CNN(m = 9)的结构框架

      Figure 1.  Architecture of the CNN (m = 9) and MLP

      $$f\left( x \right) = f\left( {{w_i}{x_i} + {b_i}} \right)$$ (1)

      式中:xiwibi分别代表在i层中的输入值、权重值和偏差值,f(x)为激活函数。

      损失函数或代价函数是一种函数。这种函数能够找到权重与偏差值使得从网络中输出的值与实际的标签值无限接近,从而达到学习的目的。

      $$C\left( {w,b} \right) = \frac{1}{{2n}}\mathop \sum \limits_x y\left( x \right) - {a^2}{\rm{}}$$ (2)

      式中:C(w, b)是损失函数,w代表网络中所有的权重值;b代表所有的偏差值;n输入网络中训练样本的数量;a是当x作为输入时,网络的输出值;$y\left(x \right)$代表x作为对应的标签值。

      C(w, b)为二次损失函数,是一种在早期研究中运用最多的损失函数,而另外一种损失函数的有效形式是交叉熵函数:

      $$C = - \frac{1}{n}\mathop \sum \limits_x \left[ {y{\rm{ln}}a + \left( {1 - y} \right){\rm{ln}}\left( {1 - a} \right)} \right]{\rm{}}$$ (3)

      式中:n代表训练数据的总数,x是输入值,y是对应的标签值,a = $f\left(x \right)$

    • 利用全连接层的神经网络如MLP,用于图像分类,往往取得的效果不好,这是因为网络的框架没有考虑图像的空间结构信息,因而提出一种适合图像分类的新型神经网络——卷积神经网络(CNN)。CNN能够快速学习和训练。卷积神经网络有3个基础概念:局部感受野、共享权重和池化。

      局部感受野:与MLP相比,在隐藏层中的神经元不是直接和输入神经元进行一对一连接,而是通过将输入神经元组成一个小的区域对接隐藏层中的神经元,该片区域称之为局部感受野。感受野大小将影响获取图像空间信息的能力。

      共享权重和偏差值:通常将从输入层输出到隐藏层的小区域称之为“特征图层”,将“特征图层”的权重称之为共享权重,“特征图层”的偏差值称之为共享偏差值。共享权重与偏差通常被称之为“核”或“滤波器”(filter)。

      $${a^1} = f\left( {b + w*{a^0}} \right){\rm{}}$$ (4)

      式中:a1代表一个“特征图层”的输出值,a0代表输入的特征图层,*代表卷积操作。

      池化层:除了上述的卷积操作,CNN包含池化操作,池化操作一般在卷积操作之后,池化操作的主要目的是简化从卷积操作输出的信息,池化层将从卷积层中输出的特征图结果转化为更加浓缩的特征图层。一个最常见的池化操作是最大池化操作,在最大池化操作中,池化单元总结上一个特征图层对应区域的神经元的最大值作为最终输出值,池化的大小一般是2 × 2,即将上一个特征图层对应区域的4个神经元中的最大值代表这2 × 2的区域特征,从而缩小简化了图的信息。

      当经过卷积与池化操作后,网络结构将进入全连接层,这部分的信息传递与MLP类似。相比较于MLP,CNN框架更加复杂,但变量的数量较少,获得的信息较多,所以容易训练与学习,从而达到较高的分类效果。

    • 总体精度(OA):OA是指被正确分类的像元总数与总像元数的比值。

      Kappa系数(Kappa):它是通过把所有地表真实分类中的像元总数乘以混淆矩阵对角线的和,再减去某一类地表真实像元总数与该类中被分类像元总数之积对所有类别求和的结果,再除以总像元数的平方减去某一类真实像元总数与该类中被分类像元总数之积对所有类别求和的结果所得到的。

      制图精度(PA):PA是指某类别中被正确分类的像元数与该类别真实参考总数的比值。

      用户精度(UA):UA是指某类别中被正确分类的像元数与被分为该类别像元总数的比值。

      Fscore:Fscore是将制图精度与用户精度相结合的一个分类精度评价指标,Fscore越大,精度越高,其值在0 ~ 1之间,公式如下:

      $${\rm{Fscore}} = 2 \times \frac{{{\rm{PA}} \times {\rm{UA}}}}{{{\rm{PA}} + {\rm{UA}}}}{\rm{}}$$ (5)
    • 不同于普通的RGB图像,遥感图像数据格式独特,因此需要设计一种合适的框架进行有效的学习。高分二号遥感影像在本质上是一个大小为X × Y × Z的多维数组。MLP和CNN均以4个波段的反射率作为模型的输入,不同的是,MLP只利用一个像元的数据,而构建的CNN则是以不同图像斑块大小作为输入。图像斑块大小m = 5,7,9,11,对应的输入数据为5 × 5 × 4、7 × 7 × 4、9 × 9 × 4和11 × 11 × 4多维数组的数据。MLP和CNN的输入值对应的标签值为斑块的中心像元的类别。两类模型的输出是5种分类的类别,其形式是一个含各类别的概率(0 ~ 1)的一维数组。

    • 图1展示了CNN(m = 9)和MLP的总体框架。在CNN(m = 9)网络系统中,卷积层的层数设置为2层包含了卷积操作和池化操作,2层卷积层能够更好地保持模型的复杂度和鲁棒性。在卷积操作中,filter的大小设置为3 × 3。为获取邻近像元的更多空间信息,池化操作选择最大池化,池化单元选择2 × 2。在卷积操作后,卷积的结果输入到全连接层,全连接层神经元个数设置为1 000;框架最后一层为softmax层,神经元的个数设置为5,对应5种地物类别。在整个框架中除去最后一层,其他层的激活函数都选择的是修正线性单元函数(rectified linear unit,RELU)。相比较于sigmoid激活函数,RELU不会导致饱和,学习不会下降。RELU已经被广泛使用在各种神经网络中。代价函数选择的是交叉熵函数。选择交叉熵函数有利于模型更好的学习。优化器(optimizer)选择的是ADAM优化器,学习率为0.000 1,权重的初始化方式选择截断分布。为实施以上的模型,使用一款开源的机器学习框架Tensorflow和Python的GDAL、Numpy包,用于搭建神经网络和遥感数据的读取与输出。图1中展示了MLP模型的框架,从左至右,绿色的神经元是输入层,神经元个数为4;网络中含2个隐藏层(颜色为蓝色的神经元),每层含有100个神经元;颜色为橘色的神经元为输出层,神经元个数设置为5,对应分类的类别数。激活函数、权重初始化方式、代价函数以及优化器(这里学习率为0.001)和CNN的配置相同。

    • 过拟合是神经网络训练过程中存在的最主要的问题。由于现在流行的一些神经网络大都含有较多的权重值与偏差值并且网络结构很深,当模型过于复杂,在面对较小的数据集时,很容易产生过拟合问题。为了更加有效地训练和提高模型的性能,需要在训练过程中检测过拟合是否发生,一旦过拟合发生就停止训练。在本文中,采用早停(Early Stopping)和Dropout两种方式防止过拟合。每次迭代后利用验证数据进行精度验证,一旦发现验证精度和损失值在接下来的100次迭代中不再变化就停止训练,保存模型的框架与权重偏差值。利用tensorboard(一种在Tensorflow中用于可视化学习的模块)记录准确率与损失值的变化;另一方面,为防止神经元数量过多,导致模型过于复杂而产生的过拟合,利用Dropout方式在每次迭代中随机丢弃全连接层的50%的神经元,剩余的神经元用于训练,这样在每次迭代时就如同使用不同的网络结构。Dropout是一种被公认的有效防止过拟合的措施,另外防止过拟合的方式还有很多,例如正则化等。图2所展示的是CNN(m = 9)模型的训练过程中准确率、损失值的变化曲线以及早停点的位置图。在迭代第130次时,损失值和准确率在以后的100次中未有明显的变化,因此选择停止迭代,保存权重与偏差值固定模型用于后续的影像分类。

      图  2  CNN(m = 9)在训练阶段准确率与损失值图

      Figure 2.  Accuracy (left) and loss (right) of the CNN (m = 9) in stage of training

      表 3  基于CNN生成的混淆矩阵(m = 5)

      Table 3.  Confusion matrix using the CNN (m = 5)

      林分类型 Stand type地面真实点 Ground truth (pixel)
      灌草 Shrub马尾松林 Masson pine其他阔叶林 Other broadleaf裸地 Bare soil杉木林 Chinese fir
      灌草 Shrub619 0300 0 0
      马尾松林 Masson pine 01 190 0 0 53
      其他阔叶林 Other broadleaf 67 0873 0 1
      裸地 Bare soil 0 0 0337 0
      杉木林 Chinese fir 4 131 17 101 350
      生产者精度 Producer’s accuracy/% 89.71 90.83 73.36 97.12 96.15
      用户精度 User’s accuracy/% 67.36 95.74 92.77100 89.29

      表 4  基于CNN生成的混淆矩阵(m = 7)

      Table 4.  Confusion matrix using the CNN (m = 7)

      林分类型 Stand type地面真实点 Ground truth (pixel)
      灌草 Shrub马尾松林 Masson pine其他阔叶林 Other broadleaf裸地 Bare soil杉木林 Chinese fir
      灌草 Shrub620 0 126 0 0
      马尾松林 Masson pine 01 263 0 0 9
      其他阔叶林 Other broadleaf 69 01 064 0 1
      裸地 Bare soil 0 0 0325 0
      杉木林 Chinese fir 1 58 0 221 647
      生产者精度 Producer’s accuracy/% 89.86 95.61 89.41 93.66 96.65
      用户精度 User’s accuracy/% 83.11 97.45 92.76100 94.37

      表 5  基于CNN生成的混淆矩阵(m = 9)

      Table 5.  Confusion matrix using the CNN (m = 9)

      林分类型 Stand type地面真实点 Ground truth (pixel)
      灌草 Shrub马尾松林 Masson pine其他阔叶林 Other broadleaf裸地 Bare soil杉木林 Chinese fir
      灌草 Shrub605 0 59 0 0
      马尾松林 Masson pine 01 288 0 0 30
      其他阔叶林 Other broadleaf 78 111 095 0 19
      裸地 Bare soil 0 0 0342 0
      杉木林 Chinese fir 7 13 36 51 355
      生产者精度 Producer’s accuracy/% 87.68 98.17 92.02 98.56 96.51
      用户精度 User’s accuracy/% 91.11 97.72 91.02100 95.69
    • 利用测试数据与生成的分类图形成混淆矩阵进行分类结果的准确率评估。评价的指标有制图精度(PA)、用户精度(UA)、总体精度(OA)、Kappa系数和Fscore。表2 ~ 6列出了5种神经网络分类对应的混淆矩阵,表7给出了5种神经网络分类系统的分类准确度对比。

      表 2  基于MLP生成的混淆矩阵

      Table 2.  Confusion matrix using the MLP

      林分类型 Stand type地面真实点 Ground truth (pixel)
      灌草 Shrub马尾松林 Masson pine其他阔叶林 Other broadleaf裸地 Bare soil杉木林 Chinese fir
      灌草 Shrub515 0340 0 0
      马尾松林 Masson pine 01 200 0 0 130
      其他阔叶林 Other broadleaf169 0844 0 20
      裸地 Bare soil 0 0 0342 2
      杉木林 Chinese fir 6 121 6 51 252
      生产者精度 Producer’s accuracy/% 74.64 90.84 70.92 98.56 89.17
      用户精度 User’s accuracy/% 60.23 90.23 81.70 99.42 90.07

      表 6  基于CNN生成的混淆矩阵

      Table 6.  Confusion matrix using the CNN (m = 11)

      林分类型 Stand type地面真实点 Ground truth (pixel)
      灌草 Shrub马尾松林 Masson pine其他阔叶林 Other broadleaf裸地 Bare soil杉木林 Chinese fir
      灌草 Shrub531 0 1 0 0
      马尾松林 Masson pine 01 262 0 0 52
      其他阔叶林 Other broadleaf120 41 137 0 24
      裸地 Bare soil 0 0 0293 0
      杉木林 Chinese fir 39 37 52 541 328
      生产者精度 Producer’s accuracy/% 76.96 96.85 95.55 84.44 94.59
      用户精度 User’s accuracy/% 99.81 96.04 88.48100 87.95

      表 7  不同分类系统分类精度对比利用每种类别的Fscore、OA和Kappa

      Table 7.  Classification accuracy comparison amongst MLP, CNN (m = 5), CNN (m = 7), CNN (m = 9) and CNN (m = 11) for study area using per-class F score, overall accuracy and kappa coefficient (The bold font highlights the greatest classification accuracy per row)

      林分类型 Stand type分类器 Classifier
      MLPCNN (m = 5)CNN (m = 7)CNN (m = 9)CNN (m = 11)
      灌草 Shrub0.666 70.769 40.863 50.893 60.869 1
      马尾松林 Masson pine0.905 30.928 20.965 20.979 40.964 4
      其他阔叶林 Other broadleaf0.759 30.819 30.910 60.915 20.918 8
      裸地 Bare soil0.989 90.985 40.967 30.992 70.915 6
      杉木林 Chinese fir0.896 20.925 90.955 00.961 00.911 5
      总体精度 Overall accuracy/%83.8788.2393.4894.7892.24
      Kappa 系数 Kappa coefficient0.790 40.847 10.914 90.931 80.897 9

      表7数据可以看出:CNN(m = 9)分类精度达到最高,OA和Kappa系数高达94.78%和0.931 8,高于MLP(83.87%,0.790 4)、CNN(m = 5)(88.23%,0.9471)、CNN(m = 7)(93.48%,0.914 9)和CNN(m = 11)(92.24%,0.897 9)。可以看出5种分类系统的准确率排序为:MLP < CNN(m = 5) < CNN(m = 11) < CNN(m = 7) < CNN(m = 9)。从表7中可以看到CNN(m = 9)不仅在OA和Kappa系数上表现的高于其他分类系统,在对每种类别的分类准确率上也较高。为了综合比较每种类别的分类准确度,利用Fscore来评价。Fscore结合了PA和UA,能更好地反映分类的准确度。从表7的数据中可以看出,CNN(m = 9)在每种类别上的分类精度都高于CNN(m = 5)和MLP,其中在灌草类别上,CNN(m = 9)比CNN(m = 5)和MLP要分别高出0.124 2和0.226 9。当CNN(m = 9)和CNN(m = 11)相比较时,除其他阔叶林类别外,在其他所有类别上,CNN(m = 9)的分类准确率都要大于CNN(m = 11),并且CNN(m = 11)在其他阔叶林类别上的分类准确率仅比CNN(m = 9)稍大一点(0.003 6)。所以,可以认为CNN(m = 9)在每种类别上的分类精度几乎都优于CNN(m = 11)。当与CNN(m = 7)对比时,虽然在每种类别的分类精度上,CNN(m = 9)与CNN(m = 7)的准确度非常接近,但也能看出在每种类别上都有微量的提升。当将CNN(m = 5,m = 7和m = 11)与MLP准确度对比时,除去裸地这一类别外,CNN在每种类别上的分类准确度是要高于MLP的。对于裸地类别,MLP的准确度明显高于CNN,MLP比CNN(m = 11)要高0.074 3。对比除CNN(m = 9)以外的CNN的分类准确度时,可以看出CNN(m = 7)在灌草、马尾松林、裸地和杉木林4种类别上都比CNN(m = 11)和CNN(m = 5)要高。

      图3是研究区两个子图(A和B)的分类结果。首先,在MLP的分类结果图中A和B上都显示出不同程度的噪点,在A、B中,杉木林类别被错误分类为马尾松林类别,在B中一些其他阔叶林类别也被误分类为灌草类别。但是,MLP在鉴别裸地类别时表现的很好。将CNN的分类图与MLP相互比较,CNN分类图中图像“噪点”在减少,平滑的效果在明显增加。对比CNN(m = 5,7)和MLP时,虽然平滑效果在增加,但“噪点”仍然存在,尽管CNN(m = 7)分类效果比CNN(m = 5)要好。在对比CNN(m = 9)和CNN(m = 11)分类效果时,可以观察到随着图像斑块大小的增加,出现了另外一个问题,即由于过度平滑而导致类别间的界限变得不确定,一些小的或线状的类别被擦除或合并到一些大的类别中。例如,在CNN(m = 11)的分类图A中,其他阔叶林组成的林带被切断合并到杉木类别中;在B中一些小部分的杉木类别被合并到其他阔叶林类别中,类别间的边界变得不确定。在CNN(m = 9)分类图中,“噪点”和边界不确定性的问题得到减弱,在CNN(m = 11)中被误分的林带和小部分的杉木也得到正确的分类,在MLP和CNN(m = 5,7)中出现的不同程度的“噪点”也得到明显的减少。

      图  3  两幅研究区子图在不同分类系统下的分类结果

      Figure 3.  Two image subsets (A and B) in study area with classification results (Columns from left to right represent the original images, the MLP classification and CNN (m = 5, 7, 9, 11) classification correspondingly)

    • MLP作为一种传统的神经网络模型,依靠的是单个像元的光谱信息,但并没有挖掘高分辨率遥感影像丰富的空间特征信息,因此MLP在高分影像树种识别上未取得所期望的效果,OA(83.97%)和Kappa(0.790 4)远低于CNN(m = 9)(94.78%,0.931 8)。对于大面积的杉木林类别以及其他阔叶林类别,虽然能够鉴别正确,但由于“椒盐现象”而产生的“噪点”,使得MLP在两种类别的分类精度(0.896 2,0.759 3)上都低于CNN(m = 9)(0.961 0,0.915 2)。

      CNN作为一种现今热门的深度学习神经网络,能够从高分辨卫星影像上挖掘高级的空间特征,同时,特有的卷积与池化操作能够在减少变量的同时,最大可能地挖掘图像的特征信息。在本文中,CNN(m = 5,7,9,11)的分类准确率都比MLP要高,分类效果要好。然而事物都有两面性,CNN也不能例外,随着图像斑块大小的增加,“椒盐现象”的影响在逐渐减弱,但由于过度平滑而产生的边界不确定性的问题随之而来。为避免两种分类问题的干扰从而达到较高的分类准确率,选择一个适合的图像斑块大小作为CNN的输入是关键。实验结果表明,将图像的斑块大小设置为9时,分类的准确度和分类图的分类效果达到最好,即图像斑块大小在基于CNN遥感影像分类中至关重要,斑块大小过小,会导致挖掘的空间信息不够,出现类似于MLP一样的“椒盐现象”,但斑块的大小过大时,会出现过度平滑问题,导致面积较小的或线性的类别被忽略,从而降低分类的准确度。数据源的特征,例如空间分辨率的大小,以及分类对象特点是影响图像斑块(m)的重要因素。

      本文提出一种为高分二号卫星遥感影像林分类型分类定制的CNN系统,该CNN系统以图像斑块大小为9输入,能够充分挖掘高分影像的空间和光谱信息,通过实验对比MLP以及其他斑块大小输入的CNN,发现CNN(m = 9)在总体精度与各类别的分类精度上都取得了较大的提升。但是,仍有许多问题值得继续深入研究。一方面,卷积神经网络的框架以及超参数的选择,一直是热门的研究方向,调整参数与框架一直是神经网络的难点。根据数据特征,选择合适的框架与参数显得尤为重要。另一方面,在遥感影像数据源上,随着遥感理论与传感器技术的发展,数据源的类型多样,了解不同数据源的优势,利用数据源之间的互补作用,结合CNN分类会使得分类精度进一步提升。再者,结合各种分类算法特点,利用CNN能够提取高级的空间特征,使用其他分类算法进行最后决策分类,也是一个值得深入研究的方向。

参考文献 (24)

目录

    /

    返回文章
    返回