高级检索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于多层感知机的长白落叶松人工林林分生物量模型

徐奇刚 雷相东 国红 李海奎 李玉堂

徐奇刚, 雷相东, 国红, 李海奎, 李玉堂. 基于多层感知机的长白落叶松人工林林分生物量模型[J]. 北京林业大学学报, 2019, 41(5): 97-107. doi: 10.13332/j.1000-1522.20190035
引用本文: 徐奇刚, 雷相东, 国红, 李海奎, 李玉堂. 基于多层感知机的长白落叶松人工林林分生物量模型[J]. 北京林业大学学报, 2019, 41(5): 97-107. doi: 10.13332/j.1000-1522.20190035
Xu Qigang, Lei Xiangdong, Guo Hong, Li Haikui, Li Yutang. Stand biomass model of Larix olgensis plantations based on multi-layer perceptron networks[J]. Journal of Beijing Forestry University, 2019, 41(5): 97-107. doi: 10.13332/j.1000-1522.20190035
Citation: Xu Qigang, Lei Xiangdong, Guo Hong, Li Haikui, Li Yutang. Stand biomass model of Larix olgensis plantations based on multi-layer perceptron networks[J]. Journal of Beijing Forestry University, 2019, 41(5): 97-107. doi: 10.13332/j.1000-1522.20190035

基于多层感知机的长白落叶松人工林林分生物量模型

doi: 10.13332/j.1000-1522.20190035
基金项目: 林业行业公益性科研项目“我国主要林区林地立地质量和生产力评价研究”(201504303)
详细信息
    作者简介:

    徐奇刚,博士生。主要研究方向:森林生长收获模型。Email:adslxqg@126.com 地址:100091 北京市海淀区香山路东小府1号中国林业科学研究院资源信息研究所

    通讯作者:

    雷相东,研究员,博士生导师。主要研究方向:森林生长模型与模拟。Email:xdlei@caf.ac.cn 地址:同上

Stand biomass model of Larix olgensis plantations based on multi-layer perceptron networks

  • 摘要: 目的神经网络模型能避免林分生物量模型建模时自变量共线性与异方差问题,研究多层感知机在林分生物量模型中的应用,为森林经营单位、区域生物量和碳储量的估算提供方法和依据。方法以长白落叶松人工林为研究对象,利用吉林省一类清查固定样地的917组数据,分别建立了基于传统的对数转化后线性模型和神经网络多层感知机的地上生物量和总生物量模型。使用AIC、决定系数(R2)、均方根误差(RMSE)、相对均方根误差(RMSEr)和平均绝对误差(MAE)来评价模型。结果估计精度最高的模型是输入单元为林分平均胸径(D)−平均高(H)−林分密度指数(S)−海拔(HB)−坡向(PX)−坡位(PW)、2个隐藏层、隐单元数为40−20的神经网络模型,与传统对数转换线性回归模型相比,地上生物量和总生物量模型的调整决定系数(Adj.R2)分别从0.902 1提高到了0.914 1,从0.897 9提高到了0.908 9;RMSEr分别从6.330 5%降低到了5.992 2%,从6.490 1%降低到了6.153 6%。包含立地因子的神经网络模型比未包含立地因子的神经网络模型估计精度略有提升,地上生物量与总生物量的Adj.R2分别提高了0.88%和0.99%,RMSEr分别降低了5.33%和5.46%。结论多层感知机生物量模型的估计精度比传统回归模型略有提高,但它可以避免模型选型和违背传统统计假设的处理等问题,且能够一次性计算地上生物量和总生物量模型,有一定优势。
  • 图  1  各个林分变量与地上生物量和总生物量的散点图

    Figure  1.  Scatter plots of stand variables and aboveground and total biomass

    图  2  对数转换线性回归模型残差图(n = 917)

    Figure  2.  Residual plot of predictions and observations based on the logarithmic transformation linear regression model (n = 917)

    图  3  人工神经网络模型(模型25)残差图(n = 184)

    Figure  3.  Scatter plots of predictions and observations based on artificial neural network model (model 25) (n = 184)

    图  4  人工神经网络模型(模型25)训练集与验证集预测结果对比图

    Figure  4.  Artificial neural network model (model 25) prediction comparison of training set and validation set

    图  5  人工神经网络模型(模型34)残差图(n = 184)

    Figure  5.  Residual plot of predictions and observations based on artificial neural network model (model 34) (n = 184)

    图  6  人工神经网络模型(模型34)训练集与验证集预测结果对比图

    Figure  6.  Artificial neural network model (model 34) prediction comparison of training set and validation set

    图  7  人工神经网络模型(模型34)残差图(n = 917)

    Figure  7.  Residual plot of predictions and observations based on artificial neural network model (model 34) (n = 917)

    表  1  样地基本因子与生物量统计量

    Table  1.   Summary statistics of sample plot basic variables and biomass

    林分因子   
    Stand factor   
    最大值
    Max.
    最小值
    Min.
    平均值
    Mean
    标准差
    Standard deviation
    变异系数
    Coefficient of variation/%
    年龄/a Age/year57 5 27 11 40.10
    郁闭度 Crown density 1.00 0.20 0.67 0.2030.09
    株数密度/(株·hm− 2) Stand density/(tree·ha− 1)4 033 267 1 257 675 53.64
    林分断面积/(m2·hm− 2) Stand basal area/(m2·ha− 1) 34.63 3.2513.46 6.6749.55
    蓄积量/(m3·hm− 2) Stand volume/(m3·ha− 1)284.3112.9286.2051.1659.35
    平均胸径 Quadratic mean diameter (D)/cm27.75.812.2 3.629.38
    平均树高 Mean tree height (H)/m23.08.415.9 2.717.16
    海拔 Altitude (HB)/m1 190 10 525 209 39.88
    坡度 Slope (PD)/(°)36 0 11 7 68.93
    地上生物量/(t·hm− 2) Aboveground biomass/(t·ha− 1)174.62 9.9060.0033.4055.67
    总生物量/(t·hm− 2) Total biomass/(t·ha− 1)213.2712.0373.6340.9655.63
    下载: 导出CSV

    表  2  地上生物量对数转换线性回归模型参数估计值

    Table  2.   Estimated parameters of aboveground biomass based on log-linear regression model

    编号 No.异速方程 Allometric equationb0b1b2b3
    1lnY = b0 + b1lnD 0.319 8**1.463 8***
    2lnY = b0 + b1ln(D2 × H− 0.676 8***0.599 2***
    3lnY = b0 + b1lnD + b2lnH− 3.188 2***0.148 2ns 2.450 3***
    4lnY =b0 + b1ln(D2 × H × S− 2.989 5***0.502 7***
    5lnY = b0 + b1lnD + b2lnH + b3lnS− 3.865 1***0.404 9***0.750 0***0.778 1***
    6lnY = b0 + b1ln(D2 × S− 2.554 1***0.589 0***
    7lnY = b0 + b1lnD + b2lnS− 2.993 9***0.764 8***0.828 7***
    8lnY =b0 + b1ln(D2 × H) + b2lnS− 3.372 0***0.314 4***0.803 6***
    9lnY =b0 +b1ln(D2 × S) + b3lnH− 2.307 6***0.628 8***− 0.248 5**
    注:D为平均胸径;H为平均树高;S为林分密度指数; b0b1b2b3为模型参数;ns代表参数在0.05水平上不显著;**代表在0.01水平上显著;***代表在0.001水平上显著。下同。Y为地上生物量;Notes: D represents quadratic mean diameter; H represents mean tree height; S represents stand density index; b0, b1, b2, b3 are parameters of models; ns represents no significant difference at 0.05 level; ** represents significant difference at 0.01 level; *** represents significant difference at 0.001 level. The same below. Y represents aboveground biomass.
    下载: 导出CSV

    表  3  地上生物量对数线性回归模型拟合优度与精度检验

    Table  3.   Fitting statistics of aboveground biomass based on log-linear regression model

    编号
    No.
    AIC决定系数
    R2
    调整决定系数
    Adj.R2
    均方根误差/(t·hm− 2)
    RMSE/(t·ha− 1)
    相对均方根误差
    RMSEr/%
    平均绝对误差/(t·hm− 2)
    MAE/(t·ha− 1)
    18 303.537 90.448 60.448 024.790 415.049 9 19.134 8
    28 219.147 20.500 90.500 423.584 114.317 6 18.190 9
    38 091.547 90.572 60.571 621.825 613.250 0 16.851 1
    47 301.056 00.826 20.826 013.918 38.449 610.278 4
    56 888.135 90.902 40.902 110.427 76.330 56.850 3
    67 240.699 10.835 90.835 713.525 08.210 89.940 4
    76 955.132 70.894 20.894 010.859 06.592 37.358 0
    86 910.318 90.900 30.900 110.542 26.400 07.005 9
    97 235.057 20.836 70.836 413.489 48.189 29.888 6
    下载: 导出CSV

    表  4  总生物量对数转换线性回归模型参数估计值

    Table  4.   Estimated parameters of total biomass based on log-linear regression model

    编号 No.异速方程 Allometric equationb0b1b2b3
    10lnY = b0 + b1lnD 0.534 8***1.459 6***
    11lnY = b0 + b1ln(D2 × H− 0.460 4** 0.597 7**
    12lnY = b0 + b1lnD + b2lnH− 2.986 0***0.139 2ns 2.459 3***
    13lnY = b0 + b1ln(D2 × H × S− 2.770 5***0.501 7***
    14lnY = b0 + b1lnD + b2lnH + b4lnS− 3.661 8***0.395 4***0.762 0***0.776 7***
    15lnY = b0 + b1ln(D2 × S− 2.335 5***0.587 7***
    16lnY = b0 + b1lnD + b2lnS− 2.776 5***0.761 1***0.828 2***
    17lnY = b0 + b1ln(D2 × H) + b2lnS− 3.153 5***0.313 1***0.803 0***
    18lnY = b0 + b1ln(D2 × S) + b3lnH− 2.095 2***0.626 5***− 0.242 3**
    注:Y为总生物量。Note: Y represents total biomass.
    下载: 导出CSV

    表  5  总生物量对数转换线性回归拟合优度与精度检验

    Table  5.   Fitting statistics of total biomass based on log-linear regression model

    编号 No.AICR2Adj.R2RMSE/(t·hm− 2)
    RMSE/(t·ha− 1)
    RMSEr/%MAE/(t·hm− 2)
    MAE/(t·ha− 1)
    108 684.928 00.444 50.443 930.510 515.161 023.547 6
    118 600.925 10.497 00.496 429.033 914.427 322.397 4
    128 472.676 50.569 70.568 726.853 213.343 720.732 3
    137 696.929 90.821 50.821 417.292 88.593 012.781 9
    147 292.576 70.898 20.897 913.060 86.490 18.778 7
    157 638.875 60.831 10.830 916.825 88.360 912.362 3
    167 359.598 60.889 70.889 513.594 16.755 09.369 3
    177 315.456 50.895 90.895 713.207 46.562 98.973 9
    187 633.789 10.831 90.831 516.785 28.340 812.309 4
    下载: 导出CSV

    表  6  未加入立地因子的人工神经网络模型结果与拟合优度检验(基于测试集,n = 184)

    Table  6.   Results and goodness of fitting statistics based on artificial neural network models without site factors (based on test set, n = 184)

    编号
    No.
    输入单元
    Input unit
    隐藏层数
    Number of hidden layers
    隐单元数
    Number of hidden units
    训练轮数
    Epoch
    R2Adj.R2
    AGBTotal BAGBTotal B
    19D2H240−202040.523 60.505 80.521 00.503 1
    20D2HS240−20960.721 80.712 40.720 30.710 8
    21D2HS340−40−201120.793 60.782 30.792 50.781 1
    22D2HS440−40−40−201310.790 40.780 70.789 20.779 5
    23D-H240−20920.626 30.617 20.622 20.612 9
    24D-S240−203500.900 90.896 60.899 80.895 4
    25D-H-S240−202910.910 90.907 20.909 40.905 6
    26D-H-S340−40−202590.909 90.906 40.908 40.904 9
    27D-H-S440−40−40−201780.895 50.892 60.893 70.890 8
    28D2HS-D-H-S240−203750.909 30.904 90.907 30.902 8
    29D2HS-D-H-S340−40−202620.908 30.903 60.906 20.901 4
    30D2HS-D-H-S440−40−40−201380.899 80.895 40.897 50.893 1
    注:AGB代表地上生物量(t/hm2),Total B代表总生物量(t/hm2)。下同。Notes: AGB stands for aboveground biomass (t/ha) and Total B stands for total biomass (t/ha). The same below.
    下载: 导出CSV

    表  7  未加入立地因子的人工神经网络模型精度检验(基于测试集,n = 184)

    Table  7.   Accuracy test statistics based on artificial neural network models without site factors (based on test set, n = 184)

    编号 No.RMSE/(t·hm− 2)
    RMSE/(t·ha− 1)
    RMSEr/%MAE/(t·hm− 2)
    MAE/(t·ha− 1)
    AGBTotal BAGBTotal BAGBTotal B
    1924.874 530.791 015.458 815.735 59.559 111.827 7
    2019.006 923.491 811.812 312.004 16.946 6 8.630 2
    2114.785 218.412 3 9.832 6 9.870 25.236 9 6.507 1
    2216.501 120.514 310.255 010.482 75.998 0 7.459 6
    2322.029 727.102 013.690 813.848 98.709 110.745 9
    2411.345 514.087 4 7.050 9 7.198 53.999 8 5.012 9
    2510.758 913.345 2 6.686 4 6.819 33.692 8 4.736 1
    2610.815 713.400 0 6.721 6 6.847 33.719 4 4.710 5
    2711.650 414.353 8 7.240 4 7.334 73.746 1 4.744 5
    2810.851 413.508 8 6.743 8 6.902 93.668 1 4.687 1
    2910.912 613.601 0 6.781 9 6.950 03.855 4 4.887 5
    3011.409 914.166 4 7.091 0 7.238 94.286 3 5.376 1
    下载: 导出CSV

    表  8  加入立地因子的人工神经网络模型结果与拟合优度检验(基于测试集,n = 184)

    Table  8.   Results and goodness of fit statistics based on artificial neural network models with site factors (based on test set, n = 184)

    编号
    No.
    输入单元
    Input unit
    隐藏层数
    Number of hidden layer
    隐单元数
    Number of hidden units
    训练轮数
    Epoch
    R2Adj.R2
    AGBTotal BAGBTotal B
    31D-H-S-HB-PD-PX-PW240−201130.905 90.901 40.893 00.887 8
    32D-H-S-HB-PD-PX-PW340−40−201600.898 40.895 10.884 50.880 7
    33D-H-S-HB-PD-PX-PW440−40−40−201280.881 50.880 30.865 20.863 9
    34D-H-S-HB-PX-PW240−201260.910 90.906 60.909 40.905 1
    35D-H-S-HB-PX-PW340−40−201790.898 30.895 60.885 10.882 0
    36D-H-S-HB-PX-PW440−40−40−201360.907 10.903 20.894 90.890 6
    37D-H-S-PX-PW240−201080.908 00.904 40.896 70.892 6
    38D-H-S-PX-PW340−40−20650.901 70.897 30.889 60.884 6
    39D-H-S-PX-PW440−40−40−201260.900 70.897 90.888 40.885 3
    注:HB代表海拔(m),PD代表坡度(°),PX代表坡向,PW代表坡位。Notes: HB stands for altitude, PD stands for slope (°), PX stands for slope aspect, and PW stands for slope position.
    下载: 导出CSV

    表  9  加入立地因子的人工神经网络模型精度检验(基于测试集,n = 184)

    Table  9.   Accuracy test statistics based on artificial neural network models with site factors (based on test set, n = 184)

    编号 No.RMSE/(t·hm− 2)
    RMSE/(t·ha− 1)
    RMSEr/%MAE/(t·hm− 2)
    MAE/(t·ha− 1)
    AGBTotal BAGBTotal BAGBTotal B
    3111.053 313.758 06.870 67.030 23.760 54.818 1
    3211.484 914.185 07.137 67.248 43.883 24.943 2
    3312.406 315.153 97.710 27.743 54.216 15.212 7
    3410.758 013.385 16.685 86.839 73.611 94.662 4
    3511.491 614.152 07.141 77.231 53.731 34.704 2
    3610.987 313.625 36.828 36.962 43.903 24.921 7
    3710.929 913.541 26.792 66.919 43.707 04.742 8
    3811.298 614.039 97.021 87.174 33.756 44.809 0
    3911.358 613.998 27.059 17.152 93.846 94.933 7
    注:AGB代表地上生物量(t/hm2),Total B代表总生物量(t/hm2)。Notes: AGB stands for aboveground biomass (t/ha) and Total B stands for total biomass (t/ha).
    下载: 导出CSV

    表  10  各组最优模型的比较(n = 917)

    Table  10.   Comparison of the 4 best models for each group (n = 917)

    模型 Model地上生物量 Aboveground biomass总生物量 Total biomass
    R2Adj.R2RMSE/(t·hm− 2)
    RMSE/(t·ha− 1)
    RMSEr/%MAE/(t·hm− 2)
    MAE/(t·ha− 1)
    R2Adj.R2RMSE/(t·hm− 2)
    RMSE/(t·ha− 1)
    RMSEr/%MAE/(t·hm− 2)
    MAE/(t·ha− 1)
    50.902 40.902 110.427 76.330 56.850 3
    140.898 20.897 913.060 86.490 18.778 7
    250.906 40.906 110.426 06.329 56.985 10.900 40.900 013.099 06.509 08.990 2
    340.916 10.914 1 9.870 55.992 26.737 70.911 00.908 912.383 76.153 68.625 0
    下载: 导出CSV
  • [1] 罗云建. 森林生物量的估算方法及其研究进展[J]. 林业科学, 2009, 45(8):129−134. doi:  10.3321/j.issn:1001-7488.2009.08.023

    Luo Y J. Forest biomass estimation methods and their prospects[J]. Scientia Silvae Sinicae, 2009, 45(8): 129−134. doi:  10.3321/j.issn:1001-7488.2009.08.023
    [2] 雷相东, 张会儒, 牟惠生. 东北过伐林区蒙古栎林分相容性生物量模型研究[J]. 第四纪研究, 2010, 30(3):559−565. doi:  10.3969/j.issn.1001-7410.2010.03.14

    Lei X D, Zhang H R, Mu H S. Compatible stand biomass models of Mongolia oak forests in over logged forest regions, Northeast China[J]. Quaternary Sciences, 2010, 30(3): 559−565. doi:  10.3969/j.issn.1001-7410.2010.03.14
    [3] 程堂仁, 冯菁, 马钦彦, 等. 基于森林资源清查资料的林分生物量相容性线性模型[J]. 北京林业大学学报, 2007, 29(5):110−113. doi:  10.3321/j.issn:1000-1522.2007.05.022

    Cheng T R, Feng J, Ma Q Y, et al. Linear models with compatibility of stand biomass based on the forest resource inventory data[J]. Journal of Beijing Forestry University, 2007, 29(5): 110−113. doi:  10.3321/j.issn:1000-1522.2007.05.022
    [4] 董利虎, 李凤日. 大兴安岭东部主要林分类型乔木层生物量估算模型[J]. 应用生态学报, 2018, 29(9):2825−2834.

    Dong L H, Li F R. Stand-level biomass estimation models for the tree layer of main forest types in East Daxing ’an Mountains, China.[J]. Chinese Journal of Applied Ecology, 2018, 29(9): 2825−2834.
    [5] 欧光龙, 胥辉, 王俊峰, 等. 思茅松天然林林分生物量混合效应模型构建[J]. 北京林业大学学报, 2015, 37(3):101−110.

    Ou G L, Xu H, Wang J F, et al. Building mixed effect models of stand biomass for Simao pine (Pinus kesiya var. langbianensis) natural forest[J]. Journal of Beijing Forestry University, 2015, 37(3): 101−110.
    [6] 赵嘉诚, 李海奎. 杉木单木和林分水平地下生物量模型的构建[J]. 林业科学, 2018, 54(2):81−89.

    Zhao J C, Li H K. Establishment of below-ground biomass equations for Chinese fir at tree and stand level[J]. Scientia Silvae Sinicae, 2018, 54(2): 81−89.
    [7] Vahedi A A. Artificial neural network application in comparison with modeling allometric equations for predicting above-ground biomass in the Hyrcanian mixed-beech forests of Iran[J]. Biomass and Bioenergy, 2016, 88: 66−76. doi:  10.1016/j.biombioe.2016.03.020
    [8] Sileshi G W. A critical review of forest biomass estimation models, common mistakes and corrective measures[J]. Forest Ecology and Management, 2014, 329: 237−254. doi:  10.1016/j.foreco.2014.06.026
    [9] 董利虎. 东北林区主要树种及林分类型生物量模型研究[D]. 哈尔滨: 东北林业大学, 2015.

    Dong L H. Developing individual and stand-level biomass equations in Northeast China forest area[D]. Harbin: Northeast Forest University, 2015.
    [10] Nandy S, Singh R, Ghosh S, et al. Neural network-based modelling for forest biomass assessment[J]. Carbon Management, 2017, 8(4): 305−317. doi:  10.1080/17583004.2017.1357402
    [11] Stas S M, Rutishauser E, Chave J, et al. Estimating the aboveground biomass in an old secondary forest on limestone in the Moluccas, Indonesia: comparing locally developed versus existing allometric models[J]. Forest ecology and management, 2017, 389: 27−34. doi:  10.1016/j.foreco.2016.12.010
    [12] Ercanlı İ, Günlü A, Şenyurt M, et al. Artificial neural network models predicting the leaf area index: a case study in pure even-aged Crimean pine forests from Turkey[J]. Forest Ecosystems, 2018, 5(1): 29. doi:  10.1186/s40663-018-0149-8
    [13] Özçelik R, Diamantopoulou M J, Eker M, et al. Artificial neural network models: an alternative approach for reliable aboveground Pine tree biomass prediction[J]. Forest Science, 2017, 63(3): 291−302.
    [14] 王轶夫, 孙玉军, 郭孝玉. 基于BP神经网络的马尾松立木生物量模型研究[J]. 北京林业大学学报, 2013, 35(2):17−21.

    Wang Y F, Sun Y J, Guo X Y. Single-tree biomass modeling of Pinus massoniana based on BP neural network[J]. Journal of Beijing Forestry University, 2013, 35(2): 17−21.
    [15] 解雅麟, 王海燕, 雷相东. 基于3-PG模型的长白落叶松人工林生长和生物量模拟[J]. 南京林业大学学报(自然科学版), 2018, 42(1):141−148.

    Xie Y L, Wang H Y, Lei X D. Growth and biomass simulation of Larix olgensis plantations based on 3-PG model[J]. Journal of Nanjing Forestry University(Natural Science Edition), 2018, 42(1): 141−148.
    [16] 国家林业与草原局. 立木生物量模型及碳计量参数落叶松[S]. 北京: 中国标准出版社, 2016.

    National Forestry and Grassland Administration of the People ’s Republic of China. Tree biomass models and related parameters to carbon accounting for Larix[S]. Beijing: Standards Press of China, 2016.
    [17] Goodfellow I, Bengio Y, Courville A, et al. Deep learning[M]. Cambridge: MIT Press, 2016.
    [18] Uzun H, Yıldız Z, Goldfarb J L, et al. Improved prediction of higher heating value of biomass using an artificial neural network model based on proximate analysis[J]. Bioresource Technology, 2017, 234: 122−130. doi:  10.1016/j.biortech.2017.03.015
    [19] Tieleman T, Hinton G. Lecture 6.5-rmsprop: divide the gradient by a running average of its recent magnitude[J]. COURSERA: Neural Networks for Machine Learning, 2012, 4(2): 26−31.
    [20] Xiao X, White E P, Hooten M B, et al. On the use of log-transformation vs. nonlinear regression for analyzing biological power laws[J]. Ecology, 2011, 92(10): 1887−1894. doi:  10.1890/11-0538.1
    [21] 符利勇, 雷渊才, 孙伟, 等. 不同林分起源的相容性生物量模型构建[J]. 生态学报, 2014, 34(6):1464−1470.

    Fu L Y, Lei Y C, Sun W, el al. Development of compatible biomass models for trees from different stand origin[J]. Acta Ecologica Sinica, 2014, 34(6): 1464−1470.
    [22] Özçelik R, Diamantopoulou M J, Brooks J R, et al. Estimating tree bole volume using artificial neural network models for four species in Turkey[J]. Journal of Environmental Management, 2010, 91(3): 742−753.
  • [1] 牛亦龙, 董利虎, 李凤日.  基于广义代数差分法的长白落叶松人工林地位指数模型 . 北京林业大学学报, 2020, 42(2): 9-18. doi: 10.12171/j.1000-1522.20190036
    [2] 贺梦莹, 董利虎, 李凤日.  长白落叶松−水曲柳混交林冠幅预测模型 . 北京林业大学学报, 2020, 42(7): 23-32. doi: 10.12171/j.1000-1522.20190250
    [3] 白东雪, 刘强, 董利虎, 李凤日.  长白落叶松人工林有效冠高的确定及其影响因子 . 北京林业大学学报, 2019, 41(5): 76-87. doi: 10.13332/j.1000-1522.20190016
    [4] 沈剑波, 雷相东, 雷渊才, 李玉堂.  长白落叶松人工林地位指数及立地形的比较研究 . 北京林业大学学报, 2018, 40(6): 1-8. doi: 10.13332/j.1000-1522.20170400
    [5] 罗梅, 陈绍志.  不同龄组长白落叶松种内及种间竞争研究 . 北京林业大学学报, 2018, 40(9): 33-44. doi: 10.13332/j.1000-1522.20180126
    [6] 王烁, 董利虎, 李凤日.  人工长白落叶松枝条存活模型 . 北京林业大学学报, 2018, 40(1): 57-66. doi: 10.13332/j.1000-1522.20170203
    [7] 宋金凤, 李金博, 曹楷, 桑英, 崔晓阳.  草酸和柠檬酸提高长白落叶松对Pb胁迫的适应性 . 北京林业大学学报, 2017, 39(11): 18-27. doi: 10.13332/j.1000-1522.20170146
    [8] 姜礅, 孟昭军, 严善春.  用茉莉酸甲酯局部喷施长白落叶松苗对落叶松毛虫体内防御酶的影响 . 北京林业大学学报, 2017, 39(2): 58-63. doi: 10.13332/j.1000-1522.20160291
    [9] 姜礅, 王杰, 姜虹, 张文一, 孟昭军, 严善春.  茉莉酸甲酯局部诱导长白落叶松对舞毒蛾生长发育的影响 . 北京林业大学学报, 2016, 38(6): 67-71. doi: 10.13332/j.1000-1522.20150493
    [10] 孙志虎, 王秀琴, 陈祥伟.  不同抚育间伐强度对落叶松人工林生态系统碳储量影响 . 北京林业大学学报, 2016, 38(12): 1-13. doi: 10.13332/j.1000-1522.20160016
    [11] 张素芳, 张磊, 赵佳丽, 张莉, 张含国.  长白落叶松小RNA测序和其靶基因预测 . 北京林业大学学报, 2016, 38(12): 64-72. doi: 10.13332/j.1000-1522.20150404
    [12] 姚丹丹, 雷相东, 张则路.  基于贝叶斯法的长白落叶松林分优势高生长模型研究 . 北京林业大学学报, 2015, 37(3): 94-100. doi: 10.13332/j.1000-1522.20140221
    [13] 欧光龙, 胥辉, 王俊峰, 肖义发, 陈科屹, 郑海妹.  思茅松天然林林分生物量混合效应模型构建 . 北京林业大学学报, 2015, 37(3): 101-110. doi: 10.13332/j.1000-1522.20140316
    [14] 许晨璐, 孙晓梅, 张守攻.  日本落叶松与长白落叶松及其杂种光合特性比较 . 北京林业大学学报, 2012, 34(4): 62-66.
    [15]
    孙志虎, 毕永娟, 牟长城, 蔡体久
    基于FORECAST模型的长白落叶松人工林经营措施对长期生产力的影响 . 北京林业大学学报, 2012, 34(6): 1-6.
    [16] 康瑶瑶, 刘勇, 马履一, 李国雷, 祝燕, 马跃.  施肥对长白落叶松苗木养分库氮磷吸收及利用的影响 . 北京林业大学学报, 2011, 33(2): 31-36.
    [17] 孙慧彦, 刘勇, 马履一, 贾忠奎, 康瑶瑶, 金虎范, 祝燕, 侯炳柱, 尹凤君.  长白落叶松苗木质量与造林效果关系的比较 . 北京林业大学学报, 2009, 31(6): 176-180.
    [18] 孙志虎, 牟长城, 张彦东.  用地统计学方法估算长白落叶松人工林凋落物现存量 . 北京林业大学学报, 2008, 30(4): 59-64.
    [19] 贺窑青, 欧阳杰, 孙青, 曲红, 雷庆哲, 李莉, 李艳华, 熊丹, 胡海英, 王丰俊, 乔海莉, 张玲, 姚娜, 石娟, 刘美芹, 孙月琴, 李在留, 隋金玲, 周章义, 程堂仁, 郝晨, 金莹, 范丙友, 王莉, 陈佳, 段旭良, 胡晓丹, 刘丽, 孙爱东, 冯菁, 沈昕, 郑彩霞, 阎伟, 尹伟伦, 冯秀兰, 周燕, 张艳霞, 续九如, 康向阳, 陆海, 王建中, 赵亚美, 李凤兰, 武彦文, 路端正, 张香, 骆有庆, 尹伟伦, 陈发菊, 李云, 陈晓阳, 张志毅, 骆有庆, 田呈明, 郭锐, 张德权, 吴晓成, 孙爱东, 马钦彦, 安新民, 史玲玲, 沈繁宜, 阎晓磊, 武海卫, 蒋湘宁, 胡晓丹, 胡德夫, 赵蕾, 李忠秋, 王晓东, 骆有庆, 高述民, 梁华军, 卢存福, 王百田, 王华芳, 姜金仲, 郑永唐, 梁宏伟, 郝俊, 骆有庆, 严晓素, 王瑛, 郭晓萍, 王冬梅, 骈瑞琪, 刘玉军, 王建中, 王晓楠, 冯仲科, 冯晓峰, 赵兵, 王华芳, 高荣孚, 张志翔, 崔彬彬
    , 尹伟伦, 温秀凤3, 王玉兵, 吴坚, 谢磊, 于京民2, 李凯, 邹坤, 刘玉军, 张庆, 张兴杰, 丁霞, 陈卫平, 林善枝, 呼晓姝, 陶凤杰, 王民中, 杨伟光, 沈应柏, 孙建华, 李镇宇, 刘艳, 王玉春, 李凤兰, 付瑞海, 汪植, 马建海, 赵新丽, 蒋平.  基于森林资源清查资料的林分生物量相容性线性模型 . 北京林业大学学报, 2007, 29(5): 110-113.
    [20] 崔彬彬, 李贤军, 宗世祥, 赵俊卉, 肖化顺, 陈伟, 刘志军, 王志玲, 曹伟, 黄心渊, 张煜星, 周国模, 李国平, 江泽慧, 雷相东, 刘智, 施婷婷, 张展羽, 于寒颖, 周志强, 杜官本, 徐剑琦, 程金新, 雷霆, 程丽莉, 曹金珍, 关德新, 刘童燕, 张贵, 苏里坦, 吴家森, 骆有庆, 王正, 丁立建, 王正, 张则路, 张彩虹, 王海, 杨谦, 张璧光, 苏淑钗, 李云, 张璧光, 郭广猛, 郝雨, 黄群策, 雷洪, 李云, 张国华, 刘彤, 金晓洁], 吴家兵, 黄晓丽, 贺宏奎, 王勇, 张书香, 张慧东, 常亮, 秦岭, 方群, 秦广雍, 张佳蕊, 许志春, 张大红, 陈晓光, 宋南, 刘大鹏, 姜培坤, 李文军, 周晓燕, 李延军, 高黎, 刘海龙, 蔡学理, 陈燕, 姜静, 姜金仲, 张弥, 冯慧, 苏晓华, 于兴华, 张金桐, 刘建立, 王安志, 张冰玉, 尹伟伦, 陈绪和, 周梅, 王谦, 朱彩霞, 成小芳, 王德国, 陈建伟3, 聂立水, 亢新刚, 张连生, 张勤, 冯大领, 金昌杰, 梁树军, 崔国发, 韩士杰, 胡君艳, 姚国龙.  长白落叶松等几个树种冠幅预测模型的研究 . 北京林业大学学报, 2006, 28(6): 75-79.
  • 加载中
图(7) / 表 (10)
计量
  • 文章访问数:  3249
  • HTML全文浏览量:  419
  • PDF下载量:  68
  • 被引次数: 0
出版历程
  • 收稿日期:  2019-01-15
  • 修回日期:  2019-03-13
  • 网络出版日期:  2019-04-30
  • 刊出日期:  2019-05-01

基于多层感知机的长白落叶松人工林林分生物量模型

doi: 10.13332/j.1000-1522.20190035
    基金项目:  林业行业公益性科研项目“我国主要林区林地立地质量和生产力评价研究”(201504303)
    作者简介:

    徐奇刚,博士生。主要研究方向:森林生长收获模型。Email:adslxqg@126.com 地址:100091 北京市海淀区香山路东小府1号中国林业科学研究院资源信息研究所

    通讯作者: 雷相东,研究员,博士生导师。主要研究方向:森林生长模型与模拟。Email:xdlei@caf.ac.cn 地址:同上

摘要: 目的神经网络模型能避免林分生物量模型建模时自变量共线性与异方差问题,研究多层感知机在林分生物量模型中的应用,为森林经营单位、区域生物量和碳储量的估算提供方法和依据。方法以长白落叶松人工林为研究对象,利用吉林省一类清查固定样地的917组数据,分别建立了基于传统的对数转化后线性模型和神经网络多层感知机的地上生物量和总生物量模型。使用AIC、决定系数(R2)、均方根误差(RMSE)、相对均方根误差(RMSEr)和平均绝对误差(MAE)来评价模型。结果估计精度最高的模型是输入单元为林分平均胸径(D)−平均高(H)−林分密度指数(S)−海拔(HB)−坡向(PX)−坡位(PW)、2个隐藏层、隐单元数为40−20的神经网络模型,与传统对数转换线性回归模型相比,地上生物量和总生物量模型的调整决定系数(Adj.R2)分别从0.902 1提高到了0.914 1,从0.897 9提高到了0.908 9;RMSEr分别从6.330 5%降低到了5.992 2%,从6.490 1%降低到了6.153 6%。包含立地因子的神经网络模型比未包含立地因子的神经网络模型估计精度略有提升,地上生物量与总生物量的Adj.R2分别提高了0.88%和0.99%,RMSEr分别降低了5.33%和5.46%。结论多层感知机生物量模型的估计精度比传统回归模型略有提高,但它可以避免模型选型和违背传统统计假设的处理等问题,且能够一次性计算地上生物量和总生物量模型,有一定优势。

English Abstract

徐奇刚, 雷相东, 国红, 李海奎, 李玉堂. 基于多层感知机的长白落叶松人工林林分生物量模型[J]. 北京林业大学学报, 2019, 41(5): 97-107. doi: 10.13332/j.1000-1522.20190035
引用本文: 徐奇刚, 雷相东, 国红, 李海奎, 李玉堂. 基于多层感知机的长白落叶松人工林林分生物量模型[J]. 北京林业大学学报, 2019, 41(5): 97-107. doi: 10.13332/j.1000-1522.20190035
Xu Qigang, Lei Xiangdong, Guo Hong, Li Haikui, Li Yutang. Stand biomass model of Larix olgensis plantations based on multi-layer perceptron networks[J]. Journal of Beijing Forestry University, 2019, 41(5): 97-107. doi: 10.13332/j.1000-1522.20190035
Citation: Xu Qigang, Lei Xiangdong, Guo Hong, Li Haikui, Li Yutang. Stand biomass model of Larix olgensis plantations based on multi-layer perceptron networks[J]. Journal of Beijing Forestry University, 2019, 41(5): 97-107. doi: 10.13332/j.1000-1522.20190035
  • 森林生态系统作为陆地生态系统的主体,在维持物种多样性、水土保持和固碳释氧方面作用巨大[1]。大尺度森林生物量与碳储量的计量是各国履行联合国气候变化框架等国际公约的基础[2]。建立林分生物量与林分调查因子的关系模型,通过林分调查因子来估计林分生物量是最常用的方法之一[26]。这种方法利用单木生物量模型得到每株树木的生物量,进而得到林分生物量,主要通过异速生长方程建立林分生物量与林分蓄积量、林分平均高、林分平均胸径、林分密度等的关系模型。国内外针对单木生物量建立了大量的模型,但对于林分层面的生物量模型研究较少[7]。由于生物量数据的特点,采用幂函数异速方程形式的模型往往存在异方差与共线性的问题[8]。对于异方差,通用的做法是使用非线性加权回归或者对数转换后线性回归的方法来消除,但基于这两种回归方法的模型误差结构不同,在建模前需要对误差结构进行分析以选择合适的模型形式,如董利虎[9]指出长白山林区的落叶松人工林其林分生物量模型的误差结构是相乘型的,应选用对数转换后线性回归方法建模。Sileshi[8]指出异速模型受到了共线性问题的限制。

    与传统的参数回归模型相比,人工神经网络模型作为一种高效的非线性函数近似器,具有对输入变量无分布要求,预测效果好的优点[10],近年来,在林业领域内正受到越来越广泛的关注[1012]。但在生物量模型方面应用还不多见。Zelik以土耳其西地中海地区布鲁氏松(Pinus brutia)为对象,使用非线性似乎不相关回归和Levenberg-Marquardt人工神经网络(LMANN)建立了立木生物量模型。结果显示,LMANN模型比非线性似乎不相关回归模型预测的精度更高[13]。王轶夫等[14]使用12种不同优化算法的单隐层BP神经网络建立了马尾松立木生物量模型,发现人工神经网络的模型精度高于传统的相对生长模型。但基于人工神经网络的林分生物量模型在国内还未见报道。

    本文以吉林省长白落叶松人工林为对象,使用传统对数转化后线性回归方法和多层感知机建立基于林分变量的地上生物量和总生物量模型,比较两种方法的预测结果,为长白落叶松人工林生物量估计提供新的方法和依据。

    • 选取的长白落叶松人工林样地位于吉林省(115°25′ ~ 135°09′E,38°72′ ~ 53°55′N),分布在和龙、舒兰、通化、汪清、长春林区,为长白山山脉的中低丘陵区,海拔多在1 000 m以下,属温带大陆性季风气候,土壤类型主要是暗棕壤和棕壤。研究区内除长白落叶松(Larix olgensis)外,还包括鱼鳞云杉(Picea jezoensis)、臭冷杉(Abies nephrolepis)、红松(Pinus koraiensis)、色木(Acer mono)、水曲柳(Fraxinus mandshurica)、紫椴(Tilia amurensis)、风桦(Betula costata)和黄檗(Phellodendron amurense)、白桦(Betula platyphylla)、春榆(Ulmus propinqua)等树种。

    • 数据来源于吉林省第5 ~ 9次一类连续清查(即1994—2014年)中的长白落叶松人工纯林固定样地。根据吉林省一类调查规程,将长白落叶松蓄积组成占65%以上的林分称为长白落叶松纯林。总计1 130组观测数据,剔除缺失值后,共有917组观测数据。样地面积均为0.06 hm2。样地调查因子包括:海拔(HB)、坡向(PX)、坡度(PD)、坡位(PW)、郁闭度、年龄及每株树木的胸径等。基于每木检尺数据,得到样地的断面积、平均胸径(D)、公顷株数和平均树高(H)等基本因子。其中H是在主林层优势树种中选择3 ~ 5株平均样木,测其树高并计算平均值所得。样地因子统计量见表1。样地数据林分年龄在5 ~ 57年之间,蓄积量在12.92 ~ 284.31 m3/hm2之间,立地条件也有较大差异,HB和PD的变异系数分别为39.88%和68.93%,数据覆盖广且有代表性。

      表 1  样地基本因子与生物量统计量

      Table 1.  Summary statistics of sample plot basic variables and biomass

      林分因子   
      Stand factor   
      最大值
      Max.
      最小值
      Min.
      平均值
      Mean
      标准差
      Standard deviation
      变异系数
      Coefficient of variation/%
      年龄/a Age/year57 5 27 11 40.10
      郁闭度 Crown density 1.00 0.20 0.67 0.2030.09
      株数密度/(株·hm− 2) Stand density/(tree·ha− 1)4 033 267 1 257 675 53.64
      林分断面积/(m2·hm− 2) Stand basal area/(m2·ha− 1) 34.63 3.2513.46 6.6749.55
      蓄积量/(m3·hm− 2) Stand volume/(m3·ha− 1)284.3112.9286.2051.1659.35
      平均胸径 Quadratic mean diameter (D)/cm27.75.812.2 3.629.38
      平均树高 Mean tree height (H)/m23.08.415.9 2.717.16
      海拔 Altitude (HB)/m1 190 10 525 209 39.88
      坡度 Slope (PD)/(°)36 0 11 7 68.93
      地上生物量/(t·hm− 2) Aboveground biomass/(t·ha− 1)174.62 9.9060.0033.4055.67
      总生物量/(t·hm− 2) Total biomass/(t·ha− 1)213.2712.0373.6340.9655.63
    • 目前,采用已经建立好的单木生物量异速方程来计算林分生物量是一种通用的方法[15]。本研究通过已经建立的各树种的一元(胸径)立木生物量模型计算样地中每木的生物量[16],各组分包括树干、树枝、树叶、根和全部生物量,每木累加后得到样地的地上生物量和全部生物量,并转化为林分单位面积生物量。即:

      $${B_i} = \sum\limits_{j = 1}^n {{b_{ij}}} /A$$ (1)

      式中:${B_i}$为林分的地上和全部生物量(t/hm2),${b_{ij}}$表示第i块样地中第j个样木的地上生物量和全部生物量,n为样地株数,A为样地面积,本研究中为0.06 hm2

    • 生物量模型主要有3种形式:(1)具有可加性误差的线性模型;(2)对数转换后的可加性误差的线性模型;(3)具有可加性误差的非线性模型。根据董利虎[9]对落叶松生物量模型的误差结构分析结果,落叶松人工林的模型误差结构是相乘型的,本研究采用对数转换后的可加性误差线性模型的形式构建林分生物量模型(式2)。

      $$B = {\beta _0}X_1^{{\beta _1}}X_2^{{\beta _2}} \cdots X_i^{{\beta _i}}\varepsilon $$ (2)

      式中:B为林分生物量;Xi为林分调查因子,包括林分密度指数、平均胸径、平均高等;βi为待估参数。

      本文以林分地上生物量和全部生物量为因变量。在对数转化线性模型中,以常见的林分调查因子平均胸径(D)、平均树高(H)、平均年龄和林分密度指数(S)作为自变量,并尝试一元和多元模型。最终的自变量形式和选择以生物量和各个林分因子的散点图以及回归分析后的结果来确定(图1)。由于将年龄作为自变量加入模型时,其与地上生物量和总生物量的关系几乎都不显著,因此本研究并未选择年龄作为自变量。

      图  1  各个林分变量与地上生物量和总生物量的散点图

      Figure 1.  Scatter plots of stand variables and aboveground and total biomass

    • 多层感知机(MLP),又称深度前馈网络,是一种典型的深度学习模型。由输入层、一个以上的隐藏层和输出层组成,层与层的单元全连接,将上一层的输出作为下一层的输入,通过激活函数的转化后继续作为下一层的输出,逐层向后运算直至运算到输出层。使用梯度下降来最小化函数近似误差,由于其强大的函数逼近能力,对输入变量无统计上的分布要求,预测精度高,是现阶段应用最广的人工神经网络类型[7,17]

      本研究基于R3.5.1中的keras包建立多层感知机模型来估计长白落叶松人工林地上和总生物量,输入层为林分调查因子,输出层为地上生物量和总生物量。代价函数采用均方误差,输出单元采用线性单元。在隐单元激活函数的选择上,由于sigmoid函数具有广泛的饱和性使得基于梯度的学习变的困难,而整流线性单元Relu的行为更接近线性,模型更容易优化,在大多数情况下表现良好[17],所以本研究采用整流线性单元。

      对于隐藏层与隐单元数量的最优网络架构设计问题,采用反复试错法‘trial and error’,观测模型在测试集上的误差得到[18]。优化方法采用RMSProp算法[19]。为防止模型过拟合,采用提前终止策略,并随机将数据集分成训练集、验证集和测试集,分别占总样本量的60%、20%、20%,即分别为549、184、184组数据。

      为了检验立地因子对生物量的影响,除林分DHS外,本研究也将立地因子(HB、PD、PX、PW)作为输入变量。为提高模型拟合效果和逼近速度,在模型训练前对离散型因子变量(PW、PX)进行one_hot编码处理,即将一个N级的因子变量扩充成N列属性,每个样本观测值的这N列属性中,只有一个为1,表示该样本属于该类别,其余扩展的属性都为0。对连续型自变量数据进行归一化处理(式3)。

      $${X_n} = \frac{{{x_i} - \overline X }}{{\sigma (X)}}$$ (3)

      式中:${x_i}$代表各个自变量的样本观测值,$\overline X$代表各个自变量的样本均值,$\sigma \left( X \right)$代表自变量的样本标准差。

    • 传统的回归模型评价基于全部的917组观测数据,神经网络模型在选择最优结构时的评价基于测试集184组观测数据,与传统的回归模型进行比较时基于全部917组观测数据。

      模型评价主要从模型精度和拟合优度两方面考虑。精度检验指标主要有均方根误差(RMSE)、相对均方根误差(RMSEr)和平均绝对误差(MAE);拟合优度的指标有决定系数(R2),调整决定系数(Adj.R2),另外,对于对数转化后的线性回归模型,首先考虑估计参数的显著性检验,并用对数转化AIC进行评价[20]。公式如下:

      (1)精度检验指标:

      $${\rm{RMSE}} = \sqrt {\frac{{\displaystyle \sum\limits_i^n {{{\left( {{{\hat y}_i} - {y_i}} \right)}^2}} }}{n}} $$ (4)
      $${\rm{RMSE}}_{\rm{r}} = \frac{{{\rm{RMSE}}}}{{{y_{\max }} - {y_{\min }}}} \times 100{\text{%}}$$ (5)
      $${\rm{MAE}} = \frac{1}{n}\sum\limits_{i = 1}^n {\left| {{y_i} - {{\hat y}_i}} \right|} $$ (6)

      式中:yi为林分生物量观测值;${\hat y_i}$为基于林分变量的模型预估值;n为样本量;ymax为林分生物量观测值的最大值,ymin为林分生物量观测值的最小值。

      (2)拟合优度指标:

      $${R^2}{{ = }}1 - \frac{{\displaystyle \sum\limits_i^n {{{({y_i} - {{\hat y}_i})}^2}} }}{{\displaystyle \sum\limits_i^n {{{({y_i} - {{\bar y}_i})}^2}} }}$$ (7)
      $${\rm{Adj}}.{R^2} = 1 - (1 - {R^2})\frac{{n - 1}}{{n - p - 1}}$$ (8)

      对数转化AIC:

      $${\rm{AIC}} = 2p - 2\log (L)$$ (9)
      $$L = \prod\limits_{i = 1}^n {\left[ {\frac{1}{{{y_i}\sqrt {2\pi {\sigma ^2}_{\rm{LR}}} }}\exp \left( {\frac{{ - {{(\log ({y_i}) - \log ({{\hat y}_i}))}^2}}}{{2{\sigma ^2}_{\rm{LR}}}}} \right)} \right]} $$ (10)

      式中:yi为林分生物量观测值;${\hat y_i}$为基于林分变量的模型预估值;${\bar y_i}$为林分生物量的均值;n为样本量;p为模型自变量个数;L为似然函数值;$\sigma _{\rm{LR}}^2$为对数转换后线性模型残差的方差。

    • 根据林分生物量与林分因子的散点图(图1),共尝试了包含林分平均胸径(D)、平均树高(H)、林分密度指数(S)及其组合项的18个模型。由表2345可以看出,除模型3的b1未在0.05水平上通过t检验,其余模型参数均通过显著性检验,说明对数转化后,林分因子与地上生物量以及总生物量之间存在显著线性关系。

      表 2  地上生物量对数转换线性回归模型参数估计值

      Table 2.  Estimated parameters of aboveground biomass based on log-linear regression model

      编号 No.异速方程 Allometric equationb0b1b2b3
      1lnY = b0 + b1lnD 0.319 8**1.463 8***
      2lnY = b0 + b1ln(D2 × H− 0.676 8***0.599 2***
      3lnY = b0 + b1lnD + b2lnH− 3.188 2***0.148 2ns 2.450 3***
      4lnY =b0 + b1ln(D2 × H × S− 2.989 5***0.502 7***
      5lnY = b0 + b1lnD + b2lnH + b3lnS− 3.865 1***0.404 9***0.750 0***0.778 1***
      6lnY = b0 + b1ln(D2 × S− 2.554 1***0.589 0***
      7lnY = b0 + b1lnD + b2lnS− 2.993 9***0.764 8***0.828 7***
      8lnY =b0 + b1ln(D2 × H) + b2lnS− 3.372 0***0.314 4***0.803 6***
      9lnY =b0 +b1ln(D2 × S) + b3lnH− 2.307 6***0.628 8***− 0.248 5**
      注:D为平均胸径;H为平均树高;S为林分密度指数; b0b1b2b3为模型参数;ns代表参数在0.05水平上不显著;**代表在0.01水平上显著;***代表在0.001水平上显著。下同。Y为地上生物量;Notes: D represents quadratic mean diameter; H represents mean tree height; S represents stand density index; b0, b1, b2, b3 are parameters of models; ns represents no significant difference at 0.05 level; ** represents significant difference at 0.01 level; *** represents significant difference at 0.001 level. The same below. Y represents aboveground biomass.

      表 3  地上生物量对数线性回归模型拟合优度与精度检验

      Table 3.  Fitting statistics of aboveground biomass based on log-linear regression model

      编号
      No.
      AIC决定系数
      R2
      调整决定系数
      Adj.R2
      均方根误差/(t·hm− 2)
      RMSE/(t·ha− 1)
      相对均方根误差
      RMSEr/%
      平均绝对误差/(t·hm− 2)
      MAE/(t·ha− 1)
      18 303.537 90.448 60.448 024.790 415.049 9 19.134 8
      28 219.147 20.500 90.500 423.584 114.317 6 18.190 9
      38 091.547 90.572 60.571 621.825 613.250 0 16.851 1
      47 301.056 00.826 20.826 013.918 38.449 610.278 4
      56 888.135 90.902 40.902 110.427 76.330 56.850 3
      67 240.699 10.835 90.835 713.525 08.210 89.940 4
      76 955.132 70.894 20.894 010.859 06.592 37.358 0
      86 910.318 90.900 30.900 110.542 26.400 07.005 9
      97 235.057 20.836 70.836 413.489 48.189 29.888 6

      表 4  总生物量对数转换线性回归模型参数估计值

      Table 4.  Estimated parameters of total biomass based on log-linear regression model

      编号 No.异速方程 Allometric equationb0b1b2b3
      10lnY = b0 + b1lnD 0.534 8***1.459 6***
      11lnY = b0 + b1ln(D2 × H− 0.460 4** 0.597 7**
      12lnY = b0 + b1lnD + b2lnH− 2.986 0***0.139 2ns 2.459 3***
      13lnY = b0 + b1ln(D2 × H × S− 2.770 5***0.501 7***
      14lnY = b0 + b1lnD + b2lnH + b4lnS− 3.661 8***0.395 4***0.762 0***0.776 7***
      15lnY = b0 + b1ln(D2 × S− 2.335 5***0.587 7***
      16lnY = b0 + b1lnD + b2lnS− 2.776 5***0.761 1***0.828 2***
      17lnY = b0 + b1ln(D2 × H) + b2lnS− 3.153 5***0.313 1***0.803 0***
      18lnY = b0 + b1ln(D2 × S) + b3lnH− 2.095 2***0.626 5***− 0.242 3**
      注:Y为总生物量。Note: Y represents total biomass.

      表 5  总生物量对数转换线性回归拟合优度与精度检验

      Table 5.  Fitting statistics of total biomass based on log-linear regression model

      编号 No.AICR2Adj.R2RMSE/(t·hm− 2)
      RMSE/(t·ha− 1)
      RMSEr/%MAE/(t·hm− 2)
      MAE/(t·ha− 1)
      108 684.928 00.444 50.443 930.510 515.161 023.547 6
      118 600.925 10.497 00.496 429.033 914.427 322.397 4
      128 472.676 50.569 70.568 726.853 213.343 720.732 3
      137 696.929 90.821 50.821 417.292 88.593 012.781 9
      147 292.576 70.898 20.897 913.060 86.490 18.778 7
      157 638.875 60.831 10.830 916.825 88.360 912.362 3
      167 359.598 60.889 70.889 513.594 16.755 09.369 3
      177 315.456 50.895 90.895 713.207 46.562 98.973 9
      187 633.789 10.831 90.831 516.785 28.340 812.309 4

      模型1与模型10的结果显示,只用D作为自变量的地上生物量与总生物量模型的预测能力均不到50%,R2分别为0.448 6和0.444 5,说明在对数转化后,D只能解释地上生物量与总生物量的少部分变异。在加入H后(模型2、3、11、12),R2分别增长为0.500 9、0.572 6、0.497 0和0.569 7;在加入了S后,模型的预测能力有了显著的增长,表现最好的分别为模型5和模型14,R2分别为0.902 4和0.898 2。

      AIC、Adj.R2、RMSE、RMSEr和MAE结果也显示,模型5和模型14分别为林分地上生物量和总生物量的最优模型,方程形式为:lnY = b0 + b1lnD + b2lnH + b3lnS。残差分布如图2所示,未表现出明显的异质性。

      图  2  对数转换线性回归模型残差图(n = 917)

      Figure 2.  Residual plot of predictions and observations based on the logarithmic transformation linear regression model (n = 917)

    • 基于测试集184组观测数据,计算各个模型的R2、Adj.R2、RMSE、RMSEr以及MAE,选择表现最优的神经网络模型。

      分别引入了1个输入节点(D2HD2HS)、2个输入节点(D-HD-S)、3个输入节点(D-H-S)和4个输入节点(D2HS-D-H-S)、不同隐藏层数以及隐藏单元数的人工神经网络模型来观察模型在测试集上的预测表现。研究结果如表67所示。其中,输入层有3个节点以上并包含DS的神经网络模型,即模型25 ~ 30的地上生物量预测的Adj.R2均在0.893 7以上,总生物量的Adj.R2均在0.890 8以上。

      表 6  未加入立地因子的人工神经网络模型结果与拟合优度检验(基于测试集,n = 184)

      Table 6.  Results and goodness of fitting statistics based on artificial neural network models without site factors (based on test set, n = 184)

      编号
      No.
      输入单元
      Input unit
      隐藏层数
      Number of hidden layers
      隐单元数
      Number of hidden units
      训练轮数
      Epoch
      R2Adj.R2
      AGBTotal BAGBTotal B
      19D2H240−202040.523 60.505 80.521 00.503 1
      20D2HS240−20960.721 80.712 40.720 30.710 8
      21D2HS340−40−201120.793 60.782 30.792 50.781 1
      22D2HS440−40−40−201310.790 40.780 70.789 20.779 5
      23D-H240−20920.626 30.617 20.622 20.612 9
      24D-S240−203500.900 90.896 60.899 80.895 4
      25D-H-S240−202910.910 90.907 20.909 40.905 6
      26D-H-S340−40−202590.909 90.906 40.908 40.904 9
      27D-H-S440−40−40−201780.895 50.892 60.893 70.890 8
      28D2HS-D-H-S240−203750.909 30.904 90.907 30.902 8
      29D2HS-D-H-S340−40−202620.908 30.903 60.906 20.901 4
      30D2HS-D-H-S440−40−40−201380.899 80.895 40.897 50.893 1
      注:AGB代表地上生物量(t/hm2),Total B代表总生物量(t/hm2)。下同。Notes: AGB stands for aboveground biomass (t/ha) and Total B stands for total biomass (t/ha). The same below.

      表 7  未加入立地因子的人工神经网络模型精度检验(基于测试集,n = 184)

      Table 7.  Accuracy test statistics based on artificial neural network models without site factors (based on test set, n = 184)

      编号 No.RMSE/(t·hm− 2)
      RMSE/(t·ha− 1)
      RMSEr/%MAE/(t·hm− 2)
      MAE/(t·ha− 1)
      AGBTotal BAGBTotal BAGBTotal B
      1924.874 530.791 015.458 815.735 59.559 111.827 7
      2019.006 923.491 811.812 312.004 16.946 6 8.630 2
      2114.785 218.412 3 9.832 6 9.870 25.236 9 6.507 1
      2216.501 120.514 310.255 010.482 75.998 0 7.459 6
      2322.029 727.102 013.690 813.848 98.709 110.745 9
      2411.345 514.087 4 7.050 9 7.198 53.999 8 5.012 9
      2510.758 913.345 2 6.686 4 6.819 33.692 8 4.736 1
      2610.815 713.400 0 6.721 6 6.847 33.719 4 4.710 5
      2711.650 414.353 8 7.240 4 7.334 73.746 1 4.744 5
      2810.851 413.508 8 6.743 8 6.902 93.668 1 4.687 1
      2910.912 613.601 0 6.781 9 6.950 03.855 4 4.887 5
      3011.409 914.166 4 7.091 0 7.238 94.286 3 5.376 1

      R2、Adj.R2、RMSE、RMSEr以及MAE结果显示,表现最好的是输入层3个节点(D-H-S),2层隐藏层,隐单元数为40−20的前馈网络,即模型25。其残差表现如图3所示,最优表现的人工神经网络估测值与对应的实测值较为接近。训练过程中的测试集与验证集的均方误差如图4所示,模型在第291轮训练后终止训练,训练集与验证集误差十分接近,未出现过拟合。

      图  3  人工神经网络模型(模型25)残差图(n = 184)

      Figure 3.  Scatter plots of predictions and observations based on artificial neural network model (model 25) (n = 184)

      图  4  人工神经网络模型(模型25)训练集与验证集预测结果对比图

      Figure 4.  Artificial neural network model (model 25) prediction comparison of training set and validation set

    • 为了检验立地因子的影响,选择模型25的输入层节点,即(D-H-S),并加入立地因子(海拔(HB)、坡向(PX)、坡度(PD)、坡位(PW))来构建长白落叶松地上和总生物量模型。基于测试集184组观测数据人工神经网络模型结构与精度检验的结果如表8表9所示:从R2、Adj.R2、RMSE以及MAE看,表现最好的是模型34,即输入层的自变量为D-H-S-HB-PX-PW,2层隐藏层,隐单元数为40−20的前馈网络,其地上生物量和总生物量预测结果的Adj.R2分别为0.909 4和0.905 1。残差表现如图5所示。从训练过程中的测试集与验证集的均方误差来看(图6),模型在第126轮后终止训练,训练集与验证集误差十分接近,未出现过拟合。

      表 8  加入立地因子的人工神经网络模型结果与拟合优度检验(基于测试集,n = 184)

      Table 8.  Results and goodness of fit statistics based on artificial neural network models with site factors (based on test set, n = 184)

      编号
      No.
      输入单元
      Input unit
      隐藏层数
      Number of hidden layer
      隐单元数
      Number of hidden units
      训练轮数
      Epoch
      R2Adj.R2
      AGBTotal BAGBTotal B
      31D-H-S-HB-PD-PX-PW240−201130.905 90.901 40.893 00.887 8
      32D-H-S-HB-PD-PX-PW340−40−201600.898 40.895 10.884 50.880 7
      33D-H-S-HB-PD-PX-PW440−40−40−201280.881 50.880 30.865 20.863 9
      34D-H-S-HB-PX-PW240−201260.910 90.906 60.909 40.905 1
      35D-H-S-HB-PX-PW340−40−201790.898 30.895 60.885 10.882 0
      36D-H-S-HB-PX-PW440−40−40−201360.907 10.903 20.894 90.890 6
      37D-H-S-PX-PW240−201080.908 00.904 40.896 70.892 6
      38D-H-S-PX-PW340−40−20650.901 70.897 30.889 60.884 6
      39D-H-S-PX-PW440−40−40−201260.900 70.897 90.888 40.885 3
      注:HB代表海拔(m),PD代表坡度(°),PX代表坡向,PW代表坡位。Notes: HB stands for altitude, PD stands for slope (°), PX stands for slope aspect, and PW stands for slope position.

      表 9  加入立地因子的人工神经网络模型精度检验(基于测试集,n = 184)

      Table 9.  Accuracy test statistics based on artificial neural network models with site factors (based on test set, n = 184)

      编号 No.RMSE/(t·hm− 2)
      RMSE/(t·ha− 1)
      RMSEr/%MAE/(t·hm− 2)
      MAE/(t·ha− 1)
      AGBTotal BAGBTotal BAGBTotal B
      3111.053 313.758 06.870 67.030 23.760 54.818 1
      3211.484 914.185 07.137 67.248 43.883 24.943 2
      3312.406 315.153 97.710 27.743 54.216 15.212 7
      3410.758 013.385 16.685 86.839 73.611 94.662 4
      3511.491 614.152 07.141 77.231 53.731 34.704 2
      3610.987 313.625 36.828 36.962 43.903 24.921 7
      3710.929 913.541 26.792 66.919 43.707 04.742 8
      3811.298 614.039 97.021 87.174 33.756 44.809 0
      3911.358 613.998 27.059 17.152 93.846 94.933 7
      注:AGB代表地上生物量(t/hm2),Total B代表总生物量(t/hm2)。Notes: AGB stands for aboveground biomass (t/ha) and Total B stands for total biomass (t/ha).

      图  5  人工神经网络模型(模型34)残差图(n = 184)

      Figure 5.  Residual plot of predictions and observations based on artificial neural network model (model 34) (n = 184)

      图  6  人工神经网络模型(模型34)训练集与验证集预测结果对比图

      Figure 6.  Artificial neural network model (model 34) prediction comparison of training set and validation set

    • 分别从传统对数转化线性回归模型、未加入立地因子的神经网络模型与加入立地因子的神经网络模型中选择预测能力最高的模型(AIC最低,Adj.R2最高,RMSEr最低),基于全部917组观测数据,进行比较,如表10所示。神经网络模型25的地上生物量部分R2、Adj.R2、RMSE、RMSEr优于模型5,但MAE较之略高,说明神经网络模型残差离群点较少,精度较高;总生物量部分的R2、Adj.R2优于模型14,但RMSE、RMSEr与MAE较模型14略高。5个指标均显示,地上生物量与总生物量表现最好的是模型34,即输入单元为D-H-S-HB-PX-PW,2层隐藏层,隐单元数为40−20的神经网络模型,其地上生物量部分的Adj.R2为0.914 1,RMSEr为5.992 2;总生物量部分的Adj.R2为0.908 9,RMSEr为6.153 6。残差分布如图7所示。

      表 10  各组最优模型的比较(n = 917)

      Table 10.  Comparison of the 4 best models for each group (n = 917)

      模型 Model地上生物量 Aboveground biomass总生物量 Total biomass
      R2Adj.R2RMSE/(t·hm− 2)
      RMSE/(t·ha− 1)
      RMSEr/%MAE/(t·hm− 2)
      MAE/(t·ha− 1)
      R2Adj.R2RMSE/(t·hm− 2)
      RMSE/(t·ha− 1)
      RMSEr/%MAE/(t·hm− 2)
      MAE/(t·ha− 1)
      50.902 40.902 110.427 76.330 56.850 3
      140.898 20.897 913.060 86.490 18.778 7
      250.906 40.906 110.426 06.329 56.985 10.900 40.900 013.099 06.509 08.990 2
      340.916 10.914 1 9.870 55.992 26.737 70.911 00.908 912.383 76.153 68.625 0

      图  7  人工神经网络模型(模型34)残差图(n = 917)

      Figure 7.  Residual plot of predictions and observations based on artificial neural network model (model 34) (n = 917)

    • 本文构建了基于传统的对数转化后线性回归和多层感知机的林分生物量模型,对比模型的检验结果,在两种方法的自变量均为林分平均胸径(D)、林分平均高(H)和林分密度指(S)时,使用多层感知机的林分生物量模型预测精度略高,地上生物量模型的调整决定系数(Adj.R2)从0.902 1提高到了0.906 1,总生物量模型的Adj.R2从0.897 9提高到了0.900 0。神经网络模型的精度略有提升,这与Vahedi等[7]使用多层感知机模型在地上生物量模型构建时的研究结果类似[7]

      在林分生物量建模中,林分平均胸径(D)、林分断面积、平均树高(H)、林分密度、年龄等常被作为自变量引入方程[23,9,21]。Vahedi[7]指出,由于人工神经网络技术在数据处理方面的能力和效率较高,可以将环境立地因子作为输入层变量以提高模型精确度。本研究中加入立地因子的生物量模型只略微提高了模型精度,其最优地上生物量模型的Adj.R2与RMSEr分别为0.914 1和5.992 2,略优于未加入立地因子的神经网络模型,Adj.R2提高了0.88%,RMSEr降低了5.33%。这可能是因为DH已经反映了立地因子的差异,与S一起已经能够解释林分生物量的绝大多数变异。

      传统非线性回归方法构建林分生物量模型时会受到自变量共线性与异方差问题的困扰,且为选择合适的模型形式,需要对模型的误差结构进行分析。本研究针对吉林省长白落叶松人工林,因此直接引用了董利虎[9]对东北林区落叶松林误差结构的研究结果,但若是针对其他地域的其他树种进行生物量建模,使用传统非线性回归方法时模型选择仍是不能回避的问题。除模型选型外,还需要检验统计假设如正态、独立和等方差等;一旦不满足统计假设,还需要进行变换和处理。人工神经网络模型对输入层变量没有统计学上的分布要求,输入变量与输出变量的关系通过学习自动融入到了网络的连接权值中[13],且能够一次性同时估计地上生物量与总生物量[14],本文的研究结果也证明了这一点。

      人工神经网络模型容易出现过拟合现象,但通过选择合理的模型结构和划分训练集和测试集能够避免这个问题[22],提前终止的策略也被认为是一种避免过拟合极为有效的方法[17]。通过这种方法,本文的研究未出现过拟合。

      基于BP算法的人工神经网络的非凸目标函数普遍存在局部极小解,本研究并未对神经网络的权值做非监督预训练处理,这可能会使训练结果更容易进入局部最优而非全局最优,且由于样本量不大,本研究只采用了最多4层的隐藏层结构设计,更深层结构的神经网络模型拥有更强大的函数逼近能力和预测精度,因此下一步可在扩大样本量的基础上,建立更详细,覆盖更广,精度更高的神经网络模型。

参考文献 (22)

目录

    /

    返回文章
    返回