-
森林生态系统作为陆地生态系统的主体,在维持物种多样性、水土保持和固碳释氧方面作用巨大[1]。大尺度森林生物量与碳储量的计量是各国履行联合国气候变化框架等国际公约的基础[2]。建立林分生物量与林分调查因子的关系模型,通过林分调查因子来估计林分生物量是最常用的方法之一[2−6]。这种方法利用单木生物量模型得到每株树木的生物量,进而得到林分生物量,主要通过异速生长方程建立林分生物量与林分蓄积量、林分平均高、林分平均胸径、林分密度等的关系模型。国内外针对单木生物量建立了大量的模型,但对于林分层面的生物量模型研究较少[7]。由于生物量数据的特点,采用幂函数异速方程形式的模型往往存在异方差与共线性的问题[8]。对于异方差,通用的做法是使用非线性加权回归或者对数转换后线性回归的方法来消除,但基于这两种回归方法的模型误差结构不同,在建模前需要对误差结构进行分析以选择合适的模型形式,如董利虎[9]指出长白山林区的落叶松人工林其林分生物量模型的误差结构是相乘型的,应选用对数转换后线性回归方法建模。Sileshi[8]指出异速模型受到了共线性问题的限制。
与传统的参数回归模型相比,人工神经网络模型作为一种高效的非线性函数近似器,具有对输入变量无分布要求,预测效果好的优点[10],近年来,在林业领域内正受到越来越广泛的关注[10−12]。但在生物量模型方面应用还不多见。Zelik以土耳其西地中海地区布鲁氏松(Pinus brutia)为对象,使用非线性似乎不相关回归和Levenberg-Marquardt人工神经网络(LMANN)建立了立木生物量模型。结果显示,LMANN模型比非线性似乎不相关回归模型预测的精度更高[13]。王轶夫等[14]使用12种不同优化算法的单隐层BP神经网络建立了马尾松立木生物量模型,发现人工神经网络的模型精度高于传统的相对生长模型。但基于人工神经网络的林分生物量模型在国内还未见报道。
本文以吉林省长白落叶松人工林为对象,使用传统对数转化后线性回归方法和多层感知机建立基于林分变量的地上生物量和总生物量模型,比较两种方法的预测结果,为长白落叶松人工林生物量估计提供新的方法和依据。
-
选取的长白落叶松人工林样地位于吉林省(115°25′ ~ 135°09′E,38°72′ ~ 53°55′N),分布在和龙、舒兰、通化、汪清、长春林区,为长白山山脉的中低丘陵区,海拔多在1 000 m以下,属温带大陆性季风气候,土壤类型主要是暗棕壤和棕壤。研究区内除长白落叶松(Larix olgensis)外,还包括鱼鳞云杉(Picea jezoensis)、臭冷杉(Abies nephrolepis)、红松(Pinus koraiensis)、色木(Acer mono)、水曲柳(Fraxinus mandshurica)、紫椴(Tilia amurensis)、风桦(Betula costata)和黄檗(Phellodendron amurense)、白桦(Betula platyphylla)、春榆(Ulmus propinqua)等树种。
-
数据来源于吉林省第5 ~ 9次一类连续清查(即1994—2014年)中的长白落叶松人工纯林固定样地。根据吉林省一类调查规程,将长白落叶松蓄积组成占65%以上的林分称为长白落叶松纯林。总计1 130组观测数据,剔除缺失值后,共有917组观测数据。样地面积均为0.06 hm2。样地调查因子包括:海拔(HB)、坡向(PX)、坡度(PD)、坡位(PW)、郁闭度、年龄及每株树木的胸径等。基于每木检尺数据,得到样地的断面积、平均胸径(D)、公顷株数和平均树高(H)等基本因子。其中H是在主林层优势树种中选择3 ~ 5株平均样木,测其树高并计算平均值所得。样地因子统计量见表1。样地数据林分年龄在5 ~ 57年之间,蓄积量在12.92 ~ 284.31 m3/hm2之间,立地条件也有较大差异,HB和PD的变异系数分别为39.88%和68.93%,数据覆盖广且有代表性。
表 1 样地基本因子与生物量统计量
Table 1. Summary statistics of sample plot basic variables and biomass
林分因子
Stand factor最大值
Max.最小值
Min.平均值
Mean标准差
Standard deviation变异系数
Coefficient of variation/%年龄/a Age/year 57 5 27 11 40.10 郁闭度 Crown density 1.00 0.20 0.67 0.20 30.09 株数密度/(株·hm− 2) Stand density/(tree·ha− 1) 4 033 267 1 257 675 53.64 林分断面积/(m2·hm− 2) Stand basal area/(m2·ha− 1) 34.63 3.25 13.46 6.67 49.55 蓄积量/(m3·hm− 2) Stand volume/(m3·ha− 1) 284.31 12.92 86.20 51.16 59.35 平均胸径 Quadratic mean diameter (D)/cm 27.7 5.8 12.2 3.6 29.38 平均树高 Mean tree height (H)/m 23.0 8.4 15.9 2.7 17.16 海拔 Altitude (HB)/m 1 190 10 525 209 39.88 坡度 Slope (PD)/(°) 36 0 11 7 68.93 地上生物量/(t·hm− 2) Aboveground biomass/(t·ha− 1) 174.62 9.90 60.00 33.40 55.67 总生物量/(t·hm− 2) Total biomass/(t·ha− 1) 213.27 12.03 73.63 40.96 55.63 -
目前,采用已经建立好的单木生物量异速方程来计算林分生物量是一种通用的方法[15]。本研究通过已经建立的各树种的一元(胸径)立木生物量模型计算样地中每木的生物量[16],各组分包括树干、树枝、树叶、根和全部生物量,每木累加后得到样地的地上生物量和全部生物量,并转化为林分单位面积生物量。即:
$${B_i} = \sum\limits_{j = 1}^n {{b_{ij}}} /A$$ (1) 式中:
${B_i}$ 为林分的地上和全部生物量(t/hm2),${b_{ij}}$ 表示第i块样地中第j个样木的地上生物量和全部生物量,n为样地株数,A为样地面积,本研究中为0.06 hm2。 -
生物量模型主要有3种形式:(1)具有可加性误差的线性模型;(2)对数转换后的可加性误差的线性模型;(3)具有可加性误差的非线性模型。根据董利虎[9]对落叶松生物量模型的误差结构分析结果,落叶松人工林的模型误差结构是相乘型的,本研究采用对数转换后的可加性误差线性模型的形式构建林分生物量模型(式2)。
$$B = {\beta _0}X_1^{{\beta _1}}X_2^{{\beta _2}} \cdots X_i^{{\beta _i}}\varepsilon $$ (2) 式中:B为林分生物量;Xi为林分调查因子,包括林分密度指数、平均胸径、平均高等;βi为待估参数。
本文以林分地上生物量和全部生物量为因变量。在对数转化线性模型中,以常见的林分调查因子平均胸径(D)、平均树高(H)、平均年龄和林分密度指数(S)作为自变量,并尝试一元和多元模型。最终的自变量形式和选择以生物量和各个林分因子的散点图以及回归分析后的结果来确定(图1)。由于将年龄作为自变量加入模型时,其与地上生物量和总生物量的关系几乎都不显著,因此本研究并未选择年龄作为自变量。
-
多层感知机(MLP),又称深度前馈网络,是一种典型的深度学习模型。由输入层、一个以上的隐藏层和输出层组成,层与层的单元全连接,将上一层的输出作为下一层的输入,通过激活函数的转化后继续作为下一层的输出,逐层向后运算直至运算到输出层。使用梯度下降来最小化函数近似误差,由于其强大的函数逼近能力,对输入变量无统计上的分布要求,预测精度高,是现阶段应用最广的人工神经网络类型[7,17]。
本研究基于R3.5.1中的keras包建立多层感知机模型来估计长白落叶松人工林地上和总生物量,输入层为林分调查因子,输出层为地上生物量和总生物量。代价函数采用均方误差,输出单元采用线性单元。在隐单元激活函数的选择上,由于sigmoid函数具有广泛的饱和性使得基于梯度的学习变的困难,而整流线性单元Relu的行为更接近线性,模型更容易优化,在大多数情况下表现良好[17],所以本研究采用整流线性单元。
对于隐藏层与隐单元数量的最优网络架构设计问题,采用反复试错法‘trial and error’,观测模型在测试集上的误差得到[18]。优化方法采用RMSProp算法[19]。为防止模型过拟合,采用提前终止策略,并随机将数据集分成训练集、验证集和测试集,分别占总样本量的60%、20%、20%,即分别为549、184、184组数据。
为了检验立地因子对生物量的影响,除林分D、H和S外,本研究也将立地因子(HB、PD、PX、PW)作为输入变量。为提高模型拟合效果和逼近速度,在模型训练前对离散型因子变量(PW、PX)进行one_hot编码处理,即将一个N级的因子变量扩充成N列属性,每个样本观测值的这N列属性中,只有一个为1,表示该样本属于该类别,其余扩展的属性都为0。对连续型自变量数据进行归一化处理(式3)。
$${X_n} = \frac{{{x_i} - \overline X }}{{\sigma (X)}}$$ (3) 式中:
${x_i}$ 代表各个自变量的样本观测值,$\overline X$ 代表各个自变量的样本均值,$\sigma \left( X \right)$ 代表自变量的样本标准差。 -
传统的回归模型评价基于全部的917组观测数据,神经网络模型在选择最优结构时的评价基于测试集184组观测数据,与传统的回归模型进行比较时基于全部917组观测数据。
模型评价主要从模型精度和拟合优度两方面考虑。精度检验指标主要有均方根误差(RMSE)、相对均方根误差(RMSEr)和平均绝对误差(MAE);拟合优度的指标有决定系数(R2),调整决定系数(Adj.R2),另外,对于对数转化后的线性回归模型,首先考虑估计参数的显著性检验,并用对数转化AIC进行评价[20]。公式如下:
(1)精度检验指标:
$${\rm{RMSE}} = \sqrt {\frac{{\displaystyle \sum\limits_i^n {{{\left( {{{\hat y}_i} - {y_i}} \right)}^2}} }}{n}} $$ (4) $${\rm{RMSE}}_{\rm{r}} = \frac{{{\rm{RMSE}}}}{{{y_{\max }} - {y_{\min }}}} \times 100{\text{%}}$$ (5) $${\rm{MAE}} = \frac{1}{n}\sum\limits_{i = 1}^n {\left| {{y_i} - {{\hat y}_i}} \right|} $$ (6) 式中:yi为林分生物量观测值;
${\hat y_i}$ 为基于林分变量的模型预估值;n为样本量;ymax为林分生物量观测值的最大值,ymin为林分生物量观测值的最小值。(2)拟合优度指标:
$${R^2}{{ = }}1 - \frac{{\displaystyle \sum\limits_i^n {{{({y_i} - {{\hat y}_i})}^2}} }}{{\displaystyle \sum\limits_i^n {{{({y_i} - {{\bar y}_i})}^2}} }}$$ (7) $${\rm{Adj}}.{R^2} = 1 - (1 - {R^2})\frac{{n - 1}}{{n - p - 1}}$$ (8) 对数转化AIC:
$${\rm{AIC}} = 2p - 2\log (L)$$ (9) $$L = \prod\limits_{i = 1}^n {\left[ {\frac{1}{{{y_i}\sqrt {2\pi {\sigma ^2}_{\rm{LR}}} }}\exp \left( {\frac{{ - {{(\log ({y_i}) - \log ({{\hat y}_i}))}^2}}}{{2{\sigma ^2}_{\rm{LR}}}}} \right)} \right]} $$ (10) 式中:yi为林分生物量观测值;
${\hat y_i}$ 为基于林分变量的模型预估值;${\bar y_i}$ 为林分生物量的均值;n为样本量;p为模型自变量个数;L为似然函数值;$\sigma _{\rm{LR}}^2$ 为对数转换后线性模型残差的方差。 -
根据林分生物量与林分因子的散点图(图1),共尝试了包含林分平均胸径(D)、平均树高(H)、林分密度指数(S)及其组合项的18个模型。由表2、3、4、5可以看出,除模型3的b1未在0.05水平上通过t检验,其余模型参数均通过显著性检验,说明对数转化后,林分因子与地上生物量以及总生物量之间存在显著线性关系。
表 2 地上生物量对数转换线性回归模型参数估计值
Table 2. Estimated parameters of aboveground biomass based on log-linear regression model
编号 No. 异速方程 Allometric equation b0 b1 b2 b3 1 lnY = b0 + b1lnD 0.319 8** 1.463 8*** − − 2 lnY = b0 + b1ln(D2 × H) − 0.676 8*** 0.599 2*** − − 3 lnY = b0 + b1lnD + b2lnH − 3.188 2*** 0.148 2ns 2.450 3*** − 4 lnY =b0 + b1ln(D2 × H × S) − 2.989 5*** 0.502 7*** − − 5 lnY = b0 + b1lnD + b2lnH + b3lnS − 3.865 1*** 0.404 9*** 0.750 0*** 0.778 1*** 6 lnY = b0 + b1ln(D2 × S) − 2.554 1*** 0.589 0*** − − 7 lnY = b0 + b1lnD + b2lnS − 2.993 9*** 0.764 8*** 0.828 7*** − 8 lnY =b0 + b1ln(D2 × H) + b2lnS − 3.372 0*** 0.314 4*** 0.803 6*** − 9 lnY =b0 +b1ln(D2 × S) + b3lnH − 2.307 6*** 0.628 8*** − 0.248 5** − 注:D为平均胸径;H为平均树高;S为林分密度指数; b0、b1、b2、b3为模型参数;ns代表参数在0.05水平上不显著;**代表在0.01水平上显著;***代表在0.001水平上显著。下同。Y为地上生物量;Notes: D represents quadratic mean diameter; H represents mean tree height; S represents stand density index; b0, b1, b2, b3 are parameters of models; ns represents no significant difference at 0.05 level; ** represents significant difference at 0.01 level; *** represents significant difference at 0.001 level. The same below. Y represents aboveground biomass. 表 3 地上生物量对数线性回归模型拟合优度与精度检验
Table 3. Fitting statistics of aboveground biomass based on log-linear regression model
编号
No.AIC 决定系数
R2调整决定系数
Adj.R2均方根误差/(t·hm− 2)
RMSE/(t·ha− 1)相对均方根误差
RMSEr/%平均绝对误差/(t·hm− 2)
MAE/(t·ha− 1)1 8 303.537 9 0.448 6 0.448 0 24.790 4 15.049 9 19.134 8 2 8 219.147 2 0.500 9 0.500 4 23.584 1 14.317 6 18.190 9 3 8 091.547 9 0.572 6 0.571 6 21.825 6 13.250 0 16.851 1 4 7 301.056 0 0.826 2 0.826 0 13.918 3 8.449 6 10.278 4 5 6 888.135 9 0.902 4 0.902 1 10.427 7 6.330 5 6.850 3 6 7 240.699 1 0.835 9 0.835 7 13.525 0 8.210 8 9.940 4 7 6 955.132 7 0.894 2 0.894 0 10.859 0 6.592 3 7.358 0 8 6 910.318 9 0.900 3 0.900 1 10.542 2 6.400 0 7.005 9 9 7 235.057 2 0.836 7 0.836 4 13.489 4 8.189 2 9.888 6 表 4 总生物量对数转换线性回归模型参数估计值
Table 4. Estimated parameters of total biomass based on log-linear regression model
编号 No. 异速方程 Allometric equation b0 b1 b2 b3 10 lnY = b0 + b1lnD 0.534 8*** 1.459 6*** − − 11 lnY = b0 + b1ln(D2 × H) − 0.460 4** 0.597 7** − − 12 lnY = b0 + b1lnD + b2lnH − 2.986 0*** 0.139 2ns 2.459 3*** − 13 lnY = b0 + b1ln(D2 × H × S) − 2.770 5*** 0.501 7*** − − 14 lnY = b0 + b1lnD + b2lnH + b4lnS − 3.661 8*** 0.395 4*** 0.762 0*** 0.776 7*** 15 lnY = b0 + b1ln(D2 × S) − 2.335 5*** 0.587 7*** − − 16 lnY = b0 + b1lnD + b2lnS − 2.776 5*** 0.761 1*** 0.828 2*** − 17 lnY = b0 + b1ln(D2 × H) + b2lnS − 3.153 5*** 0.313 1*** 0.803 0*** − 18 lnY = b0 + b1ln(D2 × S) + b3lnH − 2.095 2*** 0.626 5*** − 0.242 3** − 注:Y为总生物量。Note: Y represents total biomass. 表 5 总生物量对数转换线性回归拟合优度与精度检验
Table 5. Fitting statistics of total biomass based on log-linear regression model
编号 No. AIC R2 Adj.R2 RMSE/(t·hm− 2)
RMSE/(t·ha− 1)RMSEr/% MAE/(t·hm− 2)
MAE/(t·ha− 1)10 8 684.928 0 0.444 5 0.443 9 30.510 5 15.161 0 23.547 6 11 8 600.925 1 0.497 0 0.496 4 29.033 9 14.427 3 22.397 4 12 8 472.676 5 0.569 7 0.568 7 26.853 2 13.343 7 20.732 3 13 7 696.929 9 0.821 5 0.821 4 17.292 8 8.593 0 12.781 9 14 7 292.576 7 0.898 2 0.897 9 13.060 8 6.490 1 8.778 7 15 7 638.875 6 0.831 1 0.830 9 16.825 8 8.360 9 12.362 3 16 7 359.598 6 0.889 7 0.889 5 13.594 1 6.755 0 9.369 3 17 7 315.456 5 0.895 9 0.895 7 13.207 4 6.562 9 8.973 9 18 7 633.789 1 0.831 9 0.831 5 16.785 2 8.340 8 12.309 4 模型1与模型10的结果显示,只用D作为自变量的地上生物量与总生物量模型的预测能力均不到50%,R2分别为0.448 6和0.444 5,说明在对数转化后,D只能解释地上生物量与总生物量的少部分变异。在加入H后(模型2、3、11、12),R2分别增长为0.500 9、0.572 6、0.497 0和0.569 7;在加入了S后,模型的预测能力有了显著的增长,表现最好的分别为模型5和模型14,R2分别为0.902 4和0.898 2。
AIC、Adj.R2、RMSE、RMSEr和MAE结果也显示,模型5和模型14分别为林分地上生物量和总生物量的最优模型,方程形式为:lnY = b0 + b1lnD + b2lnH + b3lnS。残差分布如图2所示,未表现出明显的异质性。
-
基于测试集184组观测数据,计算各个模型的R2、Adj.R2、RMSE、RMSEr以及MAE,选择表现最优的神经网络模型。
分别引入了1个输入节点(D2H、D2HS)、2个输入节点(D-H、D-S)、3个输入节点(D-H-S)和4个输入节点(D2HS-D-H-S)、不同隐藏层数以及隐藏单元数的人工神经网络模型来观察模型在测试集上的预测表现。研究结果如表6、7所示。其中,输入层有3个节点以上并包含D、S的神经网络模型,即模型25 ~ 30的地上生物量预测的Adj.R2均在0.893 7以上,总生物量的Adj.R2均在0.890 8以上。
表 6 未加入立地因子的人工神经网络模型结果与拟合优度检验(基于测试集,n = 184)
Table 6. Results and goodness of fitting statistics based on artificial neural network models without site factors (based on test set, n = 184)
编号
No.输入单元
Input unit隐藏层数
Number of hidden layers隐单元数
Number of hidden units训练轮数
EpochR2 Adj.R2 AGB Total B AGB Total B 19 D2H 2 40−20 204 0.523 6 0.505 8 0.521 0 0.503 1 20 D2HS 2 40−20 96 0.721 8 0.712 4 0.720 3 0.710 8 21 D2HS 3 40−40−20 112 0.793 6 0.782 3 0.792 5 0.781 1 22 D2HS 4 40−40−40−20 131 0.790 4 0.780 7 0.789 2 0.779 5 23 D-H 2 40−20 92 0.626 3 0.617 2 0.622 2 0.612 9 24 D-S 2 40−20 350 0.900 9 0.896 6 0.899 8 0.895 4 25 D-H-S 2 40−20 291 0.910 9 0.907 2 0.909 4 0.905 6 26 D-H-S 3 40−40−20 259 0.909 9 0.906 4 0.908 4 0.904 9 27 D-H-S 4 40−40−40−20 178 0.895 5 0.892 6 0.893 7 0.890 8 28 D2HS-D-H-S 2 40−20 375 0.909 3 0.904 9 0.907 3 0.902 8 29 D2HS-D-H-S 3 40−40−20 262 0.908 3 0.903 6 0.906 2 0.901 4 30 D2HS-D-H-S 4 40−40−40−20 138 0.899 8 0.895 4 0.897 5 0.893 1 注:AGB代表地上生物量(t/hm2),Total B代表总生物量(t/hm2)。下同。Notes: AGB stands for aboveground biomass (t/ha) and Total B stands for total biomass (t/ha). The same below. 表 7 未加入立地因子的人工神经网络模型精度检验(基于测试集,n = 184)
Table 7. Accuracy test statistics based on artificial neural network models without site factors (based on test set, n = 184)
编号 No. RMSE/(t·hm− 2)
RMSE/(t·ha− 1)RMSEr/% MAE/(t·hm− 2)
MAE/(t·ha− 1)AGB Total B AGB Total B AGB Total B 19 24.874 5 30.791 0 15.458 8 15.735 5 9.559 1 11.827 7 20 19.006 9 23.491 8 11.812 3 12.004 1 6.946 6 8.630 2 21 14.785 2 18.412 3 9.832 6 9.870 2 5.236 9 6.507 1 22 16.501 1 20.514 3 10.255 0 10.482 7 5.998 0 7.459 6 23 22.029 7 27.102 0 13.690 8 13.848 9 8.709 1 10.745 9 24 11.345 5 14.087 4 7.050 9 7.198 5 3.999 8 5.012 9 25 10.758 9 13.345 2 6.686 4 6.819 3 3.692 8 4.736 1 26 10.815 7 13.400 0 6.721 6 6.847 3 3.719 4 4.710 5 27 11.650 4 14.353 8 7.240 4 7.334 7 3.746 1 4.744 5 28 10.851 4 13.508 8 6.743 8 6.902 9 3.668 1 4.687 1 29 10.912 6 13.601 0 6.781 9 6.950 0 3.855 4 4.887 5 30 11.409 9 14.166 4 7.091 0 7.238 9 4.286 3 5.376 1 R2、Adj.R2、RMSE、RMSEr以及MAE结果显示,表现最好的是输入层3个节点(D-H-S),2层隐藏层,隐单元数为40−20的前馈网络,即模型25。其残差表现如图3所示,最优表现的人工神经网络估测值与对应的实测值较为接近。训练过程中的测试集与验证集的均方误差如图4所示,模型在第291轮训练后终止训练,训练集与验证集误差十分接近,未出现过拟合。
-
为了检验立地因子的影响,选择模型25的输入层节点,即(D-H-S),并加入立地因子(海拔(HB)、坡向(PX)、坡度(PD)、坡位(PW))来构建长白落叶松地上和总生物量模型。基于测试集184组观测数据人工神经网络模型结构与精度检验的结果如表8和表9所示:从R2、Adj.R2、RMSE以及MAE看,表现最好的是模型34,即输入层的自变量为D-H-S-HB-PX-PW,2层隐藏层,隐单元数为40−20的前馈网络,其地上生物量和总生物量预测结果的Adj.R2分别为0.909 4和0.905 1。残差表现如图5所示。从训练过程中的测试集与验证集的均方误差来看(图6),模型在第126轮后终止训练,训练集与验证集误差十分接近,未出现过拟合。
表 8 加入立地因子的人工神经网络模型结果与拟合优度检验(基于测试集,n = 184)
Table 8. Results and goodness of fit statistics based on artificial neural network models with site factors (based on test set, n = 184)
编号
No.输入单元
Input unit隐藏层数
Number of hidden layer隐单元数
Number of hidden units训练轮数
EpochR2 Adj.R2 AGB Total B AGB Total B 31 D-H-S-HB-PD-PX-PW 2 40−20 113 0.905 9 0.901 4 0.893 0 0.887 8 32 D-H-S-HB-PD-PX-PW 3 40−40−20 160 0.898 4 0.895 1 0.884 5 0.880 7 33 D-H-S-HB-PD-PX-PW 4 40−40−40−20 128 0.881 5 0.880 3 0.865 2 0.863 9 34 D-H-S-HB-PX-PW 2 40−20 126 0.910 9 0.906 6 0.909 4 0.905 1 35 D-H-S-HB-PX-PW 3 40−40−20 179 0.898 3 0.895 6 0.885 1 0.882 0 36 D-H-S-HB-PX-PW 4 40−40−40−20 136 0.907 1 0.903 2 0.894 9 0.890 6 37 D-H-S-PX-PW 2 40−20 108 0.908 0 0.904 4 0.896 7 0.892 6 38 D-H-S-PX-PW 3 40−40−20 65 0.901 7 0.897 3 0.889 6 0.884 6 39 D-H-S-PX-PW 4 40−40−40−20 126 0.900 7 0.897 9 0.888 4 0.885 3 注:HB代表海拔(m),PD代表坡度(°),PX代表坡向,PW代表坡位。Notes: HB stands for altitude, PD stands for slope (°), PX stands for slope aspect, and PW stands for slope position. 表 9 加入立地因子的人工神经网络模型精度检验(基于测试集,n = 184)
Table 9. Accuracy test statistics based on artificial neural network models with site factors (based on test set, n = 184)
编号 No. RMSE/(t·hm− 2)
RMSE/(t·ha− 1)RMSEr/% MAE/(t·hm− 2)
MAE/(t·ha− 1)AGB Total B AGB Total B AGB Total B 31 11.053 3 13.758 0 6.870 6 7.030 2 3.760 5 4.818 1 32 11.484 9 14.185 0 7.137 6 7.248 4 3.883 2 4.943 2 33 12.406 3 15.153 9 7.710 2 7.743 5 4.216 1 5.212 7 34 10.758 0 13.385 1 6.685 8 6.839 7 3.611 9 4.662 4 35 11.491 6 14.152 0 7.141 7 7.231 5 3.731 3 4.704 2 36 10.987 3 13.625 3 6.828 3 6.962 4 3.903 2 4.921 7 37 10.929 9 13.541 2 6.792 6 6.919 4 3.707 0 4.742 8 38 11.298 6 14.039 9 7.021 8 7.174 3 3.756 4 4.809 0 39 11.358 6 13.998 2 7.059 1 7.152 9 3.846 9 4.933 7 注:AGB代表地上生物量(t/hm2),Total B代表总生物量(t/hm2)。Notes: AGB stands for aboveground biomass (t/ha) and Total B stands for total biomass (t/ha). -
分别从传统对数转化线性回归模型、未加入立地因子的神经网络模型与加入立地因子的神经网络模型中选择预测能力最高的模型(AIC最低,Adj.R2最高,RMSEr最低),基于全部917组观测数据,进行比较,如表10所示。神经网络模型25的地上生物量部分R2、Adj.R2、RMSE、RMSEr优于模型5,但MAE较之略高,说明神经网络模型残差离群点较少,精度较高;总生物量部分的R2、Adj.R2优于模型14,但RMSE、RMSEr与MAE较模型14略高。5个指标均显示,地上生物量与总生物量表现最好的是模型34,即输入单元为D-H-S-HB-PX-PW,2层隐藏层,隐单元数为40−20的神经网络模型,其地上生物量部分的Adj.R2为0.914 1,RMSEr为5.992 2;总生物量部分的Adj.R2为0.908 9,RMSEr为6.153 6。残差分布如图7所示。
表 10 各组最优模型的比较(n = 917)
Table 10. Comparison of the 4 best models for each group (n = 917)
模型 Model 地上生物量 Aboveground biomass 总生物量 Total biomass R2 Adj.R2 RMSE/(t·hm− 2)
RMSE/(t·ha− 1)RMSEr/% MAE/(t·hm− 2)
MAE/(t·ha− 1)R2 Adj.R2 RMSE/(t·hm− 2)
RMSE/(t·ha− 1)RMSEr/% MAE/(t·hm− 2)
MAE/(t·ha− 1)5 0.902 4 0.902 1 10.427 7 6.330 5 6.850 3 14 0.898 2 0.897 9 13.060 8 6.490 1 8.778 7 25 0.906 4 0.906 1 10.426 0 6.329 5 6.985 1 0.900 4 0.900 0 13.099 0 6.509 0 8.990 2 34 0.916 1 0.914 1 9.870 5 5.992 2 6.737 7 0.911 0 0.908 9 12.383 7 6.153 6 8.625 0 -
本文构建了基于传统的对数转化后线性回归和多层感知机的林分生物量模型,对比模型的检验结果,在两种方法的自变量均为林分平均胸径(D)、林分平均高(H)和林分密度指(S)时,使用多层感知机的林分生物量模型预测精度略高,地上生物量模型的调整决定系数(Adj.R2)从0.902 1提高到了0.906 1,总生物量模型的Adj.R2从0.897 9提高到了0.900 0。神经网络模型的精度略有提升,这与Vahedi等[7]使用多层感知机模型在地上生物量模型构建时的研究结果类似[7]。
在林分生物量建模中,林分平均胸径(D)、林分断面积、平均树高(H)、林分密度、年龄等常被作为自变量引入方程[2−3,9,21]。Vahedi[7]指出,由于人工神经网络技术在数据处理方面的能力和效率较高,可以将环境立地因子作为输入层变量以提高模型精确度。本研究中加入立地因子的生物量模型只略微提高了模型精度,其最优地上生物量模型的Adj.R2与RMSEr分别为0.914 1和5.992 2,略优于未加入立地因子的神经网络模型,Adj.R2提高了0.88%,RMSEr降低了5.33%。这可能是因为D、H已经反映了立地因子的差异,与S一起已经能够解释林分生物量的绝大多数变异。
传统非线性回归方法构建林分生物量模型时会受到自变量共线性与异方差问题的困扰,且为选择合适的模型形式,需要对模型的误差结构进行分析。本研究针对吉林省长白落叶松人工林,因此直接引用了董利虎[9]对东北林区落叶松林误差结构的研究结果,但若是针对其他地域的其他树种进行生物量建模,使用传统非线性回归方法时模型选择仍是不能回避的问题。除模型选型外,还需要检验统计假设如正态、独立和等方差等;一旦不满足统计假设,还需要进行变换和处理。人工神经网络模型对输入层变量没有统计学上的分布要求,输入变量与输出变量的关系通过学习自动融入到了网络的连接权值中[13],且能够一次性同时估计地上生物量与总生物量[14],本文的研究结果也证明了这一点。
人工神经网络模型容易出现过拟合现象,但通过选择合理的模型结构和划分训练集和测试集能够避免这个问题[22],提前终止的策略也被认为是一种避免过拟合极为有效的方法[17]。通过这种方法,本文的研究未出现过拟合。
基于BP算法的人工神经网络的非凸目标函数普遍存在局部极小解,本研究并未对神经网络的权值做非监督预训练处理,这可能会使训练结果更容易进入局部最优而非全局最优,且由于样本量不大,本研究只采用了最多4层的隐藏层结构设计,更深层结构的神经网络模型拥有更强大的函数逼近能力和预测精度,因此下一步可在扩大样本量的基础上,建立更详细,覆盖更广,精度更高的神经网络模型。
Stand biomass model of Larix olgensis plantations based on multi-layer perceptron networks
-
摘要:
目的神经网络模型能避免林分生物量模型建模时自变量共线性与异方差问题,研究多层感知机在林分生物量模型中的应用,为森林经营单位、区域生物量和碳储量的估算提供方法和依据。 方法以长白落叶松人工林为研究对象,利用吉林省一类清查固定样地的917组数据,分别建立了基于传统的对数转化后线性模型和神经网络多层感知机的地上生物量和总生物量模型。使用AIC、决定系数(R2)、均方根误差(RMSE)、相对均方根误差(RMSEr)和平均绝对误差(MAE)来评价模型。 结果估计精度最高的模型是输入单元为林分平均胸径(D)−平均高(H)−林分密度指数(S)−海拔(HB)−坡向(PX)−坡位(PW)、2个隐藏层、隐单元数为40−20的神经网络模型,与传统对数转换线性回归模型相比,地上生物量和总生物量模型的调整决定系数(Adj.R2)分别从0.902 1提高到了0.914 1,从0.897 9提高到了0.908 9;RMSEr分别从6.330 5%降低到了5.992 2%,从6.490 1%降低到了6.153 6%。包含立地因子的神经网络模型比未包含立地因子的神经网络模型估计精度略有提升,地上生物量与总生物量的Adj.R2分别提高了0.88%和0.99%,RMSEr分别降低了5.33%和5.46%。 结论多层感知机生物量模型的估计精度比传统回归模型略有提高,但它可以避免模型选型和违背传统统计假设的处理等问题,且能够一次性计算地上生物量和总生物量模型,有一定优势。 -
关键词:
- 长白落叶松 /
- 林分生物量 /
- 对数转化后线性回归模型 /
- 多层感知机模型
Abstract:ObjectiveNeural network model can avoid the collinearity and heteroscedasticity of variables in modeling forest stand biomass. This paper aims to apply multi-layer perceptron networks to forest biomass model to provide methods for the calculation and prediction of forest biomass and carbon stocks at forest management unit and regional levels. MethodBased on 917 observations from the sample plots of larch plantations from national forest inventory in Jilin Province of northeastern China, the aboveground and total biomass models by log-transformed linear regression, and multi-layer perceptron networks with and without site factors were established. AIC, adjusted R2, RMSE, RMSEr and MAE were used to evaluate the models. ResultThe model with the highest prediction accuracy was the neural network one with the input unit quadratic mean diameters (D), stand mean height (H), stand density index (S), altitude (HB), slope (PD), slope aspect (PX), slope position (PW), two hidden layers and hidden unit number of 40−20. Compared with traditional log-transformed linear regression model, the adjusted R2 of the aboveground and total biomass models was increased from 0.902 1 to 0.914 1, and from 0.897 9 to 0.908 9, RMSEr was decreased from 6.330 5% to 5.992 2%, and from 6.490 1% to 6.153 6%, respectively. The neural network model with site factors had slightly higher estimation accuracy than that without site factors. The adjusted R2 of the aboveground and total biomass models was increased by 0.88% and 0.99%, and RMSEr decreased by 5.33% and 5.46%, respectively. ConclusionBiomass model based on multi-layer perceptron networks had similar performance in terms of model accuracy, but it could avoid treating the traditional assumptions such as the collinearity and heteroscedasticity of variables, and had the ability to calculate aboveground and total biomass models at one time. -
表 1 样地基本因子与生物量统计量
Table 1. Summary statistics of sample plot basic variables and biomass
林分因子
Stand factor最大值
Max.最小值
Min.平均值
Mean标准差
Standard deviation变异系数
Coefficient of variation/%年龄/a Age/year 57 5 27 11 40.10 郁闭度 Crown density 1.00 0.20 0.67 0.20 30.09 株数密度/(株·hm− 2) Stand density/(tree·ha− 1) 4 033 267 1 257 675 53.64 林分断面积/(m2·hm− 2) Stand basal area/(m2·ha− 1) 34.63 3.25 13.46 6.67 49.55 蓄积量/(m3·hm− 2) Stand volume/(m3·ha− 1) 284.31 12.92 86.20 51.16 59.35 平均胸径 Quadratic mean diameter (D)/cm 27.7 5.8 12.2 3.6 29.38 平均树高 Mean tree height (H)/m 23.0 8.4 15.9 2.7 17.16 海拔 Altitude (HB)/m 1 190 10 525 209 39.88 坡度 Slope (PD)/(°) 36 0 11 7 68.93 地上生物量/(t·hm− 2) Aboveground biomass/(t·ha− 1) 174.62 9.90 60.00 33.40 55.67 总生物量/(t·hm− 2) Total biomass/(t·ha− 1) 213.27 12.03 73.63 40.96 55.63 表 2 地上生物量对数转换线性回归模型参数估计值
Table 2. Estimated parameters of aboveground biomass based on log-linear regression model
编号 No. 异速方程 Allometric equation b0 b1 b2 b3 1 lnY = b0 + b1lnD 0.319 8** 1.463 8*** − − 2 lnY = b0 + b1ln(D2 × H) − 0.676 8*** 0.599 2*** − − 3 lnY = b0 + b1lnD + b2lnH − 3.188 2*** 0.148 2ns 2.450 3*** − 4 lnY =b0 + b1ln(D2 × H × S) − 2.989 5*** 0.502 7*** − − 5 lnY = b0 + b1lnD + b2lnH + b3lnS − 3.865 1*** 0.404 9*** 0.750 0*** 0.778 1*** 6 lnY = b0 + b1ln(D2 × S) − 2.554 1*** 0.589 0*** − − 7 lnY = b0 + b1lnD + b2lnS − 2.993 9*** 0.764 8*** 0.828 7*** − 8 lnY =b0 + b1ln(D2 × H) + b2lnS − 3.372 0*** 0.314 4*** 0.803 6*** − 9 lnY =b0 +b1ln(D2 × S) + b3lnH − 2.307 6*** 0.628 8*** − 0.248 5** − 注:D为平均胸径;H为平均树高;S为林分密度指数; b0、b1、b2、b3为模型参数;ns代表参数在0.05水平上不显著;**代表在0.01水平上显著;***代表在0.001水平上显著。下同。Y为地上生物量;Notes: D represents quadratic mean diameter; H represents mean tree height; S represents stand density index; b0, b1, b2, b3 are parameters of models; ns represents no significant difference at 0.05 level; ** represents significant difference at 0.01 level; *** represents significant difference at 0.001 level. The same below. Y represents aboveground biomass. 表 3 地上生物量对数线性回归模型拟合优度与精度检验
Table 3. Fitting statistics of aboveground biomass based on log-linear regression model
编号
No.AIC 决定系数
R2调整决定系数
Adj.R2均方根误差/(t·hm− 2)
RMSE/(t·ha− 1)相对均方根误差
RMSEr/%平均绝对误差/(t·hm− 2)
MAE/(t·ha− 1)1 8 303.537 9 0.448 6 0.448 0 24.790 4 15.049 9 19.134 8 2 8 219.147 2 0.500 9 0.500 4 23.584 1 14.317 6 18.190 9 3 8 091.547 9 0.572 6 0.571 6 21.825 6 13.250 0 16.851 1 4 7 301.056 0 0.826 2 0.826 0 13.918 3 8.449 6 10.278 4 5 6 888.135 9 0.902 4 0.902 1 10.427 7 6.330 5 6.850 3 6 7 240.699 1 0.835 9 0.835 7 13.525 0 8.210 8 9.940 4 7 6 955.132 7 0.894 2 0.894 0 10.859 0 6.592 3 7.358 0 8 6 910.318 9 0.900 3 0.900 1 10.542 2 6.400 0 7.005 9 9 7 235.057 2 0.836 7 0.836 4 13.489 4 8.189 2 9.888 6 表 4 总生物量对数转换线性回归模型参数估计值
Table 4. Estimated parameters of total biomass based on log-linear regression model
编号 No. 异速方程 Allometric equation b0 b1 b2 b3 10 lnY = b0 + b1lnD 0.534 8*** 1.459 6*** − − 11 lnY = b0 + b1ln(D2 × H) − 0.460 4** 0.597 7** − − 12 lnY = b0 + b1lnD + b2lnH − 2.986 0*** 0.139 2ns 2.459 3*** − 13 lnY = b0 + b1ln(D2 × H × S) − 2.770 5*** 0.501 7*** − − 14 lnY = b0 + b1lnD + b2lnH + b4lnS − 3.661 8*** 0.395 4*** 0.762 0*** 0.776 7*** 15 lnY = b0 + b1ln(D2 × S) − 2.335 5*** 0.587 7*** − − 16 lnY = b0 + b1lnD + b2lnS − 2.776 5*** 0.761 1*** 0.828 2*** − 17 lnY = b0 + b1ln(D2 × H) + b2lnS − 3.153 5*** 0.313 1*** 0.803 0*** − 18 lnY = b0 + b1ln(D2 × S) + b3lnH − 2.095 2*** 0.626 5*** − 0.242 3** − 注:Y为总生物量。Note: Y represents total biomass. 表 5 总生物量对数转换线性回归拟合优度与精度检验
Table 5. Fitting statistics of total biomass based on log-linear regression model
编号 No. AIC R2 Adj.R2 RMSE/(t·hm− 2)
RMSE/(t·ha− 1)RMSEr/% MAE/(t·hm− 2)
MAE/(t·ha− 1)10 8 684.928 0 0.444 5 0.443 9 30.510 5 15.161 0 23.547 6 11 8 600.925 1 0.497 0 0.496 4 29.033 9 14.427 3 22.397 4 12 8 472.676 5 0.569 7 0.568 7 26.853 2 13.343 7 20.732 3 13 7 696.929 9 0.821 5 0.821 4 17.292 8 8.593 0 12.781 9 14 7 292.576 7 0.898 2 0.897 9 13.060 8 6.490 1 8.778 7 15 7 638.875 6 0.831 1 0.830 9 16.825 8 8.360 9 12.362 3 16 7 359.598 6 0.889 7 0.889 5 13.594 1 6.755 0 9.369 3 17 7 315.456 5 0.895 9 0.895 7 13.207 4 6.562 9 8.973 9 18 7 633.789 1 0.831 9 0.831 5 16.785 2 8.340 8 12.309 4 表 6 未加入立地因子的人工神经网络模型结果与拟合优度检验(基于测试集,n = 184)
Table 6. Results and goodness of fitting statistics based on artificial neural network models without site factors (based on test set, n = 184)
编号
No.输入单元
Input unit隐藏层数
Number of hidden layers隐单元数
Number of hidden units训练轮数
EpochR2 Adj.R2 AGB Total B AGB Total B 19 D2H 2 40−20 204 0.523 6 0.505 8 0.521 0 0.503 1 20 D2HS 2 40−20 96 0.721 8 0.712 4 0.720 3 0.710 8 21 D2HS 3 40−40−20 112 0.793 6 0.782 3 0.792 5 0.781 1 22 D2HS 4 40−40−40−20 131 0.790 4 0.780 7 0.789 2 0.779 5 23 D-H 2 40−20 92 0.626 3 0.617 2 0.622 2 0.612 9 24 D-S 2 40−20 350 0.900 9 0.896 6 0.899 8 0.895 4 25 D-H-S 2 40−20 291 0.910 9 0.907 2 0.909 4 0.905 6 26 D-H-S 3 40−40−20 259 0.909 9 0.906 4 0.908 4 0.904 9 27 D-H-S 4 40−40−40−20 178 0.895 5 0.892 6 0.893 7 0.890 8 28 D2HS-D-H-S 2 40−20 375 0.909 3 0.904 9 0.907 3 0.902 8 29 D2HS-D-H-S 3 40−40−20 262 0.908 3 0.903 6 0.906 2 0.901 4 30 D2HS-D-H-S 4 40−40−40−20 138 0.899 8 0.895 4 0.897 5 0.893 1 注:AGB代表地上生物量(t/hm2),Total B代表总生物量(t/hm2)。下同。Notes: AGB stands for aboveground biomass (t/ha) and Total B stands for total biomass (t/ha). The same below. 表 7 未加入立地因子的人工神经网络模型精度检验(基于测试集,n = 184)
Table 7. Accuracy test statistics based on artificial neural network models without site factors (based on test set, n = 184)
编号 No. RMSE/(t·hm− 2)
RMSE/(t·ha− 1)RMSEr/% MAE/(t·hm− 2)
MAE/(t·ha− 1)AGB Total B AGB Total B AGB Total B 19 24.874 5 30.791 0 15.458 8 15.735 5 9.559 1 11.827 7 20 19.006 9 23.491 8 11.812 3 12.004 1 6.946 6 8.630 2 21 14.785 2 18.412 3 9.832 6 9.870 2 5.236 9 6.507 1 22 16.501 1 20.514 3 10.255 0 10.482 7 5.998 0 7.459 6 23 22.029 7 27.102 0 13.690 8 13.848 9 8.709 1 10.745 9 24 11.345 5 14.087 4 7.050 9 7.198 5 3.999 8 5.012 9 25 10.758 9 13.345 2 6.686 4 6.819 3 3.692 8 4.736 1 26 10.815 7 13.400 0 6.721 6 6.847 3 3.719 4 4.710 5 27 11.650 4 14.353 8 7.240 4 7.334 7 3.746 1 4.744 5 28 10.851 4 13.508 8 6.743 8 6.902 9 3.668 1 4.687 1 29 10.912 6 13.601 0 6.781 9 6.950 0 3.855 4 4.887 5 30 11.409 9 14.166 4 7.091 0 7.238 9 4.286 3 5.376 1 表 8 加入立地因子的人工神经网络模型结果与拟合优度检验(基于测试集,n = 184)
Table 8. Results and goodness of fit statistics based on artificial neural network models with site factors (based on test set, n = 184)
编号
No.输入单元
Input unit隐藏层数
Number of hidden layer隐单元数
Number of hidden units训练轮数
EpochR2 Adj.R2 AGB Total B AGB Total B 31 D-H-S-HB-PD-PX-PW 2 40−20 113 0.905 9 0.901 4 0.893 0 0.887 8 32 D-H-S-HB-PD-PX-PW 3 40−40−20 160 0.898 4 0.895 1 0.884 5 0.880 7 33 D-H-S-HB-PD-PX-PW 4 40−40−40−20 128 0.881 5 0.880 3 0.865 2 0.863 9 34 D-H-S-HB-PX-PW 2 40−20 126 0.910 9 0.906 6 0.909 4 0.905 1 35 D-H-S-HB-PX-PW 3 40−40−20 179 0.898 3 0.895 6 0.885 1 0.882 0 36 D-H-S-HB-PX-PW 4 40−40−40−20 136 0.907 1 0.903 2 0.894 9 0.890 6 37 D-H-S-PX-PW 2 40−20 108 0.908 0 0.904 4 0.896 7 0.892 6 38 D-H-S-PX-PW 3 40−40−20 65 0.901 7 0.897 3 0.889 6 0.884 6 39 D-H-S-PX-PW 4 40−40−40−20 126 0.900 7 0.897 9 0.888 4 0.885 3 注:HB代表海拔(m),PD代表坡度(°),PX代表坡向,PW代表坡位。Notes: HB stands for altitude, PD stands for slope (°), PX stands for slope aspect, and PW stands for slope position. 表 9 加入立地因子的人工神经网络模型精度检验(基于测试集,n = 184)
Table 9. Accuracy test statistics based on artificial neural network models with site factors (based on test set, n = 184)
编号 No. RMSE/(t·hm− 2)
RMSE/(t·ha− 1)RMSEr/% MAE/(t·hm− 2)
MAE/(t·ha− 1)AGB Total B AGB Total B AGB Total B 31 11.053 3 13.758 0 6.870 6 7.030 2 3.760 5 4.818 1 32 11.484 9 14.185 0 7.137 6 7.248 4 3.883 2 4.943 2 33 12.406 3 15.153 9 7.710 2 7.743 5 4.216 1 5.212 7 34 10.758 0 13.385 1 6.685 8 6.839 7 3.611 9 4.662 4 35 11.491 6 14.152 0 7.141 7 7.231 5 3.731 3 4.704 2 36 10.987 3 13.625 3 6.828 3 6.962 4 3.903 2 4.921 7 37 10.929 9 13.541 2 6.792 6 6.919 4 3.707 0 4.742 8 38 11.298 6 14.039 9 7.021 8 7.174 3 3.756 4 4.809 0 39 11.358 6 13.998 2 7.059 1 7.152 9 3.846 9 4.933 7 注:AGB代表地上生物量(t/hm2),Total B代表总生物量(t/hm2)。Notes: AGB stands for aboveground biomass (t/ha) and Total B stands for total biomass (t/ha). 表 10 各组最优模型的比较(n = 917)
Table 10. Comparison of the 4 best models for each group (n = 917)
模型 Model 地上生物量 Aboveground biomass 总生物量 Total biomass R2 Adj.R2 RMSE/(t·hm− 2)
RMSE/(t·ha− 1)RMSEr/% MAE/(t·hm− 2)
MAE/(t·ha− 1)R2 Adj.R2 RMSE/(t·hm− 2)
RMSE/(t·ha− 1)RMSEr/% MAE/(t·hm− 2)
MAE/(t·ha− 1)5 0.902 4 0.902 1 10.427 7 6.330 5 6.850 3 14 0.898 2 0.897 9 13.060 8 6.490 1 8.778 7 25 0.906 4 0.906 1 10.426 0 6.329 5 6.985 1 0.900 4 0.900 0 13.099 0 6.509 0 8.990 2 34 0.916 1 0.914 1 9.870 5 5.992 2 6.737 7 0.911 0 0.908 9 12.383 7 6.153 6 8.625 0 -
[1] 罗云建. 森林生物量的估算方法及其研究进展[J]. 林业科学, 2009, 45(8):129−134. doi: 10.3321/j.issn:1001-7488.2009.08.023 Luo Y J. Forest biomass estimation methods and their prospects[J]. Scientia Silvae Sinicae, 2009, 45(8): 129−134. doi: 10.3321/j.issn:1001-7488.2009.08.023 [2] 雷相东, 张会儒, 牟惠生. 东北过伐林区蒙古栎林分相容性生物量模型研究[J]. 第四纪研究, 2010, 30(3):559−565. doi: 10.3969/j.issn.1001-7410.2010.03.14 Lei X D, Zhang H R, Mu H S. Compatible stand biomass models of Mongolia oak forests in over logged forest regions, Northeast China[J]. Quaternary Sciences, 2010, 30(3): 559−565. doi: 10.3969/j.issn.1001-7410.2010.03.14 [3] 程堂仁, 冯菁, 马钦彦, 等. 基于森林资源清查资料的林分生物量相容性线性模型[J]. 北京林业大学学报, 2007, 29(5):110−113. doi: 10.3321/j.issn:1000-1522.2007.05.022 Cheng T R, Feng J, Ma Q Y, et al. Linear models with compatibility of stand biomass based on the forest resource inventory data[J]. Journal of Beijing Forestry University, 2007, 29(5): 110−113. doi: 10.3321/j.issn:1000-1522.2007.05.022 [4] 董利虎, 李凤日. 大兴安岭东部主要林分类型乔木层生物量估算模型[J]. 应用生态学报, 2018, 29(9):2825−2834. Dong L H, Li F R. Stand-level biomass estimation models for the tree layer of main forest types in East Daxing ’an Mountains, China.[J]. Chinese Journal of Applied Ecology, 2018, 29(9): 2825−2834. [5] 欧光龙, 胥辉, 王俊峰, 等. 思茅松天然林林分生物量混合效应模型构建[J]. 北京林业大学学报, 2015, 37(3):101−110. Ou G L, Xu H, Wang J F, et al. Building mixed effect models of stand biomass for Simao pine (Pinus kesiya var. langbianensis) natural forest[J]. Journal of Beijing Forestry University, 2015, 37(3): 101−110. [6] 赵嘉诚, 李海奎. 杉木单木和林分水平地下生物量模型的构建[J]. 林业科学, 2018, 54(2):81−89. Zhao J C, Li H K. Establishment of below-ground biomass equations for Chinese fir at tree and stand level[J]. Scientia Silvae Sinicae, 2018, 54(2): 81−89. [7] Vahedi A A. Artificial neural network application in comparison with modeling allometric equations for predicting above-ground biomass in the Hyrcanian mixed-beech forests of Iran[J]. Biomass and Bioenergy, 2016, 88: 66−76. doi: 10.1016/j.biombioe.2016.03.020 [8] Sileshi G W. A critical review of forest biomass estimation models, common mistakes and corrective measures[J]. Forest Ecology and Management, 2014, 329: 237−254. doi: 10.1016/j.foreco.2014.06.026 [9] 董利虎. 东北林区主要树种及林分类型生物量模型研究[D]. 哈尔滨: 东北林业大学, 2015. Dong L H. Developing individual and stand-level biomass equations in Northeast China forest area[D]. Harbin: Northeast Forest University, 2015. [10] Nandy S, Singh R, Ghosh S, et al. Neural network-based modelling for forest biomass assessment[J]. Carbon Management, 2017, 8(4): 305−317. doi: 10.1080/17583004.2017.1357402 [11] Stas S M, Rutishauser E, Chave J, et al. Estimating the aboveground biomass in an old secondary forest on limestone in the Moluccas, Indonesia: comparing locally developed versus existing allometric models[J]. Forest ecology and management, 2017, 389: 27−34. doi: 10.1016/j.foreco.2016.12.010 [12] Ercanlı İ, Günlü A, Şenyurt M, et al. Artificial neural network models predicting the leaf area index: a case study in pure even-aged Crimean pine forests from Turkey[J]. Forest Ecosystems, 2018, 5(1): 29. doi: 10.1186/s40663-018-0149-8 [13] Özçelik R, Diamantopoulou M J, Eker M, et al. Artificial neural network models: an alternative approach for reliable aboveground Pine tree biomass prediction[J]. Forest Science, 2017, 63(3): 291−302. [14] 王轶夫, 孙玉军, 郭孝玉. 基于BP神经网络的马尾松立木生物量模型研究[J]. 北京林业大学学报, 2013, 35(2):17−21. Wang Y F, Sun Y J, Guo X Y. Single-tree biomass modeling of Pinus massoniana based on BP neural network[J]. Journal of Beijing Forestry University, 2013, 35(2): 17−21. [15] 解雅麟, 王海燕, 雷相东. 基于3-PG模型的长白落叶松人工林生长和生物量模拟[J]. 南京林业大学学报(自然科学版), 2018, 42(1):141−148. Xie Y L, Wang H Y, Lei X D. Growth and biomass simulation of Larix olgensis plantations based on 3-PG model[J]. Journal of Nanjing Forestry University(Natural Science Edition), 2018, 42(1): 141−148. [16] 国家林业与草原局. 立木生物量模型及碳计量参数落叶松[S]. 北京: 中国标准出版社, 2016. National Forestry and Grassland Administration of the People ’s Republic of China. Tree biomass models and related parameters to carbon accounting for Larix[S]. Beijing: Standards Press of China, 2016. [17] Goodfellow I, Bengio Y, Courville A, et al. Deep learning[M]. Cambridge: MIT Press, 2016. [18] Uzun H, Yıldız Z, Goldfarb J L, et al. Improved prediction of higher heating value of biomass using an artificial neural network model based on proximate analysis[J]. Bioresource Technology, 2017, 234: 122−130. doi: 10.1016/j.biortech.2017.03.015 [19] Tieleman T, Hinton G. Lecture 6.5-rmsprop: divide the gradient by a running average of its recent magnitude[J]. COURSERA: Neural Networks for Machine Learning, 2012, 4(2): 26−31. [20] Xiao X, White E P, Hooten M B, et al. On the use of log-transformation vs. nonlinear regression for analyzing biological power laws[J]. Ecology, 2011, 92(10): 1887−1894. doi: 10.1890/11-0538.1 [21] 符利勇, 雷渊才, 孙伟, 等. 不同林分起源的相容性生物量模型构建[J]. 生态学报, 2014, 34(6):1464−1470. Fu L Y, Lei Y C, Sun W, el al. Development of compatible biomass models for trees from different stand origin[J]. Acta Ecologica Sinica, 2014, 34(6): 1464−1470. [22] Özçelik R, Diamantopoulou M J, Brooks J R, et al. Estimating tree bole volume using artificial neural network models for four species in Turkey[J]. Journal of Environmental Management, 2010, 91(3): 742−753. -