Processing math: 28%
  • Scopus收录期刊
  • CSCD(核心库)来源期刊
  • 中文核心期刊
  • 中国科技核心期刊
  • F5000顶尖学术来源期刊
  • RCCSE中国核心学术期刊
高级检索

基于分位数回归法的杉木可变指数削度方程构建

梁瑞婷, 孙玉军, 周来

梁瑞婷, 孙玉军, 周来. 基于分位数回归法的杉木可变指数削度方程构建[J]. 北京林业大学学报, 2021, 43(7): 70-78. DOI: 10.12171/j.1000-1522.20200253
引用本文: 梁瑞婷, 孙玉军, 周来. 基于分位数回归法的杉木可变指数削度方程构建[J]. 北京林业大学学报, 2021, 43(7): 70-78. DOI: 10.12171/j.1000-1522.20200253
Liang Ruiting, Sun Yujun, Zhou Lai. Modeling variable exponential taper function for Cunninghamia lanceolata based on quantile regression[J]. Journal of Beijing Forestry University, 2021, 43(7): 70-78. DOI: 10.12171/j.1000-1522.20200253
Citation: Liang Ruiting, Sun Yujun, Zhou Lai. Modeling variable exponential taper function for Cunninghamia lanceolata based on quantile regression[J]. Journal of Beijing Forestry University, 2021, 43(7): 70-78. DOI: 10.12171/j.1000-1522.20200253

基于分位数回归法的杉木可变指数削度方程构建

基金项目: 国家林业和草原局林业科学技术推广项目([2019]06)
详细信息
    作者简介:

    梁瑞婷。主要研究方向:森林资源监测与模型。Email:15600990723@163.com 地址:100083北京市海淀区清华东路35号北京林业大学林学院

    责任作者:

    孙玉军,教授,博士生导师。主要研究方向:森林资源监测与模型。 Email:sunyj@bjfu.edu.cn 地址:同上

  • 中图分类号: S758.2

Modeling variable exponential taper function for Cunninghamia lanceolata based on quantile regression

  • 摘要:
      目的  采用非线性分位数回归法构建不同分位点的杉木可变指数削度方程,与非线性模型进行比较,以提高杉木干形的预测精度。
      方法  利用福建省将乐国有林场的73 株(793组)杉木解析木数据,选取4个可变指数削度方程,基于5折交叉验证,分别采用非线性分位数回归与非线性回归构建削度方程。选用调整后决定系数(R2)、均方根误差(RMSE)、平均误差(ME)、相对误差(RE)和平均绝对误差(MAE)5个模型评价指标,结合图形对各模型的拟合结果和预测结果进行评价。
      结果  (1)4个可变指数削度方程在5个分位点(t = 0.1, 0.3, 0.5, 0.7, 0.9)处均能收敛,说明分位数回归可以建立不同分位点的估测模型,能更全面地描述杉木干形的变化。(2)4个削度方程在分位点为0.5处的精度最高,R2均在0.97左右。对于削度方程M1和M3,基于中位数回归(t = 0.5)的拟合精度与预测精度均高于非线性回归,且M1的预测值更加集中。(3)在不同分位点下,各模型对树干不同位置的预测精度不同,分位值为0.9和0.3的模型分别对梢头部分和树干基部的预测精度最高。
      结论  基于分位数回归的可变指数削度方程不仅能精确预测平均条件下杉木的树干直径,而且能预测任意分位条件下杉木干形的变化趋势。不同分位点模型对树干不同位置的预测精度不同,基于M1削度方程,建立多分位点回归模型能进一步提高研究区杉木干形的预测精度。
    Abstract:
      Objective  In order to improve prediction accuracy of Chinese fir stem profile, we used nonlinear quantile regression to establish variable exponential taper equations at different quantile points, and compared their fitting and prediction accuracy with nonlinear regression model.
      Method  This study took 73 Chinese fir (Cunninghamia lanceolata) stem data from the Jiangle Forest Farm in Fujian Province of eastern China. Then we selected 4 variable exponential taper equations, and based on 5-fold cross-validation, used nonlinear quantile regression and nonlinear regression to establish taper equations, respectively. Five model evaluation indicators were selected, including the adjusted coefficient of determination (R2), root mean square error (RMSE), average error (ME), relative error (RE) and average absolute error (MAE), combined with graphs to evaluate the fitting and prediction results.
      Result  The research results showed: (1) the 4 variable exponential taper equations converged at all quantile points (t = 0.1, 0.3, 0.5, 0.7, 0.9), indicating that quantile regression can develop different models at different quantiles. So this method can describe the change of Chinese fir stem shape more comprehensively. (2) The accuracy of four taper equations at the quantile point of 0.5 was all higher than others, with R2 about 0.97. For taper equations M1 and M3, the fitting and prediction accuracy based on the median regression (t = 0.5) were both higher than those of nonlinear regression. And the prediction values of the M1 equation were more concentrated. (3) At different quantile points, models had different prediction accuracies for varied stem positions. Models with quantile values of 0.9 and 0.3 had the highest prediction accuracy for the stem top part and the base part, respectively.
      Conclusion  The variable exponential taper equations developed by quantile regression can not only accurately predict stem diameters under average condition, but also predict the changing trend of stem shape under arbitrary quantile conditions. Quantile models have different prediction accuracies for varied stem positions. The multi-quantile regression model of M1 can further improve the prediction accuracy of the Chinese fir stem profile.
  • 削度方程是指描述树干直径随着树高的增加而不断变化的方程,用以描述树干形状,故也称为干曲线方程。一般是利用树木胸径、树高、截面高等易测量的林木特征因子作为自变量预测截面直径的多元线性或非线性回归方程[1]。削度方程可以准确预测树干任意高度处的直径,是现代森林清查和林业管理体系的重要工具[2],被广泛用于估算树干上部直径、计算商品材积和出材率,以及重建树干轮廓等研究中。

    国外关于林木干形与削度模型的研究略早于国内,最早的干曲线概念由Kunze提出[3]。之后,削度模型不断发展,根据模型的研究方法,可以分为简单模型、分段模型[4]和可变指数模型。根据是否与材积相容,可分为一致性削度方程和非一致性削度方程。近年来,为了解决单木的自相关,又提出了混合效应模型和多元参数回归模型[5-9]。在不同形式方程的参数估计时,最常用的方法是最小二乘法(OLS)[10]。该方法是基于期望条件下的回归,需要严格的统计学假设条件,数据分布需要满足独立、正态和等方差,而树木生长具有连续性和相关性,难以满足这些要求[11]。另一方面,平均回归估计只能描述因变量的条件均值或中心效应,不能描述非中心条件下的数据结构[12]

    分位数回归是一种利用条件变量来构建模型的方法,可以选取多个分位点对数据结构进行分析,自1978年由Koenker等人提出以来就得到迅速的推广和发展[11]。该方法对研究数据的分布没有严格要求,而且几乎不受异常点的影响,对数据的拟合更为稳健,这对降低由于林木生长异常或数据测量失误等带来的误差具有重要意义。此外,分位数回归不仅可以描述均值条件下自变量与因变量的回归关系,还可以给出响应变量的完整条件分布[13-14],相较非线性回归更为灵活全面。近年来分位数回归开始应用到林业的研究中,如高慧淋等[15]分别基于分位数回归法、最小二乘法和最大似然法建立了长白落叶松(Larix olgensis)人工林最大密度线模型,发现分位数回归模型的参数估计结果更为稳定;赵梦草等[16]基于分位数回归研究针阔混交林中树高、胸径和活枝高的相关关系,分别构建了一元和二元线性分位数回归模型;张冬燕等[17]基于非线性分位数回归构建了混交林中树高预测模型,发现非线性分位数回归预测模型的精度更高。

    杉木(Cunninghamia lanceolata)是我国南方主要的用材树种,具有速生优质的特性,建立精确的削度方程对杉木干形预测和材积计算具有重要意义。目前,已有利用分位数回归模拟樟子松(Pinus sylvestris)和落叶松(Larix spp.)干形的研究[10, 12, 18],但基于分位数回归估测杉木树干削度尚未见报道。本文以杉木为对象,选取4个具有不同参数个数的可变指数削度方程,基于5折交叉验证,采用分位数回归法构建不同分位点的杉木可变指数削度方程,并与非线性回归结果进行比较分析,为杉木干形的精确预测提供参考。

    本研究的杉木解析木数据来源于福建省将乐国有林场(117°05′ ~ 117°40′E,26°26′ ~ 27°04′N)。年均温度20 ℃左右,年均降水量约2 700 mm,气候温暖湿润,雨热同期,海拔约400 ~ 800 m,土壤肥沃深厚,主要树种组成有:杉木、马尾松(Pinus massoniana)、毛竹(Phyllostachys edulis)等。

    研究所用的杉木干形数据来自将乐国有林场不同年龄和不同林分的杉木人工林。伐倒样木前,测量树高(H)和胸径(D),按1 m区分段截取圆盘,不足1 m的区分段作为梢头。同时,在树干基部0.01 m和胸径1.3 m处也分别截取圆盘,然后测量每个圆盘东西、南北两个方向的直径,计算平均值作为对应高度处的直径。共计793组干形数据,样木的各调查因子统计情况见表1

    表  1  杉木调查因子统计表
    Table  1.  Basic statistic information of sample trees
    项目 Item最小值 Min.最大值 Max.平均值 Mean中位数 Median标准差 SD变异系数 CV
    树干直径 Stem diameter (di)/cm 0.96 54.00 11.81 11.43 5.987 4.490
    树干高 Height along stem (hi)/m 0.0 25.0 8.0 7.0 5.980 3.141
    胸径 DBH (D)/cm 4.90 28.40 17.23 17.12 5.003 1.365
    树高 Tree height (H)/m 4.1 25.5 17.3 18.2 5.980 1.236
    下载: 导出CSV 
    | 显示表格

    相较于简单削度方程和分段削度方程,可变指数方程的拟合精度更高[19],可以较精准地描述不同树干干形和同一林木不同高度的干形变化,是未来的发展方向[20]。根据前人研究选择4个具有不同参数个数、较适宜描述杉木干形的可变指数削度方程作为基础模型[1, 3, 21],方程的形式如下:

    diD=(HhiH1.3)(b1+b2)(hiH)14+b3(hiH)12+b4(hiH) (1)
    di=D(b1+b2log(1hiH)13)(1eb1b2) (2)
    di=b1Db2(1hiH)b3(hiH)2+b4hiH+b5 (3)
    di=b1D(Hhi)b3Hb4 (4)

    式中:di为树干直径,hi为树干高,D为胸径,H为树高;b1b2b3b4b5为参数。

    分位数回归相当于将传统回归方法与条件分位数相结合,通过拟合任意分位点的数据,构建多个回归模型,从而描述完全条件分布下自变量与因变量之间的关系。其原理是把损失函数从传统的最小二乘法变成加权的最小二乘法,通过最小化加权离差的绝对值之和来获得方程参数。

    QT=1n(i:Yi (5)

    式中:QT为损失函数,n为样本数量,T为不同分位点,Yi为不同分位点的估计值,xi为实测值, {\varepsilon _T} 是分位点为T时的观测值, {\hat f} ({x_i}) 是函数表达式。

    参数估计使损失函数QT最小,是基于非对称形式的绝对值残差最小化,给不同的Yi值不同的权重,T在0 ~ 1之间内任意取值,模型的参数随着T值的变化而变化。

    当取分位点T = t时,权重分别是t和1−t,通过最小化分位数函数QT获得模型的参数,就可以得到该条件下的分位数模型。在不同的分位点下,得到QT函数的参数估计量不同,从而可以得到任意条件下的回归参数。由于分位数回归的损失函数采用加权的绝对离差思想,能有效克服最小二乘回归估计易受异常数据干扰的缺点,得到的回归估计更加稳健。

    K折交叉验证是将所有数据分割成K个子样本,不重复的选取其中一个子样本作为测试集,其他K−1个样本用来训练。共重复K次,平均K次的结果作为最终的模型评价指标。使用K折交叉验证可以防止建模样本和检验样本选择不佳而导致模型的精度偏低,而且能够从同样的样本数据中尽可能获得更多的信息。

    本文采用的是5折交叉验证。针对每个削度方程,用R 4.0.0的quantile包的nlrq()分别建立分位点为0.1、0.3、0.5、0.7和0.9的5个非线性分位数回归模型,用R4.0.0语言的nls()函数建立非线性回归模型,同时,对传统非线性回归采用自相关函数CAR(2)来消除自相关性。

    本研究选择的模型评价指标是平均误差(ME)、调整后决定系数(R2)、均方根误差(RMSE)、相对误差(RE)和平均绝对误差(MAE)。具体计算公式:

    {\rm{ME}} = \frac{{\displaystyle \sum\limits_{i = 1}^n {\left( {{y_i} - {{{\hat y} }_i}} \right)} }}{n} (6)
    {\rm{RMSE}} = \sqrt {\frac{{\displaystyle \sum\limits_{i = 1}^n {{{\left( {{y_i} - {{{\hat y} }_i}} \right)}^2}} }}{{ {n - m} }}} (7)
    {\rm{RE}} = \sum\limits_{i = 1}^n {\left| {\frac{{{y_i} - {{{\hat y} }_i}}}{{{{\bar y}_i}}}} \right|} \times 100 (8)
    {\rm{MAE}} = \frac{{\displaystyle \sum\limits_{i = 1}^n {\left| {{y_i} - {{{\hat y} }_i}} \right|} }}{n} (9)
    {R^2} = 1 - \frac{{\displaystyle \sum\limits_{i = 1}^n {{{\left( {{y_i} - {{{\hat y} }_i}} \right)}^2}} }}{{\displaystyle \sum\limits_{i = 1}^n {{{\left( {{y_i} - {{\bar y}_i}} \right)}^2}} }} \times \frac{{n - 1}}{{n - m}} (10)

    式中:n为样本数,m为参数个数,yi为不同树高处直径的实测值,\hat y为预测值, {{\bar y}_i} 为观测值的均值。

    分别采用非线性回归和分位数回归构建杉木的削度方程,每个削度方程选取5个不同的分位点(t = 0.1,0.3,0.5,0.7,0.9)进行拟合,结果见表2。分位数回归选用不同的分位点时,各削度方程的参数均有所变动,会产生不同的估计结果;各削度方程参数的变动程度不同,没有表现出特定的规律;非线性回归参数均在分位数回归参数的变动范围内,说明分位数回归可以主观地选取任意分位值对数据进行拟合,所得到的回归模型会随着分位点的不同而产生不同的拟合结果,其稳健性要优于非线性回归。

    根据表2所建立的削度方程,计算各方程的调整后决定系数(R2)、平均绝对误差(MAE)、均方根误差(RMSE)、相对误差(RE)和平均误差(ME)5个模型评价指标,比较分位数回归与非线性回归的拟合结果(表3)。可以看出,无论是采用非线性回归还是分位数回归,其R2均在0.90以上,RMSE在1 cm左右,说明这4个削度方程都能较好地描述杉木干形。比较不同分位点的拟合结果可以看出,不同分位点的拟合精度不同;4个削度方程都是分位点为0.5的拟合精度最高;中位数回归与非线性回归的拟合结果相近。其中,模型M1、模型M3和模型M4的拟合精度高于非线性回归,R2分别增加了0.03、0.02和0.04,RMSE分别降低了19.2%、1.36%和8.00%,其余模型评价指标MAE、RE和ME也比非线性回归模型更小。

    表  3  基于非线性回归与分位数回归的各削度方程的拟合结果
    Table  3.  Fit-goodness statistics of taper functions based on nonlinear regression and quantile regression
    模型 Model建模方法 Modeling method分位点 Quantile模型的评价指标 Evaluation index of the model
    R2MAE/cmRMSE/cmREME/cm
    M1 非线性回归 Nonlinear regression 0.972 0.635 0.990 3 379.627 0.018
    分位数回归 Quantile regression 0.1 0.940 0.953 1.427 5 076.793 0.843
    0.3 0.960 0.699 1.122 4 391.152 0.192
    0.5 0.975 0.627 0.801 3 337.980 −0.017
    0.7 0.970 0.702 1.067 3 738.042 −0.310
    0.9 0.930 1.089 1.542 5 799.579 −0.922
    0.960 0.830 1.172 4 421.905 0.016
    M2 非线性回归 Nonlinear regression 0.971 0.704 1.022 3 749.541 0.017
    分位数回归 Quantile regression 0.1 0.920 1.329 1.742 7 076.160 1.263
    0.3 0.950 0.932 1.303 4 961.605 0.629
    0.5 0.968 0.825 1.180 4 395.446 −0.012
    0.7 0.950 0.940 1.320 5 003.610 −0.423
    0.9 0.900 1.473 1.877 7 844.500 −1.292
    M3 非线性回归 Nonlinear regression 0.972 0.731 1.090 3 892.878 0.032
    分位数回归 Quantile regression 0.1 0.940 1.062 1.484 5 656.519 0.999
    0.3 0.960 0.764 1.179 4 070.373 0.525
    0.5 0.974 0.626 1.008 3 397.303 −0.013
    0.7 0.970 0.785 1.102 4 182.318 −0.350
    0.9 0.920 0.309 1.685 6 969.442 −1.180
    M4 非线性回归 Nonlinear regression 0.975 0.734 1.022 3 949.541 0.170
    分位数回归 Quantile regression 0.1 0.940 0.953 1.472 5 076.793 0.843
    0.3 0.960 0.726 1.137 3 867.362 0.345
    0.5 0.979 0.710 1.003 3 781.487 −0.017
    0.7 0.960 0.800 1.165 4 259.591 −0.267
    0.9 0.920 1.141 1.664 7 513.007 −1.184
    下载: 导出CSV 
    | 显示表格
    表  2  非线性回归与分位数回归对各削度方程的参数估计结果
    Table  2.  Parameter estimates of taper function based on nonlinear regression and quantile regression
    模型 Model建模方法 Modeling method分位点 Quantile模型参数 Parameters of model
    b1b2b3b4b5
    M1 非线性回归 Nonlinear regression 0.783 3 −3.151 0 1.841 7 1.158 8
    分位数回归 Quantile regression 0.1 −0.181 2 −0.500 4 0.231 5 1.194 4
    0.3 0.623 3 −2.716 6 1.659 8 1.155 7
    0.5 0.788 4 −3.388 2 2.068 0 1.191 0
    0.7 1.533 0 −5.229 0 3.185 1 1.143 0
    0.9 1.947 9 −6.171 4 3.604 2 1.149 8
    M2 非线性回归 Nonlinear regression 2.899 0 6.165 0
    分位数回归 Quantile regression 0.1 3.024 9 7.133 1
    0.3 2.868 6 6.263 2
    0.5 2.817 7 5.880 6
    0.7 2.769 8 5.519 8
    0.9 2.901 9 5.677 5
    M3 非线性回归 Nonlinear regression 1.446 6 0.914 6 1.182 4 −1.770 1 1.306 2
    分位数回归 Quantile regression 0.1 1.353 6 0.918 7 1.109 7 −1.422 7 1.188 5
    0.3 1.312 0 0.929 5 0.766 2 −0.963 6 0.974 8
    0.5 1.366 9 0.920 3 0.918 1 −1.223 2 1.029 3
    0.7 1.440 5 0.921 0 1.359 8 −1.960 8 1.317 8
    0.9 1.516 5 0.925 0 1.179 5 −2.099 3 1.482 4
    M4 非线性回归 Nonlinear regression 1.390 6 0.636 9 −0.727 4
    分位数回归 Quantile regression 0.1 1.331 0 0.754 1 −0.836 5
    0.3 1.294 7 0.677 3 −0.749 8
    0.5 1.293 5 0.629 2 −0.700 0
    0.7 1.323 9 0.574 5 −0.651 2
    0.9 1.598 4 0.565 1 −0.684 9
    注:M1、M2、M3和M4分别代表文中的公式(1)、公式(2)、公式(3)和公式(4)。下同。Notes: M1, M2, M3 and M4 represent formula (1), formula (2), formula (3) and formula (4), respectively. The same below.
    下载: 导出CSV 
    | 显示表格

    图1表示不同分位点回归模型对杉木干形的拟合结果,可以看出不同分位点下的树高和对应直径的关系有明显的独立趋势。基于不同分位点的曲线具有不同的形状,可以拟合的数据范围更广泛,无论是均值条件下的数据还是边缘数据,利用分位数回归方法都能进行拟合。分位数回归能更全面地描述杉木干形的变化,包含的信息也更为丰富,选取不同分位点能对整体的干形数据进行拟合,从而分析数据的整体结构。

    图  1  不同分位点模型对杉木干形拟合图
    Figure  1.  Cunninghamia lanceolata stem curve simulation of quantile regression

    基于5折交叉验证对各削度方程的预测能力进行检验,比较非线性回归模型和中位数回归模型的预测精度,结果见表4。从表4可以看出,基于中位数回归构建的削度方程M1、M2和M3的预测精度高于非线性回归,其MAE分别降低了75.23%、75.12%和16.9%,R2分别增加了0.03、0.05和0.09,其他模型评价指标RMSE、RE和ME也表现优于非线性回归。对于削度方程M4,虽然中位数回归的RMSE比非线性回归略大,但是其MAE、RE和ME分别比非线性回归减少11.44%、2.80%和45.16%。总体来看,中位数回归的预测精度高于非线性回归的预测精度。

    表  4  非线性回归模型与中位数回归模型的预测精度检验
    Table  4.  Prediction statistics of nonlinear regression models and median regression models
    模型
    Model
    非线性回归模型预测精度检验
    Prediction statistics of non-linear regression
    中位数回归模型预测精度检验
    Prediction statistics of median regression
    R2MAE/cmRMSE/cmREME/cmR2MAE/cmRMSE/cmREME/cm
    M1 0.972 0.638 0.994 850.911 0.017 0.975 0.158 0.801 797.121 0.007
    M2 0.961 0.832 1.180 1109.960 0.088 0.966 0.207 1.155 960.196 0.612
    M3 0.970 0.177 1.028 945.102 0.015 0.979 0.174 1.031 926.861 0.011
    M4 0.966 0.201 1.095 978.018 0.031 0.966 0.178 1.100 950.730 0.017
    下载: 导出CSV 
    | 显示表格

    为了分析中位数回归与非线性回归对树干不同位置的预测能力,分别计算非线性回归模型和中位数回归模型在不同树干部位的平均绝对误差(MAE),结果见图2。各模型对树干中部(相对高度在0.1 ~ 0.7)的预测精度较高,而对树干基部(相对高度为0 ~ 0.1)和树干上部(相对高度为0.8 ~ 1.0)的预测效果稍差。对树干的绝大部分部位,中位数回归得到的平均绝对误差(MAE)小于非线性回归,且4个削度方程均有此表现,说明中位数回归对杉木干形的预测精度更高。

    图  2  基于非线性回归与中位数回归的各削度方程对不同树高处截面直径的预测结果
    Figure  2.  Prediction results of taper function at different heights of stem based on nonlinear regression and median regression

    为了直观地检验中位数回归法对杉木树干不同部位的预测能力,利用上文建立的削度方程对杉木干形进行预测,结果见图3。可见,基于中位数回归法建立的4个可变指数削度方程对杉木干形均有较好的预测表现,预测值均匀地落在实测值的中部。削度方程M2对树干基部的预测效果偏差,削度方程M1、M3和M4的预测结果相近,但M1的预测值更为集中,说明M1方程更为稳健。

    图  3  中位数回归的杉木干形预测图
    散点为观测值,线条为中位数回归模型的预测曲线。Points are the observed values and the lines are predicting curves of the median regression models.
    Figure  3.  Stem profile prediction for Chinese fir based on median regression

    进一步分析不同分位点模型对树干不同部位的预测能力,以削度方程M1为例,计算各分位点模型的平均绝对误差(MAE),结果见图4。随着树干位置的变化,不同分位点模型对直径的预测精度不同,分位点0.7的削度方程对相对树高为0.9的位置处预测精度最高;分位点为0.9时则对相对树高1.0位置处的预测精度最高,其平均绝对误差(MAE)都小于1.0 cm;基于分位点0.3构建的削度方程对树干基部(相对树高为0 ~ 0.1)的预测精度最高,其平均绝对误差(MAE)约为0.75 cm;而基于分位点0.5构建的削度方程对树干绝大部分的预测精度更高。

    图  4  基于不同分位点对树干不同位置的预测结果
    Figure  4.  Prediction results of different stem positions based on varied quantiles

    削度方程在编制材种出材率、木材交易方面具有广泛的实用价值,过去对杉木削度方程的研究多基于传统线性或非线性回归[22-25]。为了提高杉木干形的预测精度,同时避免数据的分布不满足非线性回归的假设条件,本研究引入了分位数回归法构建杉木的削度方程。本研究发现,当分位点为0.5时,分位数回归模型的拟合精度和预测精度最高, R2在0.96 ~ 0.97之间,这与辛士冬等[26]的研究结果一致。

    基于多个分位点构建的杉木削度模型,既能够描述均值条件下干形数据的分布结构,也能够描述任意分位点树干高度与对应直径的关系。不同的分位条件下,树干高度和对应直径的关系有明显的独立趋势,不同分位点模型对树干不同位置的预测精度有所差别,说明分位数回归模型更具灵活性,付立华等[18]基于分位数回归对华北落叶松(Larix principis-rupprechtii)树干曲线的研究也有类似结论。本文的研究结果表明,分位点为0.9的模型更适宜描述梢头部分干形,分位点为0.3的模型则更适宜描述树干基部干形。由于传统回归对干形基部和梢头的拟合精度往往偏低[4],分位数回归可以通过构建不同分位点的回归模型,提高对树干不同位置的预测精度。

    本文构建的分位点为0.1、0.3、0.5、0.7和0.9的模型,每个分位点都具有丰富的信息,能够全面地描述杉木树干削度的变化,预测多个分位水平下杉木树干的直径。整体来看,基于不同分位点构建的4个杉木可变指数削度方程均能收敛,其R2在0.9以上,都能较好地描述杉木干形。对本研究选取的4个可变指数削度方程来说,大部分方程基于中位数回归的拟合精度和预测精度高于非线性回归。基于中位数回归构建的削度方程,其稳健性优于非线性回归,而且不同分位点模型对树干不同位置的预测精度不同,通过构建不同分位点的削度模型,可以提高干形的预测精度。对于研究区的杉木来说,基于削度方程M1建立多分位点回归模型能更准确地估测其干形。

  • 图  1   不同分位点模型对杉木干形拟合图

    Figure  1.   Cunninghamia lanceolata stem curve simulation of quantile regression

    图  2   基于非线性回归与中位数回归的各削度方程对不同树高处截面直径的预测结果

    Figure  2.   Prediction results of taper function at different heights of stem based on nonlinear regression and median regression

    图  3   中位数回归的杉木干形预测图

    散点为观测值,线条为中位数回归模型的预测曲线。Points are the observed values and the lines are predicting curves of the median regression models.

    Figure  3.   Stem profile prediction for Chinese fir based on median regression

    图  4   基于不同分位点对树干不同位置的预测结果

    Figure  4.   Prediction results of different stem positions based on varied quantiles

    表  1   杉木调查因子统计表

    Table  1   Basic statistic information of sample trees

    项目 Item最小值 Min.最大值 Max.平均值 Mean中位数 Median标准差 SD变异系数 CV
    树干直径 Stem diameter (di)/cm 0.96 54.00 11.81 11.43 5.987 4.490
    树干高 Height along stem (hi)/m 0.0 25.0 8.0 7.0 5.980 3.141
    胸径 DBH (D)/cm 4.90 28.40 17.23 17.12 5.003 1.365
    树高 Tree height (H)/m 4.1 25.5 17.3 18.2 5.980 1.236
    下载: 导出CSV

    表  3   基于非线性回归与分位数回归的各削度方程的拟合结果

    Table  3   Fit-goodness statistics of taper functions based on nonlinear regression and quantile regression

    模型 Model建模方法 Modeling method分位点 Quantile模型的评价指标 Evaluation index of the model
    R2MAE/cmRMSE/cmREME/cm
    M1 非线性回归 Nonlinear regression 0.972 0.635 0.990 3 379.627 0.018
    分位数回归 Quantile regression 0.1 0.940 0.953 1.427 5 076.793 0.843
    0.3 0.960 0.699 1.122 4 391.152 0.192
    0.5 0.975 0.627 0.801 3 337.980 −0.017
    0.7 0.970 0.702 1.067 3 738.042 −0.310
    0.9 0.930 1.089 1.542 5 799.579 −0.922
    0.960 0.830 1.172 4 421.905 0.016
    M2 非线性回归 Nonlinear regression 0.971 0.704 1.022 3 749.541 0.017
    分位数回归 Quantile regression 0.1 0.920 1.329 1.742 7 076.160 1.263
    0.3 0.950 0.932 1.303 4 961.605 0.629
    0.5 0.968 0.825 1.180 4 395.446 −0.012
    0.7 0.950 0.940 1.320 5 003.610 −0.423
    0.9 0.900 1.473 1.877 7 844.500 −1.292
    M3 非线性回归 Nonlinear regression 0.972 0.731 1.090 3 892.878 0.032
    分位数回归 Quantile regression 0.1 0.940 1.062 1.484 5 656.519 0.999
    0.3 0.960 0.764 1.179 4 070.373 0.525
    0.5 0.974 0.626 1.008 3 397.303 −0.013
    0.7 0.970 0.785 1.102 4 182.318 −0.350
    0.9 0.920 0.309 1.685 6 969.442 −1.180
    M4 非线性回归 Nonlinear regression 0.975 0.734 1.022 3 949.541 0.170
    分位数回归 Quantile regression 0.1 0.940 0.953 1.472 5 076.793 0.843
    0.3 0.960 0.726 1.137 3 867.362 0.345
    0.5 0.979 0.710 1.003 3 781.487 −0.017
    0.7 0.960 0.800 1.165 4 259.591 −0.267
    0.9 0.920 1.141 1.664 7 513.007 −1.184
    下载: 导出CSV

    表  2   非线性回归与分位数回归对各削度方程的参数估计结果

    Table  2   Parameter estimates of taper function based on nonlinear regression and quantile regression

    模型 Model建模方法 Modeling method分位点 Quantile模型参数 Parameters of model
    b1b2b3b4b5
    M1 非线性回归 Nonlinear regression 0.783 3 −3.151 0 1.841 7 1.158 8
    分位数回归 Quantile regression 0.1 −0.181 2 −0.500 4 0.231 5 1.194 4
    0.3 0.623 3 −2.716 6 1.659 8 1.155 7
    0.5 0.788 4 −3.388 2 2.068 0 1.191 0
    0.7 1.533 0 −5.229 0 3.185 1 1.143 0
    0.9 1.947 9 −6.171 4 3.604 2 1.149 8
    M2 非线性回归 Nonlinear regression 2.899 0 6.165 0
    分位数回归 Quantile regression 0.1 3.024 9 7.133 1
    0.3 2.868 6 6.263 2
    0.5 2.817 7 5.880 6
    0.7 2.769 8 5.519 8
    0.9 2.901 9 5.677 5
    M3 非线性回归 Nonlinear regression 1.446 6 0.914 6 1.182 4 −1.770 1 1.306 2
    分位数回归 Quantile regression 0.1 1.353 6 0.918 7 1.109 7 −1.422 7 1.188 5
    0.3 1.312 0 0.929 5 0.766 2 −0.963 6 0.974 8
    0.5 1.366 9 0.920 3 0.918 1 −1.223 2 1.029 3
    0.7 1.440 5 0.921 0 1.359 8 −1.960 8 1.317 8
    0.9 1.516 5 0.925 0 1.179 5 −2.099 3 1.482 4
    M4 非线性回归 Nonlinear regression 1.390 6 0.636 9 −0.727 4
    分位数回归 Quantile regression 0.1 1.331 0 0.754 1 −0.836 5
    0.3 1.294 7 0.677 3 −0.749 8
    0.5 1.293 5 0.629 2 −0.700 0
    0.7 1.323 9 0.574 5 −0.651 2
    0.9 1.598 4 0.565 1 −0.684 9
    注:M1、M2、M3和M4分别代表文中的公式(1)、公式(2)、公式(3)和公式(4)。下同。Notes: M1, M2, M3 and M4 represent formula (1), formula (2), formula (3) and formula (4), respectively. The same below.
    下载: 导出CSV

    表  4   非线性回归模型与中位数回归模型的预测精度检验

    Table  4   Prediction statistics of nonlinear regression models and median regression models

    模型
    Model
    非线性回归模型预测精度检验
    Prediction statistics of non-linear regression
    中位数回归模型预测精度检验
    Prediction statistics of median regression
    R2MAE/cmRMSE/cmREME/cmR2MAE/cmRMSE/cmREME/cm
    M1 0.972 0.638 0.994 850.911 0.017 0.975 0.158 0.801 797.121 0.007
    M2 0.961 0.832 1.180 1109.960 0.088 0.966 0.207 1.155 960.196 0.612
    M3 0.970 0.177 1.028 945.102 0.015 0.979 0.174 1.031 926.861 0.011
    M4 0.966 0.201 1.095 978.018 0.031 0.966 0.178 1.100 950.730 0.017
    下载: 导出CSV
  • [1] 曾伟生, 廖志云. 削度方程的研究[J]. 林业科学, 1997, 33(2):32−37.

    Zeng W S, Liao Z Y. A study on taper equation[J]. Scientia Silvae Sinicae, 1997, 33(2): 32−37.

    [2] 梁子瑜, 孙圆, 梁欣廉, 等. 基于地面激光扫描仪的树干削度方程提取[J]. 南京林业大学学报(自然科学版), 2014, 38(5):6−10.

    Liang Z Y, Sun Y, Liang X L, et al. The extraction of stem taper equation based on terrestrial laser scanning[J]. Journal of Nanjing Forestry University (Natural Science), 2014, 38(5): 6−10.

    [3] 胥辉, 孟宪宇. 天山云杉削度方程与材种出材率表的研究[J]. 北京林业大学学报, 1996, 18(3): 21−30.

    Xu H, Meng X Y. Study on taper function and merchantable volumn yielding rate table of Picea sehrenkiana var. tianshaca[J]. Journal of Beijing Forestry University, 1996, 18(3): 21−30.

    [4] 庞丽峰, 贾宏炎, 陆元昌, 等. 分段削度方程2种估计方法比较[J]. 林业科学, 2015, 51(12):141−148.

    Pang L F, Jia H Y, Lu Y C, et al. Comparison of two parameters estimation methods for segmented taper equations[J]. Scientia Silvae Sinicae, 2015, 51(12): 141−148.

    [5]

    Lanssanova L R, Machado S D A, Garrett A T D A, et al. Mixed-effect non-linear modelling for diameter estimation along the stem of Tectona grandis in mid-western Brazil[J]. Southern Forests: a Journal of Forest Science, 2019, 81(2): 167−173. doi: 10.2989/20702620.2018.1531279

    [6]

    Pukkala T, Hanssen K H, Andreassen K. Stem taper and bark functions for Norway spruce in Norway[J/OL]. Silva Fennica, 2019, 53(3): 10187 [2020−03−15]. https://doi.org/10.14214/sf.10187.

    [7] 韩飞. 落叶松人工林削度方程的研究[D]. 哈尔滨: 东北林业大学, 2010.

    Han F. The study of taper equation for Larix olgensis plantation[D]. Harbin: Northeast Forestry University, 2010.

    [8]

    Fonweban J, Gardiner B, Macdonald E, et al. Taper functions for Scots pine (Pinus sylvestris L.) and Sitka spruce (Picea sitchensis (Bong.) Carr.) in northern Britain[J]. Forestry, 2011, 84(1): 49−60. doi: 10.1093/forestry/cpq043

    [9]

    Rojo A, Perales X, Sánchez-Rodríguez F, et al. Stem taper functions for maritime pine (Pinus pinaster Ait.) in Galicia (Northwestern Spain)[J]. European Journal of Forest Research, 2005, 124(3): 177−186. doi: 10.1007/s10342-005-0066-6

    [10] 马岩岩, 姜立春. 基于非线性分位数回归的落叶松树干削度方程[J]. 林业科学, 2019, 55(10):68−75.

    Ma Y Y, Jiang L C. Stem taper function for Larix gmelinii based on nonlinear quantile regression[J]. Scientia Silvae Sinicae, 2019, 55(10): 68−75.

    [11]

    Zang H, Lei X, Zeng W. Height-diameter equations for larch plantations in northern and northeastern China: a comparison of the mixed-effects, quantile regression and generalized additive models[J]. Forestry, 2016, 89(4): 434−445. doi: 10.1093/forestry/cpw022

    [12]

    Cao Q V, Wang J. Evaluation of methods for calibrating a tree taper equation[J]. Forest Science, 2015, 61(2): 213−219. doi: 10.5849/forsci.14-008

    [13]

    Zhang B, Sajjad S, Chen K, et al. Predicting tree height-diameter relationship from relative competition levels using quantile regression models for Chinese fir (Cunninghamia lanceolata) in Fujian Province, China[J]. Forests, 2020, 11(2): 183−185. doi: 10.3390/f11020183

    [14] 谢晶晶. 非参数分位数回归模型估计方法的比较研究[D]. 厦门: 厦门大学, 2019.

    Xie J J. A comparative of nonparametric conditional quantile estimation[D]. Xiamen: Xiamen University, 2019.

    [15] 高慧淋, 董利虎, 李凤日. 基于分位数回归的长白落叶松人工林最大密度线[J]. 应用生态学报, 2016, 27(11):3420−3426.

    Gao H L, Dong L H, Li F R. Maximum density-size line for Larix olgensis based on quantile regression[J]. Chinese Journal of Applied Ecology, 2016, 27(11): 3420−3426.

    [16] 赵梦草, 顾海燕. 用分位数回归建立的混交林树高生长模型[J]. 东北林业大学学报, 2020, 48(2):24−28.

    Zhao M C, Gu H Y. Growth model of mixed forest tree height based on quantile regression[J]. Journal of Northeast Forestry University, 2020, 48(2): 24−28.

    [17] 张冬燕, 王冬至, 李晓, 等. 基于分位数回归的针阔混交林树高与胸径的关系[J]. 浙江农林大学学报, 2020, 37(3):424−431.

    Zhang D Y, Wang D Z, Li X, et al. Relationship between height and diameter at breast height (DBH) in minxed coniferous and broadleaved forest based on quantile regression[J]. Journal of Zhejiang A&F University, 2020, 37(3): 424−431.

    [18] 付立华, 侯金潮, 孙赫, 等. 基于分位数回归的华北落叶松干形曲线模拟[J]. 林业资源管理, 2020(1):151−157.

    Fu L H, Hou J C, Sun H, et al. Stem shape simulation for Larix principis-rupprechtii using quantile regression[J]. Forestry Resources Management, 2020(1): 151−157.

    [19] 张森森. 基于混合效应模型的可变密度可变指数削度方程构建研究[D]. 北京: 中国林业科学研究院, 2017.

    Zhang S S. Nonlinear mixed-effects modeling of variable exponent taper equations with density for Chinese fir[D]. Beijing: Chinese Academy of Forestry, 2017.

    [20] 梅光义, 孙玉军. 国内外削度方程研究进展[J]. 世界林业研究, 2015, 28(4):44−49.

    Mei G Y, Sun Y J. Research progress in stem taper equation[J]. World Forestry Research, 2015, 28(4): 44−49.

    [21] 梅光义. 杉木人工林生长模型与多功能经营模拟研究[D]. 北京: 北京林业大学, 2017.

    Mei G Y. Study on growth model and multi-functional simulation of chinese fir plantation [D]. Beijing: Beijing Forestry University, 2017.

    [22] 李婷婷. 浙江开化县林场杉木理论出材率表编制方法研究[D]. 北京: 北京林业大学, 2011.

    Li T T. Research on compiling method of theoretical yield rate table of Chinese fir in the forest farm of Kaihua County, Zhejiang [D]. Beijing: Beijing Forestry University, 2011.

    [23] 陈萍. 福建省主要用材树种杉木削度方程的研究[J]. 华东森林经理, 2005, 19(1):58−63.

    Chen P. Research on the taper equation of the main timber species Chinese fir in Fujian Province[J]. East China Forestry Manager, 2005, 19(1): 58−63.

    [24] 段爱国, 张建国, 童书振. 6种生长方程在杉木人工林林分直径结构上的应用[J]. 林业科学研究, 2003, 16(4):423−429.

    Duan A G, Zhang J G, Tong S Z. Application of six growth equations on stands diameter structure of Chinese fir plantations[J]. Forestry Science Research, 2003, 16(4): 423−429.

    [25] 王明亮. 理论造材: 削度方程和出材率表的编制[J]. 林业科学研究, 1998, 11(3):271−276.

    Wang M L. Theoretical bucking taper equations and merchantable volume tables[J]. Forestry Science Research, 1998, 11(3): 271−276.

    [26] 辛士冬, 姜立春. 利用分位数回归模拟人工樟子松树干干形[J]. 北京林业大学学报, 2020, 42(2):1−8.

    Xin S D, Jiang L C. Modeling stem taper profile for Pinus sylvestris plantations using nonlinear quantile regression[J]. Journal of Beijing Forestry University, 2020, 42(2): 1−8.

  • 期刊类型引用(20)

    1. 林文月,王锦,张喆. 基于视觉吸引的森林景观色彩要素识别及影响因素研究——以云南轿子山自然保护区为例. 西部林业科学. 2024(02): 133-141 . 百度学术
    2. 刘帅健,邓华锋. 基于PSPNet深度学习网络景观要素语义分割的春季森林景观质量评价. 西北林学院学报. 2024(03): 231-238 . 百度学术
    3. 尹佳仪,甘德欣. 长株潭绿心视觉美学质量及视觉异质性研究. 农业与技术. 2024(23): 93-98 . 百度学术
    4. 郎博帅,刘叶凡,韩阳媚,欧阳嗣航,李玉灵,程顺. 林内色彩斑块分布格局对秋季生态景观林美景度的影响——以塞罕坝机械林场为例. 林业与生态科学. 2023(01): 98-105 . 百度学术
    5. 陆子婧,王锦,张喆,刁秀丽,王钰,林文月. 植物色彩量化方法研究. 现代农业科技. 2022(02): 127-132 . 百度学术
    6. 张菲,李玉灵. 塞罕坝机械林场生态景观林空间结构对夏季景观质量的影响. 林业与生态科学. 2022(02): 206-212+216 . 百度学术
    7. 马薛骑,裘鸿菲,张群. 景观结构要素与色彩因子对滨水景观视觉质量的影响——以武汉东湖磨山景区为例. 西北林学院学报. 2022(03): 231-238+280 . 百度学术
    8. 贾娜,史久西,秦一心,格日勒图,张龙. 森林色彩景观格局指数与色彩属性指标对观赏效应的影响. 林业科学. 2021(02): 12-21 . 百度学术
    9. 贾娜,闫伟,史久西,格日乐图,车晓雨. 秋色叶树木树冠色彩特性对其观赏效应的影响. 林业科学. 2021(11): 37-48 . 百度学术
    10. 钟姝,赵曜,李雄,姚朋. 基于SBE法的北京植物园月季园植物组群美学评价. 中国城市林业. 2020(01): 66-70 . 百度学术
    11. 韩丽,马长乐. 基于SBE法的滨江公园美景度调查研究——以昆明市滨江公园为例. 江苏农业科学. 2020(10): 137-142 . 百度学术
    12. 李雨薇,彭培好,汪平. 森林景观色彩研究进展. 四川林业科技. 2020(03): 153-160 . 百度学术
    13. 赵凯,李金航,徐程扬. 侧柏人工林林分结构与色彩斑块间的耦合关系. 北京林业大学学报. 2019(01): 82-91 . 本站查看
    14. 马冰倩,徐程扬,刘江,常成,赵凯,孔祥琦,龙嘉翼. 城镇森林视觉景观异质性对美学质量的影响. 浙江农林大学学报. 2019(02): 366-374 . 百度学术
    15. 宋世杰,颜立红,颜玉娟,赖小连,雷佳伟. 基于SBE法的宅间植物景观美学评价研究. 中国城市林业. 2019(02): 17-21 . 百度学术
    16. 曹瑜娟,徐程扬,崔义,岳阳,任雅雪. 观景距离和光照条件对黄栌林景观色彩的影响. 中南林业科技大学学报. 2019(05): 22-29+48 . 百度学术
    17. 李苹,毛斌,许丽娟,吴鞠,刘海轩,徐程扬. 密度、灌草盖度和树干形态对油松人工风景林林内景观指数的影响. 北京林业大学学报. 2018(10): 115-122 . 本站查看
    18. 马冰倩,徐程扬,崔义. 八达岭秋季景观整体色彩组成对美景度的影响. 西北林学院学报. 2018(06): 258-264 . 百度学术
    19. 王子,荣媛,李明阳,钱春花. 森林景观色彩评价研究. 世界林业研究. 2017(03): 41-45 . 百度学术
    20. 张喆,郄光发,王成,姜莎莎. 多尺度植物色彩表征及其与人体响应的关系. 生态学报. 2017(15): 5070-5079 . 百度学术

    其他类型引用(15)

图(4)  /  表(4)
计量
  • 文章访问数:  1151
  • HTML全文浏览量:  397
  • PDF下载量:  69
  • 被引次数: 35
出版历程
  • 收稿日期:  2020-08-15
  • 修回日期:  2020-10-04
  • 网络出版日期:  2021-06-06
  • 发布日期:  2021-07-24

目录

/

返回文章
返回