高级检索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

利用分位数组合预测兴安落叶松枝下高

王君杰 姜立春

王君杰, 姜立春. 利用分位数组合预测兴安落叶松枝下高[J]. 北京林业大学学报. doi: 10.12171/j.1000-1522.20200075
引用本文: 王君杰, 姜立春. 利用分位数组合预测兴安落叶松枝下高[J]. 北京林业大学学报. doi: 10.12171/j.1000-1522.20200075
Wang Junjie, Jiang Lichun. Predicting height to crown base for Larix gmelinii using quantile groups[J]. Journal of Beijing Forestry University. doi: 10.12171/j.1000-1522.20200075
Citation: Wang Junjie, Jiang Lichun. Predicting height to crown base for Larix gmelinii using quantile groups[J]. Journal of Beijing Forestry University. doi: 10.12171/j.1000-1522.20200075

利用分位数组合预测兴安落叶松枝下高

doi: 10.12171/j.1000-1522.20200075
基金项目: 国家自然科学基金项目(31570624),黑龙江省应用技术研究与开发计划项目(GA19C006),中央高校基本科研业务费专项(2572019CP15), 黑龙江省头雁创新团队计划
详细信息
    作者简介:

    王君杰,博士生。主要研究方向:林分生长与收获模型。Email:wang.junjie521@qq.com 地址:150040黑龙江省哈尔滨市香坊区和兴路26号东北林业大学林学院

    通讯作者:

    姜立春,教授,博士生导师。主要研究方向:林分生长与收获模型。Email:jlichun@nefu.edu.cn 地址:同上

  • 中图分类号: S757

Predicting height to crown base for Larix gmelinii using quantile groups

  • 摘要:   目的  本文使用分位数回归和分位数组合对枝下高进行建模和预测,为单木枝下高模型的构建提供新的思路和方法。  方法  利用大兴安岭新林区4个林场的兴安落叶松天然林实测数据,采用非线性回归构建枝下高基础和广义模型并分别扩展到分位数回归。使用三分位数组合($\tau {\text{ = }}$ 0.1, 0.5, 0.9)、五分位数组合($\tau {\text{ = }}$ 0.1, 0.3, 0.5, 0.7, 0.9)、九分位数组合($\tau {\text{ = }}$ 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9)和4种抽样设计(抽最大树、抽最小树、抽平均木、随机抽取)进行预测,比较不同分位数组合的预测效果并分析不同抽样设计对预测精度的影响。同时使用双重交叉检验对非线性回归、最优位数回归和最优分位数组合进行比较。模型拟合和检验的评价指标主要包括平均绝对误差(MAE)、均方根误差(RMSE)、相对误差(MPE)和调整确定系数(${{R}}_{{\rm{adj}}}^2$)。  结果  (1)无论是非线性回归还是分位数回归,广义模型的拟合MAE较基础模型可降低6% ~ 12%,RMSE可降低6% ~ 10%,检验效果也优于基础模型。枝下高与胸径呈负相关、与样地优势高和每公顷断面积呈正相关。(2)中位数回归在所有分位数中拟合能力最好,且效果与非线性回归相似。分位数回归可以描述枝下高的分布。(3)3种分位数组合都可以对枝下高模型进行预测且效果相差不大,三分位数组合就可以满足枝下高的预测精度。中位数回归的交叉检验结果与非线性回归相似,三分位数组合的预测能力最优,MAE和MPE较非线性回归和中位数回归分别下降了20%和4%左右,${{R}}_{{\rm{adj}}}^2$提高了16%左右。(4)基础和广义分位数组合的最优抽样设计分别为抽平均木5株和抽大树7株。  结论  本研究基于三分位数组合($\tau {\text{ = }}$ 0.1, 0.5, 0.9)的枝下高模型可以提高预测精度,具体应用基础和广义分位数组合模型的最优抽样设计分别为抽平均木5株和抽大树7株。综合预测精度和调查成本的考虑,在实践中应用分位数组合时,推荐在样地中抽取5 株平均木对枝下高进行预测。
  • 图  1  非线性回归和基于5个分位点(0.1、0.3、0.5、0.7和0.9)的分位数回归的基础(A)和广义模型(B)的模拟曲线

    Figure  1.  Graphs of observed values (grey dots), simulation curves (grey curves) generated by the basic (A) and generalized nonlinear regression (B) and simulation curves (black curves) generated by the basic quantile regression (A) and generalized quantile regression (B) based on five quantiles (0.1, 0.3, 0.5, 0.7 and 0.9)

    图  2  广义模型的协变量对枝下高影响的模拟

    Figure  2.  Simulation on the effects of generalized model’s covariates on HCB

    图  3  分位数组合模型的预测误差比较

    a、e. 抽大树;b、f. 抽小树;c、g. 抽平均木;d、h. 随机抽取。a, e, the largest DBH sampling; b, f, the smallest DBH sampling; c, g, the mean DBH sampling; d, h, random sampling.

    Figure  3.  Comparison of prediction errors of quantile groups

    表  1  落叶松天然林各样木调查因子数据统计

    Table  1.   Deseriptive statistics for Larix gmelinii sample trees

    变量 Variable组1 Group 1组2 Group 2
    平均值
    Mean value
    标准差
    STD
    最小值
    Min.
    最大值
    Max.
    平均值
    Mean value
    标准差
    STD
    最小值
    Min.
    最大值
    Max.
    树高 Total tree height (THT)/m 11.0 3.3 3.4 23.8 10.6 3.1 3.7 23.3
    枝下高 Height to crown base (HCB)/m 5.3 2.3 0.7 13.8 5.3 2.2 0.6 14.4
    胸径 Diameter at breast height (DBH)/cm 11.1 4.4 5.0 28.6 10.7 4.2 5.0 32.5
    优势高 Dominant height (HDOM)/m 15.9 2.4 11.1 19.7 15.6 2.3 11.3 22.0
    每公顷断面积/(m2·hm−2)
    Basal area per hectare (BA)/(m2·ha−1)
    17.9 8.6 4.5 37.5 18.1 7.0 2.9 31.7
    每公顷株数/(株·hm−2)
    Number of trees per hectare/(tree·ha−1)
    1 705.0 937.0 483.0 4 400.0 1 843.0 680.0 183.0 3 450.0
    下载: 导出CSV

    表  2  非线性回归和分位数回归的参数估计和拟合统计量

    Table  2.   Parameter estimation and fitting statistics for nonlinear regression and quantile regression at nine quantiles

    参数估计方法
    Parameter estimating method
    模型 Model${\;\beta _0}$${\;\beta _1}$${\;\beta _2}$${\;\beta _3}$${\;\beta _4}$平均绝对误差
    MAE/m
    均方根误差
    RMSE/m
    非线性回归
    Nonlinear regression
    基础模型 Basic model 0.238 6 −0.016 5 1.180 8 1.480 8
    广义模型 Generalized model 0.974 0 −0.045 6 0.045 1 −0.041 3 −0.014 3 1.066 1 1.366 0
    分位数回归
    Quantile regression
    基础模型 Basic model
    $\tau = 0.1$ 1.318 1 −0.040 6 2.139 0 2.545 3
    $\tau = 0.2$ 1.008 0 −0.039 9 1.629 2 1.983 7
    $\tau = 0.3$ 0.700 7 −0.031 9 1.351 6 1.666 6
    $\tau = 0.4$ 0.432 4 −0.023 3 1.218 6 1.514 8
    $\tau = 0.5$ 0.186 2 −0.014 4 1.179 3 1.482 0
    $\tau = 0.6$ −0.071 0 −0.005 6 1.220 0 1.557 2
    $\tau = 0.7$ −0.278 8 0.000 7 1.327 3 1.704 7
    $\tau = 0.8$ −0.541 0 0.008 9 1.542 8 1.959 2
    $\tau = 0.9$ −0.797 7 0.013 6 1.900 7 2.333 6
    广义模型 Generalized model
    $\tau = 0.1$ 1.998 3 −0.054 0 0.044 8 −0.054 5 −0.015 0 1.884 4 2.280 4
    $\tau = 0.2$ 1.732 9 −0.065 2 0.053 5 −0.049 6 −0.017 3 1.438 3 1.799 4
    $\tau = 0.3$ 1.494 7 −0.050 7 0.049 3 −0.052 8 −0.017 7 1.212 5 1.547 3
    $\tau = 0.4$ 1.239 8 −0.052 4 0.052 7 −0.050 4 −0.014 8 1.101 7 1.411 7
    $\tau = 0.5$ 1.023 3 −0.046 1 0.049 1 −0.048 2 −0.014 0 1.064 8 1.368 6
    $\tau = 0.6$ 0.725 8 −0.039 9 0.047 0 −0.043 6 −0.011 6 1.098 8 1.417 0
    $\tau = 0.7$ 0.528 0 −0.037 8 0.044 6 −0.041 1 −0.009 9 1.203 8 1.553 1
    $\tau = 0.8$ 0.250 2 −0.031 4 0.042 6 −0.037 4 −0.009 1 1.405 0 1.784 1
    $\tau = 0.9$ −0.131 6 −0.021 8 0.035 7 −0.028 0 −0.009 9 1.787 8 2.187 0
    下载: 导出CSV

    表  3  非线性回归、中位数回归和使用最优抽样设计的三分位数组合的交叉检验统计量

    Table  3.   Two-fold evaluation statistics of nonlinear regression, median quantile regression and three quantile groups using optimal sampling design

    参数估计方法
    Parameter estimating method
    模型
    Model
    平均绝对误差
    MAE/m
    均方根误差
    RMSE/m
    相对误差
    MPE/%
    ${{R}}_{\rm{adj}}^2$
    非线性回归
    Nonlinear regression
    基础模型
    Basic model
    1.187 7 1.490 2 22.488 6 0.565 4
    广义模型
    Generalized model
    1.079 4 1.382 4 20.436 9 0.625 1
    分位数回归
    Quantile regression
    基础中位数回归
    Basic median regression ($\tau = 0.5$)
    1.185 1 1.490 7 22.440 1 0.565 3
    广义中位数回归
    Generalized median regression ($\tau = 0.5$)
    1.082 0 1.388 4 20.486 6 0.621 9
    分位数组合
    Quantile group
    基础三分位数组合
    Basic three quantiles group ($\tau {{ = 0}}{\rm{.1,}}\;0.5,\;0.9$)
    0.958 9 1.317 8 18.154 8 0.659 4
    广义三分位数组合
    Generalized three quantile group ($\tau {{ = 0} }{\rm{.1,} }\;0.5,\;0.9$)
    0.854 7 1.188 4 16.183 3 0.723 1
    下载: 导出CSV
  • [1] Ritchie M W, Hann D W. Equations for predicting height to crown base for fourteen tree species in southwest Oregon[R]. Corvallis: Oregon State University, 1987: 1−14.
    [2] Rijal B, Weiskittel A R, Kershaw J A, Jr. Development of height to crown base models for thirteen tree species of the North American Acadian Region[J]. The Forestry Chronicle, 2012, 88(1): 60−73. doi:  10.5558/tfc2012-011
    [3] 李想, 董利虎, 李凤日. 基于联立方程组的人工樟子松枝下高模型构建[J]. 北京林业大学学报, 2018, 40(6):9−18.

    Li X, Dong L H, Li F R. Building height to crown base models for Mongolian pine plantation based on simultaneous equations in Heilongjiang Province of northeastern China[J]. Journal of Beijing Forestry University, 2018, 40(6): 9−18.
    [4] Russell M B, Weiskittel A R, Kershaw J A. Comparing strategies for modeling individual-tree height and height-to-crown base increment in mixed-species Acadian forests of northeastern North America[J]. European Journal of Forest Research, 2014, 133(6): 1121−1135. doi:  10.1007/s10342-014-0827-1
    [5] Sharma R P, Vacek Z, Vacek S, et al. Modelling individual tree height to crown base of Norway spruce (Picea abies (L.) Karst.) and European beech (Fagus sylvatica L.)[J/OL]. PLoS ONE, 2017, 12(10): e0186394 [2020−01−02]. https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0186394.
    [6] 段光爽, 李学东, 冯岩, 等. 基于广义非线性混合效应的华北落叶松天然次生林枝下高模型[J]. 南京林业大学学报 (自然科学版), 2018, 42(2):170−176.

    Duan G S, Li X D, Feng Y, et al. Generalized nonlinear mixed-effects crown base height model of Larix principis-rupprechtii natural secondary forests[J]. Journal of Nanjing Forestry University (Natural Sciences Edition), 2018, 42(2): 170−176.
    [7] Fu L, Zhang H, Sharma R P, et al. A generalized nonlinear mixed-effects height to crown base model for Mongolian oak in northeast China[J]. Forest Ecology and Management, 2017, 384(1): 34−43.
    [8] Yang Y, Huang S. Effects of competition and climate variables on modelling height to live crown for three boreal tree species in Alberta, Canada[J]. European Journal of Forest Research, 2018, 137(2): 153−167. doi:  10.1007/s10342-017-1095-7
    [9] Jia W, Chen D. Nonlinear mixed-effects height to crown base and crown length dynamic models using the branch mortality technique for a Korean larch (Larix olgensis) plantations in northeast China[J]. Journal of Forestry Research, 2019, 30(6): 2095−2109. doi:  10.1007/s11676-019-01045-1
    [10] Koenker R, Bassett G. Regression quantiles[J]. Econometrica: Journal of the Econometric Society, 1978, 46(1): 33−50. doi:  10.2307/1913643
    [11] Zhang L, Bi H, Gove J H, et al. A comparison of alternative methods for estimating the self-thinning boundary line[J]. Canadian Journal of Forest Research, 2005, 35(6): 1507−1514. doi:  10.1139/x05-070
    [12] Mehtätalo L, Gregoire T G, Burkhart H E. Comparing strategies for modeling tree diameter percentiles from remeasured plots[J]. Environmetrics: The Official Journal of the International Environmetrics Society, 2008, 19(5): 529−548.
    [13] Zang H, Lei X, Zeng W. Height-diameter equations for larch plantations in northern and northeastern China: a comparison of the mixed-effects, quantile regression and generalized additive models[J]. Forestry: An International Journal of Forest Research, 2016, 89(4): 434−445. doi:  10.1093/forestry/cpw022
    [14] Bohora S B, Cao Q V. Prediction of tree diameter growth using quantile regression and mixed-effects models[J]. Forest Ecology and Management, 2014, 319(5): 62−66.
    [15] Cao Q V, Wang J. Evaluation of methods for calibrating a tree taper equation[J]. Forest Science, 2015, 61(2): 213−219. doi:  10.5849/forsci.14-008
    [16] 马岩岩, 姜立春. 基于非线性分位数回归的落叶松树干削度方程[J]. 林业科学, 2019, 55(10):68−75.

    Ma Y Y, Jiang L C. Stem taper function for Larix gmelinii based on nonlinear quantile regression[J]. Scientia Silvae Sinicae, 2019, 55(10): 68−75.
    [17] Özçelik R, Cao Q V, Trincado G, et al. Predicting tree height from tree diameter and dominant height using mixed-effects and quantile regression models for two species in Turkey[J]. Forest Ecology and Management, 2018, 419: 240−248.
    [18] Sharma M, Parton J. Height-diameter equations for boreal tree species in Ontario using a mixed-effects modeling approach[J]. Forest Ecology and Management, 2007, 249(3): 187−198. doi:  10.1016/j.foreco.2007.05.006
    [19] Raptis D, Kazana V, Kazaklis A, et al. A crown width-diameter model for natural even-aged black pine forest management[J]. Forests, 2018, 9(10): 610. doi:  10.3390/f9100610
    [20] Fu L, Sun H, Sharma R P, et al. Nonlinear mixed-effects crown width models for individual trees of Chinese fir (Cunninghamia lanceolata) in south-central China[J]. Forest Ecology and Management, 2013, 302: 210−220. doi:  10.1016/j.foreco.2013.03.036
    [21] Özçelik R, Diamantopoulou M J, Trincado G. Evaluation of potential modeling approaches for Scots pine stem diameter prediction in north-eastern Turkey[J]. Computers and Electronics in Agriculture, 2019, 162: 773−782. doi:  10.1016/j.compag.2019.05.033
    [22] Zheng J, Zang H, Yin S, et al. Modeling height-diameter relationship for artificial monoculture Metasequoia glyptostroboides in sub-tropic coastal megacity Shanghai, China[J]. Urban Forestry and Urban Greening, 2018, 34: 226−232. doi:  10.1016/j.ufug.2018.06.006
  • [1] 张迎, 康峰, 王亚雄, 李文彬, 仝思源, 吕明青.  基于人机工程学的电动高枝杆锯研究 . 北京林业大学学报, doi: 10.12171/j.1000-1522.20210059
    [2] 李松阳, 余杭, 罗清虎, 刘颖, 贺静雯, 林勇明, 王道杰, 李键.  洪涝诱发灾害干扰下受损恢复林地土壤颗粒的组成变化特征及多重分形分析 . 北京林业大学学报, doi: 10.12171/j.1000-1522.20190388
    [3] 燕云飞, 王君杰, 姜立春.  基于混合效应模型的人工红松枝下高模型研建 . 北京林业大学学报, doi: 10.12171/j.1000-1522.20190366
    [4] 辛士冬, 姜立春.  利用分位数回归模拟人工樟子松树干干形 . 北京林业大学学报, doi: 10.12171/j.1000-1522.20190014
    [5] 丹宇卓, 石晶明, 李心怡, 罗帅, 李明泽.  基于改进的像元二分模型估测郁闭度 . 北京林业大学学报, doi: 10.13332/j.1000-1522.20180263
    [6] 李想, 董利虎, 李凤日.  基于联立方程组的人工樟子松枝下高模型构建 . 北京林业大学学报, doi: 10.13332/j.1000-1522.20170428
    [7] 王曼霖, 董利虎, 李凤日.  基于Possion回归混合效应模型的长白落叶松一级枝数量模拟 . 北京林业大学学报, doi: 10.13332/j.1000-1522.20170204
    [8] 刘锦春, 马晔, 陶建平, 高凯敏, 梁千慧.  丛枝菌根真菌对西南岩溶地区干旱及干湿交替下 金银花根系生长的影响 . 北京林业大学学报, doi: 10.13332/j.1000-1522.20150057
    [9] 蔡长福, 刘改秀, 成仿云, 吴静, 钟原, 李敏.  牡丹遗传作图最适F1分离群体的选择 . 北京林业大学学报, doi: 10.13332/j.1000-1522.20140134
    [10] 龚俊杰, 杨华, 邓华锋, 张慕博.  北京明长城森林景观空间结构的分形特征及稳定性 . 北京林业大学学报, doi: 10.13332/j.cnki.jbfu.2014.06.012
    [11] 陈婕, 谢靖, 唐明.  水分胁迫下丛枝菌根真菌对紫穗槐生长和抗旱性的影响 . 北京林业大学学报, doi: 10.13332/j.cnki.jbfu.2014.06.026
    [12] 宋莎莎, 赵广杰.  木材宏、微观细胞堆砌构造图案的分形表征 . 北京林业大学学报,
    [13] 倪成才, 王庆丰.  火炬松人工林胸高断面积差分模型的拟合与筛选 . 北京林业大学学报,
    [14] 罗蓓, 赵广杰.  分形理论在木材科学领域中的应用 . 北京林业大学学报,
    [15] 李艳芹, 冯仲科, 刘惠清, 周嘉, 孟昭虹.  第二松花江干流水环境承载能力地域分异研究 . 北京林业大学学报,
    [16] 涂成龙, 刘丛强, 武永锋, 王毅.  应用δ13C值探讨林地土壤有机碳的分异 . 北京林业大学学报,
    [17] 孙晓梅, 王玉杰, 张冰玉, 陈文汇, 李绍才, 李发东, 范丙友, 吕建雄, 李世东, 时尽书, 徐双民, 胡晓丽, 金小娟, 朱教君, 南海龙, 颜容, 高峻, 窦军霞, 肖生春, 杨振德, 翟明普, 潘存德, 张宇清, 谭伟, 康宏樟, 冯仲科, 三乃, 刘俊昌, 刘红霞, 孙海龙, 胡诗宇, 李建章, 张一平, 宋献方, 韩海荣, 肖洪浪, 骆秀琴, 周春江, 孟平, 师瑞峰, 张守攻, 王云琦, 谢益民, 朱清科, 苏晓华, 田小青, 李义良, 陆海, 王笑山, 李智辉, 岳良松, 刘昌明, 姜伟, 齐实, 齐实, 张雁, 杨志荣, 蔡怀, 赵博光, 赵双菊, 吴斌, 马钦彦, 周文瑞, 蒋佳荔, 张劲松, 齐力旺, 张岩, 张永安, 于静洁, 宋清海, 张德荣, 蒋湘宁, 朱金兆, 蒲俊文, 伊力塔, 赵有科, 葛颂, 姚山, 何磊, 褚建民, 吴庆利, 刘元, 康峰峰, 吕守芳, 石丽萍, 马超德, 杨聪, 曲良建, 崔保山, 刘鑫宇, 刘相超, 王建华, 王玉珠, 朱林峰, 田颖川, 胡堃, 唐常源.  重庆缙云山典型林地土壤分形特征对水分入渗影响 . 北京林业大学学报,
    [18] 卜崇峰, 程万里, 张占宽, 王发国, 杨丽韫, 毕华兴, 李艳华, 罗辑, 王安志, 宋瑞清, 徐秋芳, 王鸿斌, 张志, 赵廷宁, 郝朝运, 旷远文, 吴娟, 明军, 陈永亮, 李贤军, 刘海军, 刘建梅, 姜培坤, 郭卫东, 李文华, 张启翔, 温达志, 骆有庆, 习宝田, 陈天全, 马洁, 马忠明, 冀瑞卿, 曹子龙, 谭秀英, 程根伟, 张璧光, 叶华谷, 朱金兆, 刘国彬, 刘一星, 张真, 刘鹏, 敏朗, 沈泉, 邢福武, 裴铁, 李笑吟, 程放, 兰彦平, 孔祥波, 李文军, 朱清科, 陈玉福, 温俊宝, 郑翠玲, 康向阳, 周国逸, 李伟, 孙保平, 张宇清, 则元京, 金昌杰, 李延军, 张志明, 刘世忠, 马其侠, 何祖慰, 沈佐锐, 丁国栋, 冯继华, 张德强, 金幼菊, 陈红锋, 姚爱静, 曹刚, 陶万强, 魏铁.  晋西黄土区蔡家川流域景观地形分异格局研究 . 北京林业大学学报,
    [19] 杨晓晖, 杜华强, 龙玲, 杨海龙, 李慧, 李景文, 刘震, 
    王保平, 殷亚方, 张一平, 侯亚南, 宋小双, 李景文, 黄国胜, 熊瑾, 李梅, 王明枝, 詹亚光, 饶良懿, 符韵林, 李全发, 张秋英, 马文辉, 刘文耀, 李妮亚, 吕建雄, 尹立辉, 耿晓东, 王洁瑛, 李俊清, 李俊清, 梁机, 赵敏, 窦军霞, 张克斌, 陆熙娴, 徐峰, 朱金兆, 韩海荣, 李吉跃, 陈晓阳, 秦瑶, 朱金兆, 王雪军, 范文义, 李发东, 乔杰, 刘雪梅, 陈晓阳, 赵宪文, 孙玉军, 唐黎明, 于贵瑞, 慈龙骏, 康峰峰, 欧国强, 毕华兴, 沈有信, 刘桂丰, 陈素文, 秦素玲, 齐实, 倪春, 李云, 李黎, 李凤兰, 魏建祥, 文瑞钧, 赵双菊, 马钦彦, 朱国平, 王雪, 李伟, 黎昌琼, 王玉成, 张桂芹, 蒋建平, 宋献方, 刘伦辉, 韦广绥, 任海青, 李伟, 孙涛, 宋清海, 杨谦, 张万军, 丁霞, , 李慧, 周海江, 孙志强, 孙晓敏, 刘莹, 李宗然, 
    基于Matlab遥感数据分形及地统计分析软件实现 . 北京林业大学学报,
    [20] 李全发, 詹亚光, 李梅, 马文辉, 杨海龙, 龙玲, 刘震, 宋小双, 侯亚南, 王明枝, 熊瑾, 张一平, 符韵林, 殷亚方, 黄国胜, 张秋英, 李慧, 
    王保平, 李景文, 李景文, 饶良懿, 杨晓晖, 杜华强, 窦军霞, 尹立辉, 徐峰, 朱金兆, 韩海荣, 吕建雄, 李妮亚, 秦瑶, 陆熙娴, 李吉跃, 李发东, 范文义, 刘文耀, 耿晓东, 赵敏, 朱金兆, 王雪军, 梁机, 李俊清, 张克斌, 李俊清, 陈晓阳, 王洁瑛, 齐实, 赵宪文, 毕华兴, 秦素玲, 于贵瑞, 陈晓阳, 康峰峰, 李云, 沈有信, 孙玉军, 陈素文, 刘桂丰, 李黎, 倪春, 唐黎明, 刘雪梅, 乔杰, 欧国强, 慈龙骏, 李凤兰, 朱国平, 蒋建平, 宋献方, 赵双菊, 马钦彦, 李伟, 文瑞钧, 张桂芹, 李伟, 韦广绥, 王玉成, 刘伦辉, 王雪, 魏建祥, 任海青, 黎昌琼, 丁霞, 孙涛, 周海江, 宋清海, 李慧, 杨谦, 张万军, , 刘莹, 孙志强, 孙晓敏, 李宗然, 
    木 材 表 面 粗 糙 度 的 分 析 . 北京林业大学学报,
  • 加载中
图(3) / 表 (3)
计量
  • 文章访问数:  91
  • HTML全文浏览量:  23
  • PDF下载量:  22
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-03-18
  • 修回日期:  2020-04-14
  • 网络出版日期:  2021-03-19

利用分位数组合预测兴安落叶松枝下高

doi: 10.12171/j.1000-1522.20200075
    基金项目:  国家自然科学基金项目(31570624),黑龙江省应用技术研究与开发计划项目(GA19C006),中央高校基本科研业务费专项(2572019CP15), 黑龙江省头雁创新团队计划
    作者简介:

    王君杰,博士生。主要研究方向:林分生长与收获模型。Email:wang.junjie521@qq.com 地址:150040黑龙江省哈尔滨市香坊区和兴路26号东北林业大学林学院

    通讯作者: 姜立春,教授,博士生导师。主要研究方向:林分生长与收获模型。Email:jlichun@nefu.edu.cn 地址:同上
  • 中图分类号: S757

摘要:   目的  本文使用分位数回归和分位数组合对枝下高进行建模和预测,为单木枝下高模型的构建提供新的思路和方法。  方法  利用大兴安岭新林区4个林场的兴安落叶松天然林实测数据,采用非线性回归构建枝下高基础和广义模型并分别扩展到分位数回归。使用三分位数组合($\tau {\text{ = }}$ 0.1, 0.5, 0.9)、五分位数组合($\tau {\text{ = }}$ 0.1, 0.3, 0.5, 0.7, 0.9)、九分位数组合($\tau {\text{ = }}$ 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9)和4种抽样设计(抽最大树、抽最小树、抽平均木、随机抽取)进行预测,比较不同分位数组合的预测效果并分析不同抽样设计对预测精度的影响。同时使用双重交叉检验对非线性回归、最优位数回归和最优分位数组合进行比较。模型拟合和检验的评价指标主要包括平均绝对误差(MAE)、均方根误差(RMSE)、相对误差(MPE)和调整确定系数(${{R}}_{{\rm{adj}}}^2$)。  结果  (1)无论是非线性回归还是分位数回归,广义模型的拟合MAE较基础模型可降低6% ~ 12%,RMSE可降低6% ~ 10%,检验效果也优于基础模型。枝下高与胸径呈负相关、与样地优势高和每公顷断面积呈正相关。(2)中位数回归在所有分位数中拟合能力最好,且效果与非线性回归相似。分位数回归可以描述枝下高的分布。(3)3种分位数组合都可以对枝下高模型进行预测且效果相差不大,三分位数组合就可以满足枝下高的预测精度。中位数回归的交叉检验结果与非线性回归相似,三分位数组合的预测能力最优,MAE和MPE较非线性回归和中位数回归分别下降了20%和4%左右,${{R}}_{{\rm{adj}}}^2$提高了16%左右。(4)基础和广义分位数组合的最优抽样设计分别为抽平均木5株和抽大树7株。  结论  本研究基于三分位数组合($\tau {\text{ = }}$ 0.1, 0.5, 0.9)的枝下高模型可以提高预测精度,具体应用基础和广义分位数组合模型的最优抽样设计分别为抽平均木5株和抽大树7株。综合预测精度和调查成本的考虑,在实践中应用分位数组合时,推荐在样地中抽取5 株平均木对枝下高进行预测。

English Abstract

王君杰, 姜立春. 利用分位数组合预测兴安落叶松枝下高[J]. 北京林业大学学报. doi: 10.12171/j.1000-1522.20200075
引用本文: 王君杰, 姜立春. 利用分位数组合预测兴安落叶松枝下高[J]. 北京林业大学学报. doi: 10.12171/j.1000-1522.20200075
Wang Junjie, Jiang Lichun. Predicting height to crown base for Larix gmelinii using quantile groups[J]. Journal of Beijing Forestry University. doi: 10.12171/j.1000-1522.20200075
Citation: Wang Junjie, Jiang Lichun. Predicting height to crown base for Larix gmelinii using quantile groups[J]. Journal of Beijing Forestry University. doi: 10.12171/j.1000-1522.20200075
  • 枝下高(height to crown base,HCB)是计算冠长或冠长率、描述树冠大小的重要指标,与冠长和树高密切相关,可以直接进行样地测量[1-3]。此外,枝下高能反映树木生长活力、木材质量和商业价值,对树木生长阶段、生产效率和竞争的量化具有重要意义[4-6]。目前针对一些树种,林业研究者已经构建了不同形式的枝下高模型。枝下高会受到单木和林分因子的影响,因此通常使用描述树木大小(如树高、胸径)、立地条件(如优势高、立地指数等)和竞争(如林分断面积、高径比、样地内所有大于对象木胸径的立木断面积总和等)的变量构建广义枝下高模型,以代表不同区域、林分间枝下高的差异[1,7-9]

    分位数回归(quantile regression)由Koenker 等[10]提出,提供了一种估计条件分位数函数、刻画整个条件分布的综合方法[11-12]。分位数回归对于残差的分布没有特定要求,保证了参数估计的稳定性和可靠性,具有很大的灵活性。此外,分位数回归还可以充分体现整个分布尤其是尾部分布的重要信息[12]。目前应用分位数回归主要是将拟合最好的分位点,一般是中位数回归的参数估计值代入模型用于预测[13]。近年来,一些学者提出了将多分位数组合应用于模型预测,取得了较好的预测效果,但这种组合只探讨了一个已知观测值的校正效果[14-16],并不一定试用于所有单木模型。Özçelik等[17]提出了使用多个观测数据进行校正的分位数组合方法,发现对于树高曲线的预测,使用4个观测能达到较好的效果,但没有深入研究不同抽样方法对模型精度的影响。

    兴安落叶松(Larix gmelinii)是大兴安岭地区的主要树种,使用准确可靠的枝下高预测模型对落叶松林的经营管理具有重要意义。分位数组合仅需少量先验数据便可精确预测特定林分的响应变量,提高了模型的预测能力和适用性,但根据我们掌握的文献,没有发现利用分位数组合研究兴安落叶松枝下高的报道。因此,本研究利用分位数回归和不同分位数组合对枝下高模型进行拟合和预测,并与非线性回归进行对比分析,同时评估模型实际应用时的抽样方案,以期为野外实际应用提供指导。

    • 研究地点为黑龙江省大兴安岭新林区(123°41′ ~ 125°25′E,51°20′ ~ 52°10′N)。新林区位于大兴安岭地区东部,属寒温带大陆性气候。年平均气温为−2.6 ℃,气温年较差很大。年降水量为513.9 mm,主要降水集中在7—8月份。全年日照时数为235.7 h,日照百分率为51 ~ 56%。年平均风速一般为2 ~ 3 m/s。植被属于寒温带针叶林区的大兴安岭山地寒温针叶林带,主要乔木树种有兴安落叶松、樟子松(Pinus sylvestris var. mongolica)、云杉(Picea asperata)、白桦(Betula platyphylla)、山杨(Populus davidiana)等。

      本研究所用数据来自新林区4个林场:宏图林场、新林林场、大乌苏林场和翠岗林场,共收集了90块不同林分的落叶松天然林样地,样地面积为0.02 ~ 0.1 hm2。本研究共调查兴安落叶松单木4 037株,实测每个样地胸径大于5 cm的所有树木的胸径(diameter at breast height,DBH)、树高(total tree height,THT)、枝下高(HCB),并记录每株树的相对位置。此外,根据样地面积计算每个样地优势木树高的平均值(样地面积为1 hm2时,选择100株树作为优势木),并将它们用作该样地优势高(dominant height,HDOM[18]。使用实测数据计算各林分水平因子。将数据随机分为两组,每组都包含相同数量的样地。使用双重交叉检验(two-fold evaluation)[17],将一组的模型参数应用于另一组的预测,然后使用两组的预测值来计算不同模型的评估统计量。由于计算的单木和林分因子较多,因此只对最终模型中包含的预测变量进行了总结,数据统计量见表1

      表 1  落叶松天然林各样木调查因子数据统计

      Table 1.  Deseriptive statistics for Larix gmelinii sample trees

      变量 Variable组1 Group 1组2 Group 2
      平均值
      Mean value
      标准差
      STD
      最小值
      Min.
      最大值
      Max.
      平均值
      Mean value
      标准差
      STD
      最小值
      Min.
      最大值
      Max.
      树高 Total tree height (THT)/m 11.0 3.3 3.4 23.8 10.6 3.1 3.7 23.3
      枝下高 Height to crown base (HCB)/m 5.3 2.3 0.7 13.8 5.3 2.2 0.6 14.4
      胸径 Diameter at breast height (DBH)/cm 11.1 4.4 5.0 28.6 10.7 4.2 5.0 32.5
      优势高 Dominant height (HDOM)/m 15.9 2.4 11.1 19.7 15.6 2.3 11.3 22.0
      每公顷断面积/(m2·hm−2)
      Basal area per hectare (BA)/(m2·ha−1)
      17.9 8.6 4.5 37.5 18.1 7.0 2.9 31.7
      每公顷株数/(株·hm−2)
      Number of trees per hectare/(tree·ha−1)
      1 705.0 937.0 483.0 4 400.0 1 843.0 680.0 183.0 3 450.0
    • 初步分析表明枝下高与树高存在很强的相关性,相关系数为0.757 6,因此,枝下高模型首先定义为树高的函数[8]。在11个候选基础模型中[2,7-8],Logistics模型提供了模拟HCB-THT关系的最好性能,此外该模型还可以保证枝下高取值范围为0 ~ THT,符合树木生物学关系,其模型形式为:

      $${\rm{HC}}{{\rm{B}}_{ij}} = {\rm{TH}}{{\rm{T}}_{ij}}/\left[ {1 + \exp \left( {{\beta _0} + {\beta _1}{\rm{TH}}{{\rm{T}}_{ij}}} \right)} \right] + {\varepsilon _{ij}}$$ (1)

      式中:${\rm{HC}}{{\rm{B}}_{ij}}$${\rm{TH}}{{\rm{T}}_{ij}}$分别为第i个样地第j株树的枝下高和树高;${\;\beta _0}$${\;\beta _1}$为模型参数,${\varepsilon _{ij}}$为模型误差项。

      其他单木因子和林分变量对枝下高也有显著影响。本研究分析的因子有:胸径(DBH,cm);各样地优势木高(HDOM,m)、优势木胸径(DDOM,cm)、最大树树高(Htall,m)、样地树平均高(Hmean,m);每公顷断面积(BA,m2/hm2)、每公顷株数(株/hm2)、相对间距指数(RS)、样地内所有大于对象木胸径的立木断面积总和(BAL,m2/hm2)。对所选变量使用图形分析和相关性检验,并对其不同组合进行检验,选择最优性能模型作为广义枝下高模型。本研究选用树木胸径DBH(树木大小)、样地优势高${{{H}}_{{\rm{DOM}}}}$(立地质量)和每公顷断面积BA(竞争)构建广义枝下高模型,其形式如下:

      $$\begin{split} {\rm{HC}}{{\rm{B}}_{ij}} =& {\rm{TH}}{{\rm{T}}_{ij}}/\left[ 1 + \exp \left( {\beta _0} + {\beta _1}{\rm{TH}}{{\rm{T}}_{ij}} + {\beta _2}{\rm{DB}}{{\rm{H}}_{ij}} +\right.\right.\\ &\left.\left.{\beta _3}{{{H}}_{{\rm{DOM}},i}} + {\beta _4}{\rm{B}}{{\rm{A}}_i} \right) \right] + {\varepsilon _{ij}}\end{split}$$ (2)

      式中:${\rm{DB}}{{\rm{H}}_{ij}}$为第i个样地第j株树的胸径;${{{H}}_{{\rm{DOM}},i}}$${\rm{B}}{{\rm{A}}_i}$分别为第i个样地的优势高和每公顷断面积;${\;\beta _0}$ ~ ${\;\beta _4}$为模型参数。其他参数定义同上。

    • 将基础和广义枝下高模型分别表示为分位数模型,模型形式如下:

      $${\rm{HCB}}_{ij}^\tau = {\rm{TH}}{{\rm{T}}_{ij}}/\left[ {1 + \exp \left( {\beta _0^\tau + \beta _1^\tau {\rm{TH}}{{\rm{T}}_{ij}}} \right)} \right] + {\varepsilon _{ij}}$$ (3)
      $$\begin{split} {\rm{HCB}}_{ij}^\tau =& {\rm{TH}}{{\rm{T}}_{ij}}/\left[ 1 + \exp \left( \beta _0^\tau + \beta _1^\tau {\rm{TH}}{{\rm{T}}_{ij}} + \beta _2^\tau {\rm{DB}}{{\rm{H}}_{ij}} +\right.\right.\\ &\left.\left.\beta _3^\tau {{{H}}_{{\rm{DOM}},i}} + \beta _4^\tau {\rm{B}}{{\rm{A}}_i} \right) \right] + {\varepsilon _{ij}}\end{split}$$ (4)

      式中:${\rm{HCB}}_{ij}^\tau $为分位点为$\tau $时的枝下高;$\;\beta _0^\tau $ ~ $\;\beta _4^\tau $为分位点为$\tau $时的模型参数;其他参数定义同上。当$\tau = 0.5$时的分位数回归也叫中位数回归(median regression)。

      分位数回归中第$\tau $个模型的参数估计可以通过最小化残差绝对值的非对称损失函数来估计[15]。如下所示:

      $$ \min \left[ {\sum\limits_{{y_{ij}} \geqslant \hat y_{ij}^\tau } \tau \left| {{y_{ij}} - \hat y_{ij}^\tau } \right| + \sum\limits_{{y_{ij}} < \hat y_{ij}^\tau } {(1 - \tau )} \left| {\hat y_{ij}^\tau - {y_{ij}}} \right|} \right] $$ (5)

      式中:$\tau $表示所要估计的分位点。

    • 分位数组合方法由Bohora等[14]提出,利用抽样数据对不同组合的分位数曲线进行识别,找到通过该数据的分位数曲线,或找到最接近该数据的两条分位数回归曲线进行插值得到修正的分位数曲线。本研究应用分位数组合对枝下高模型进行预测,主要测试了3种分位数组合模型:三分位数组合 ($\tau {\rm{ = }}$0.1, 0.5, 0.9)、五分位数组合 ($\tau {\rm{ = }}$0.1, 0.3, 0.5, 0.7, 0.9)和九分位数组合($\tau {\rm{ = }}$0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9)。

      当每个样地抽样数量m=1时,找出最接近该树枝下高的两条分位数回归曲线,即${\hat{y}}_{k}\left({\rm{THT}}_{ij}\right)\leqslant $$ {\rm{HCB}}_{ij}\leqslant{\hat{y}}_{k+1}\left({\rm{THT}}_{ij}\right)$。通过插值生成一条经过这个点的修正的枝下高曲线:

      $${\widehat {{\rm{HCB}}}_{ij}} = \alpha {\hat y_k}\left( {{\rm{TH}}{{\rm{T}}_{ij}}} \right) + \left( {1 - \alpha } \right){\hat y_{k + 1}}\left( {{\rm{TH}}{{\rm{T}}_{ij}}} \right)$$ (6)

      式中:$\alpha = \dfrac{{{{\hat y}_{k + 1}}\left( {{\rm{TH}}{{\rm{T}}_{ij}}} \right) - {\rm{HC}}{{\rm{B}}_{ij}}}}{{{{\hat y}_{k + 1}}\left( {{\rm{TH}}{{\rm{T}}_{ij}}} \right) - {{\hat y}_k}\left( {{\rm{TH}}{{\rm{T}}_{ij}}} \right)}}$为插值系数。如果枝下高值高于最高(qth)的分位数回归曲线,将${\hat y_k}$定义为${\hat y_{q - 1}}$${\hat y_{k + 1}}$定义为${\hat y_q}$;如果枝下高低于最低(1st)的分位数回归曲线,将${\hat y_k}$${\hat y_{k + 1}}$分别定义为${\hat y_1}$${\hat y_2}$

      当每个样地抽样数量m$ \geqslant $1时,找出平均误差ME(式7)符号改变的两条分位数回归曲线。其中插值系数$\alpha $需要使$\displaystyle\sum \limits_{j = 1}^m {\left( {{\rm{HC}}{{\rm{B}}_{ij}} - {{\widehat {{\rm{HCB}}}}_{ij}}} \right)^2}$最小[17]。如果所有分位数回归曲线的ME为正,将${\hat y_k}$${\hat y_{k + 1}}$分别定义为${\hat y_1}$${\hat y_2}$。如果所有分位数回归曲线的ME为负,将${\hat y_k}$定义为${\hat y_{q - 1}}$${\hat y_{k + 1}}$定义为${\hat y_q}$。然后利用式(6)得到修正的枝下高曲线。

    • 分位数组合在应用时需要使用已知枝下高数据进行预测,具体采用以下4种抽样设计方案。

      (1)每个样地选择胸径最大的1 ~ 9株树;

      (2)每个样地选择胸径最小的1 ~ 9株树;

      (3)每个样地选择与该样地平均胸径最接近的1 ~ 9株树;

      (4)每个样地随机抽取1 ~ 9株树。为了得到可靠的结果,此过程重复100次,然后计算平均值。

      拟合结果采用平均绝对误差(MAE)和均方根误差(RMSE)进行评价。交叉检验结果采用平均绝对误差(MAE)、均方根误差(RMSE)、相对误差(MPE)和调整确定系数(${R}_{\rm{adj}}^2$)进行评价。它们相应的数学表达式为:

      $${\rm{ME}} = \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^{{n_l}} {\left( {{\rm{HC}}{{\rm{B}}_{ij}} - {{\widehat {{\rm{HCB}}}}_{ij}}} \right)\bigg/\sum\limits_{i = 1}^n {{n_i}} } } $$ (7)
      $${\rm{MAE}} = \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^{{n_i}} {\left| {{\rm{HC}}{{\rm{B}}_{ij}} - {{\widehat {{\rm{HCB}}}}_{ij}}} \right|\bigg/\sum\limits_{i = 1}^n {{n_i}} } } $$ (8)
      $${\rm{RMSE}} = \sqrt {\sum\limits_{i = 1}^n {\sum\limits_{j = 1}^{{n_i}} {{{\left( {{\rm{HC}}{{\rm{B}}_{ij}} - {{\widehat {{\rm{HCB}}}}_{ij}}} \right)}^2}} \bigg/\left( {\sum\limits_{i = 1}^n {{n_i}} - 1} \right)} } $$ (9)
      $${\rm{MPE}} = 100 \% \times \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^{{n_i}} {\left| {{\rm{HC}}{{\rm{B}}_{ij}} - {{\widehat {{\rm{HCB}}}}_{ij}}} \right|\bigg/\sum\limits_{i = 1}^n {\sum\limits_{j = 1}^{{n_i}} {{\rm{HC}}{{\rm{B}}_{ij}}} } } } $$ (10)
      $$\begin{split} &{R}_{\rm{adj}}^2 = 1 - \left[ \left( {\displaystyle\sum\limits_{i = 1}^n {{n_i}} - 1} \right)\bigg/\left( {\displaystyle\sum\limits_{i = 1}^n {{n_i}} - p - 1} \right) \times \right.\\ & \left. \displaystyle\sum\limits_{i = 1}^n {\displaystyle\sum\limits_{j = 1}^{{n_i}} {{{\left( {{\rm{HC}}{{\rm{B}}_{ij}} - {{\widehat {{\rm{HCB}}}}_{ij}}} \right)}^2}} \bigg/\displaystyle\sum\limits_{i = 1}^n {\displaystyle\sum\limits_{j = 1}^{{n_i}} {{{\left( {{\rm{HC}}{{\rm{B}}_{ij}} - {{\overline {{\rm{HCB}}} }_i}} \right)}^2}} } } \right]\end{split}$$ (11)

      式中:${\rm{HC}}{{\rm{B}}_{ij}}$${\widehat {{\rm{HCB}}}_{ij}}$分别为枝下高实测值和模型预估值;${\overline {{\rm{HCB}}} _i} = \displaystyle\sum {\rm{HC}}{{\rm{B}}_i}/{n_i}$n为样地数;ni为每个样地中的样本数;p为模型自变量个数。

      使用SAS程序Proc Model 的Marquardt方法拟合加权基础和广义模型(SAS Institute Inc,2010),使用R软件的quantreg包拟合分位数回归(基于0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8和0.9分位点),使用SAS的Proc NLP过程计算分位数组合基于多个观测值的插值系数。

    • 为了消除枝下高模型的异方差性,对基础和广义枝下高模型分别使用权函数为$1/{\rm{TH}}{{\rm{T}}^{1.271\;9}}$$1/ $$ {\rm{TH}}{{\rm{T}}^{1.658\;1}}$的加权回归进行拟合。非线性回归和分位数回归的模型参数估计值和拟合统计量见表2。基础和广义分位数回归在9个分位点处都能收敛,且不同分位点的参数估计值都不相同。分位数回归在高分位点和低分位点MAE和RMSE较大,且离中位数越远,拟合效果越差。两个中位数模型拟合效果与相应的基础模型相似,可选作最优分位数回归模型。两种回归的广义模型与其基础模型相比,MAE可降低6% ~ 12%,RMSE可降低6% ~ 10%。

      表 2  非线性回归和分位数回归的参数估计和拟合统计量

      Table 2.  Parameter estimation and fitting statistics for nonlinear regression and quantile regression at nine quantiles

      参数估计方法
      Parameter estimating method
      模型 Model${\;\beta _0}$${\;\beta _1}$${\;\beta _2}$${\;\beta _3}$${\;\beta _4}$平均绝对误差
      MAE/m
      均方根误差
      RMSE/m
      非线性回归
      Nonlinear regression
      基础模型 Basic model 0.238 6 −0.016 5 1.180 8 1.480 8
      广义模型 Generalized model 0.974 0 −0.045 6 0.045 1 −0.041 3 −0.014 3 1.066 1 1.366 0
      分位数回归
      Quantile regression
      基础模型 Basic model
      $\tau = 0.1$ 1.318 1 −0.040 6 2.139 0 2.545 3
      $\tau = 0.2$ 1.008 0 −0.039 9 1.629 2 1.983 7
      $\tau = 0.3$ 0.700 7 −0.031 9 1.351 6 1.666 6
      $\tau = 0.4$ 0.432 4 −0.023 3 1.218 6 1.514 8
      $\tau = 0.5$ 0.186 2 −0.014 4 1.179 3 1.482 0
      $\tau = 0.6$ −0.071 0 −0.005 6 1.220 0 1.557 2
      $\tau = 0.7$ −0.278 8 0.000 7 1.327 3 1.704 7
      $\tau = 0.8$ −0.541 0 0.008 9 1.542 8 1.959 2
      $\tau = 0.9$ −0.797 7 0.013 6 1.900 7 2.333 6
      广义模型 Generalized model
      $\tau = 0.1$ 1.998 3 −0.054 0 0.044 8 −0.054 5 −0.015 0 1.884 4 2.280 4
      $\tau = 0.2$ 1.732 9 −0.065 2 0.053 5 −0.049 6 −0.017 3 1.438 3 1.799 4
      $\tau = 0.3$ 1.494 7 −0.050 7 0.049 3 −0.052 8 −0.017 7 1.212 5 1.547 3
      $\tau = 0.4$ 1.239 8 −0.052 4 0.052 7 −0.050 4 −0.014 8 1.101 7 1.411 7
      $\tau = 0.5$ 1.023 3 −0.046 1 0.049 1 −0.048 2 −0.014 0 1.064 8 1.368 6
      $\tau = 0.6$ 0.725 8 −0.039 9 0.047 0 −0.043 6 −0.011 6 1.098 8 1.417 0
      $\tau = 0.7$ 0.528 0 −0.037 8 0.044 6 −0.041 1 −0.009 9 1.203 8 1.553 1
      $\tau = 0.8$ 0.250 2 −0.031 4 0.042 6 −0.037 4 −0.009 1 1.405 0 1.784 1
      $\tau = 0.9$ −0.131 6 −0.021 8 0.035 7 −0.028 0 −0.009 9 1.787 8 2.187 0

      图1绘制了非线性回归和基于5个分位点($\tau {\rm{ = }}$0.1, 0.3, 0.5, 0.7, 0.9)的分位数回归的基础(A)和广义枝下高模型(B)的模拟曲线。从图中可以看出,由于各分位数的回归参数不同(表2),产生了不同形状的枝下高曲线,因此在利用不同分位数进行预测时,各分位数预测结果之间存在很大的差异,这也说明分位数回归具有很强的灵活性,可以充分体现出整个分布的重要信息。中位数回归较其他分位数回归能更好的拟合数据的平均趋势,且与非线性回归线几乎重合,说明该数据中没有极端值,平均数和中位数的取值很接近。

      图  1  非线性回归和基于5个分位点(0.1、0.3、0.5、0.7和0.9)的分位数回归的基础(A)和广义模型(B)的模拟曲线

      Figure 1.  Graphs of observed values (grey dots), simulation curves (grey curves) generated by the basic (A) and generalized nonlinear regression (B) and simulation curves (black curves) generated by the basic quantile regression (A) and generalized quantile regression (B) based on five quantiles (0.1, 0.3, 0.5, 0.7 and 0.9)

      广义非线性枝下高模型的每个协变量对枝下高的影响的曲线如图2所示。曲线是使用各变量的平均值、表2中的参数估计值以及测试变量最小值到最大值的相等间隔创建的[19]。从图中可以看出,枝下高随着胸径的增大而减小,随样地优势高和每公顷断面积的增大而增大。

      图  2  广义模型的协变量对枝下高影响的模拟

      Figure 2.  Simulation on the effects of generalized model’s covariates on HCB

    • 基于基础和广义枝下高分位数模型,采用4种抽样方式(抽大树、抽小树、抽平均木和随机抽取),分别利用三分位数组合($\tau {\rm{ = }}$0.1, 0.5, 0.9)、五分位数组合($\tau {\rm{ = }}$0.1, 0.3, 0.5, 0.7, 0.9)和九分位数组合($\tau {\rm{ = }}$0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9)对枝下高进行预测,分位数组合预测误差RMSE用柱状图表示。为了便于比较分位数组合与中位数回归模型的预测效果,中位数回归模型预测误差用横线表示,总体如图3所示。可以看出对于基础和广义枝下高模型,无论使用哪种抽样方式,3种分位数组合的RMSE都随着抽样数量的增加而减小,且3种分位数组合的RMSE相差不大,因此本研究选用三分位数组合($\tau {\rm{ = }}$0.1, 0.5, 0.9)对枝下高进行预测。从图中也可以看出抽样方式的不同导致分位数组合的预测能力产生明显差异,对于基础和广义枝下高分位数组合,抽小树的效果不理想,RMSE的下降速率较缓慢。从RMSE下降的趋势来看,对于基础模型的分位数组合,建议抽取5株平均木;而对于广义模型的分位数组合,建议抽取7株大树。

      图  3  分位数组合模型的预测误差比较

      Figure 3.  Comparison of prediction errors of quantile groups

    • 分别对基础和广义模型的非线性回归、最优分位数回归(中位数回归)和三分位数组合的预测进行交叉检验,评价结果见表3。无论使用哪种参数估计方法,广义模型的检验结果都优于基础模型。非线性回归与中位数回归的检验结果相似。基础和广义模型的三分位数组合的MAE、RMSE、MPE最小而${R}_{\rm{adj}}^2$最大,相较非线性回归和分位数回归,基础和广义模型三分位数组合的MAE和MPE分别下降了20%和4%左右,RMSE分别下降11.5%和14%左右,${R}_{\rm{adj}}^2$提高了16%左右,具有更好的预测能力。

      表 3  非线性回归、中位数回归和使用最优抽样设计的三分位数组合的交叉检验统计量

      Table 3.  Two-fold evaluation statistics of nonlinear regression, median quantile regression and three quantile groups using optimal sampling design

      参数估计方法
      Parameter estimating method
      模型
      Model
      平均绝对误差
      MAE/m
      均方根误差
      RMSE/m
      相对误差
      MPE/%
      ${{R}}_{\rm{adj}}^2$
      非线性回归
      Nonlinear regression
      基础模型
      Basic model
      1.187 7 1.490 2 22.488 6 0.565 4
      广义模型
      Generalized model
      1.079 4 1.382 4 20.436 9 0.625 1
      分位数回归
      Quantile regression
      基础中位数回归
      Basic median regression ($\tau = 0.5$)
      1.185 1 1.490 7 22.440 1 0.565 3
      广义中位数回归
      Generalized median regression ($\tau = 0.5$)
      1.082 0 1.388 4 20.486 6 0.621 9
      分位数组合
      Quantile group
      基础三分位数组合
      Basic three quantiles group ($\tau {{ = 0}}{\rm{.1,}}\;0.5,\;0.9$)
      0.958 9 1.317 8 18.154 8 0.659 4
      广义三分位数组合
      Generalized three quantile group ($\tau {{ = 0} }{\rm{.1,} }\;0.5,\;0.9$)
      0.854 7 1.188 4 16.183 3 0.723 1
    • 本研究基于大兴安岭地区落叶松天然林样地数据,建立基础和广义枝下高非线性模型,并分别扩展到分位数回归模型,使用3种分位数组合和4种抽样设计对枝下高进行预测,并对比非线性回归、分位数回归和分位数组合的预测能力。无论是非线性回归还是分位数回归,广义模型的MAE和RMSE都小于基础模型(表2),说明胸径、样地优势高和每公顷断面积可以提高枝下高模型的效果。枝下高曲线模拟(图2)表明,单木胸径越小、样地优势高和每公顷断面积越大,枝下高越大。对于一些其他树种,胸径通常被视作描述枝下高模型的重要变量[5,7]。优势高与树木生长和林分发育之间存在着密切的关系。样地优势高越大,代表立地条件越好,越能促使树木进行纵向生长,较矮的大树枝可能由于自我修剪而死亡,导致枝下高增大[5,20]。每公顷断面积可以同时表示树木大小和林分密度,量化了竞争。在断面积较大的林分中存在更多的竞争,使树木树冠更短小,导致枝下高增大[8-9]。中位数回归和非线性回归的拟合效果基本一致(图1),但分位数回归曲线具有不同形状,可以描述枝下高的分布,且分位数回归不受数据异方差的影响,是一种灵活有效的建模方法[14]

      Bohora等[14]使用分位数组合对胸径生长进行预测,发现九分位数组合会导致预测误差增大,三分位数和五分位数组合可以提高预测精度。Cao等[15]、Özçelik等[21]和Özçelik等[17]等分别对削度方程和树高曲线进行研究,发现五分位数组合略优于三分位数组合,但差异不大。本研究也得到了相近的结果,三分位数组合、五分位数组合和九分位数组合都能提高模型的精度,但差异很小(图3),因此选择较简单的三分位数组合就能满足精度要求。

      Bohora等[14]、Cao等[15]和马岩岩等[16]利用分位数组合预测时,发现使用一个观测值就可以提高预测精度,但本研究发现对于枝下高模型,无论怎样抽样(抽大树、抽小树、抽平均木和随机抽取),抽取一个观测值并不能提高模型的精度,相反会加大模型的误差,由于方法应用的限制,他们并没有深入研究抽取多个观测值对模型精度的影响。虽然Özçelik等[17]利用多个观测值对分位数组合树高曲线进行预测时,发现使用4株样木的观测值可提高预测精度,但没有对不同抽样方式进行比较。本研究发现使用不同抽样方式会产生不同的预测效果(图3)。当抽样方式为抽小树时,分位数组合的预测能力较差,这可能由于小树的代表性较差,不能充分反映样地的信息[7]。对于其他3种抽样方式,分位数组合的预测效果都会随着抽样数量的增加而提高预测精度,但基础和广义枝下高分位数组合对抽样数量和抽样方式的响应并不相同,如对于基础模型的分位数组合,至少要抽取5株平均木,而对于广义模型的分位数组合,至少要抽取7株大树。这可能是由于广义模型比基础模型包含更多的单木和样地信息,使这两种模型对不同抽样方式的响应不相同[22]。当对基础和广义模型的三分位数组合分别使用5株平均木和7株大树的抽样方式时,相较于非线性回归和中位数回归,三分位数组合的MAE和MPE下降了20%和4%左右,${R}_{\rm{adj}}^2$提高了16%左右(表3),这说明分位数组合使用少量样本就可明显提高枝下高模型的预测能力,模型具有很强的应用性。

    • 枝下高是单木模型的重要预测变量,因此提高枝下高的预测精度具有重要的意义。本文构建了兴安落叶松基础和广义枝下高模型,并用分位数回归和分位数组合对基础和广义模型进行了扩展,发现中位数回归和非线性回归拟合效果接近,但分位数回归能更加全面的刻画数据的分布特征,且不受模型假设的影响,回归系数估计更加稳健。本研究基于三分位数组合($\tau {\rm{ = }}$0.1, 0.5, 0.9)的枝下高模型可以提高预测精度,具体应用基础和广义分位数组合模型的最优抽样设计分别为抽平均木5株和抽大树7株。综合考虑采样成本和预测精度,在实际应用时,建议使用仅包含树高的基础枝下高三分位数组合模型、抽5株平均木的抽样方法对枝下高进行预测。但若想使模型适用于更广泛的林分或得到更高精度的枝下高预测模型,则可使用广义分位数组合模型进行枝下高预测。

参考文献 (22)

目录

    /

    返回文章
    返回