• Scopus收录期刊
  • CSCD(核心库)来源期刊
  • 中文核心期刊
  • 中国科技核心期刊
  • F5000顶尖学术来源期刊
  • RCCSE中国核心学术期刊
高级检索

基于特征选择和机器学习的森林蓄积量估算

赵娅冰, 彭道黎, 郭发苗, 王荫, 黄静娴

赵娅冰, 彭道黎, 郭发苗, 王荫, 黄静娴. 基于特征选择和机器学习的森林蓄积量估算[J]. 北京林业大学学报. DOI: 10.12171/j.1000-1522.20240328
引用本文: 赵娅冰, 彭道黎, 郭发苗, 王荫, 黄静娴. 基于特征选择和机器学习的森林蓄积量估算[J]. 北京林业大学学报. DOI: 10.12171/j.1000-1522.20240328
Zhao Yabing, Peng Daoli, Guo Famiao, Wang Yin, Huang Jingxian. Estimating forest growing stock volume based on feature selection and machine learning[J]. Journal of Beijing Forestry University. DOI: 10.12171/j.1000-1522.20240328
Citation: Zhao Yabing, Peng Daoli, Guo Famiao, Wang Yin, Huang Jingxian. Estimating forest growing stock volume based on feature selection and machine learning[J]. Journal of Beijing Forestry University. DOI: 10.12171/j.1000-1522.20240328

基于特征选择和机器学习的森林蓄积量估算

基金项目: 国家重点研发计划项目(2023YFD2200403)。
详细信息
    作者简介:

    赵娅冰。主要研究方向:林业遥感与信息技术。 Email:z15093476806@bjfu.edu.cn 地址:100083 北京市海淀区清华东路 35 号北京林业大学林学院

    责任作者:

    彭道黎,教授,博士生导师。主要研究方向:森林资源监测与评价。 Email:dlpeng@bjfu.edu.cn

  • 中图分类号: S771.8

Estimating forest growing stock volume based on feature selection and machine learning

  • 摘要:
    目的 

    基于多源遥感数据,评估不同特征选择方法和机器学习算法组合构建的森林蓄积量估算模型的准确性,挖掘其协同互补潜力,以期有效提高森林蓄积量的估算精度。

    方法 

    本研究以河北省第九次国家森林资源连续调查数据为基础,结合GF-1、Sentinel-2、Sentinel-1和ASTER GDEM 4种遥感数据,采用随机森林变量选择(VSURF)、递归特征消除(RFE)和Boruta 3种特征选择方法和支持向量回归(SVR)、K-最近邻(KNN)、随机森林(RF)、分类提升(CatBoost)和极端梯度提升(XGBoost)5种机器学习算法构建蓄积量模型,并筛选出最优模型。此外,通过方差分析量化了数据集、特征选择和机器学习算法这3个因素对森林蓄积量估算的影响。

    结果 

    (1)方差分析结果表明,数据集、特征选择和机器学习算法均对蓄积量估算性能有显著影响。(2)多源遥感数据的结合可以有效提高森林蓄积量的估算性能。与其他数据集相比,联合GF-1、Sentinel-2、Sentinel-1和ASTER GDEM数据构建的模型表现出了更高的估算精度。从整体来看,Boruta特征选择方法优于VSURF和RFE。CatBoost在建模中的表现优于其他算法(SVR、KNN、RF和XGBoost)。(3)基于GF-1、Sentinel-2、Sentinel-1和ASTER GDEM的组合,使用Boruta特征选择方法和CatBoost机器学习算法构建的估算模型实现了最高的准确性(R2 = 0.638 5,RMSE = 13.305 3 m3/hm2)。

    结论 

    基于多源遥感数据估算保定市森林蓄积量时,结合特征选择和机器学习算法可显著优化模型的估算效果,得到更精准的蓄积量估测结果。研究结果不仅改进了当前应用多源遥感数据估算森林蓄积量的方法,还为大范围森林蓄积量监测提供了新的思路和参考依据。

    Abstract:
    Objective 

    Based on multi-source remote sensing data, the accuracy of forest growing stock volume (GSV) estimation models constructed by combining different feature selection methods and machine learning algorithms was evaluated, and their synergistic and complementary potentials were explored, to effectively improve the estimation accuracy of forest GSV.

    Method 

    Based on the data of the 9th National Forest Continuous Inventory (NFCI) in Hebei Province, this study combines four types of remote sensing data, namely, GF-1, Sentinel-2, Sentinel-1 and ASTER GDEM, and employs three types of feature selection methods, namely, Variable Selection Using Random Forests (VSURF), Recursive Feature Elimination (RFE) and Boruta, and five types of machine learning algorithms, namely, Support Vector Regression (SVR), K-Nearest Neighbors, Random Forest (RF), Categorical Boosting (CatBoost) and Extreme Gradient Boosting (XGBoost) to construct GSV model and screen the optimal model. In addition, the effects of three factors, namely, dataset, feature selection and machine learning algorithms, on the estimation of forest GSV were quantified by analysis of variance (ANOVA).

    Result 

    (1) The results of ANOVA show that the dataset, feature selection and machine learning algorithms all have a significant impact on the performance of GSV estimation. (2) The combination of multi-source remote sensing data can effectively improve the performance of forest GSV estimation. Compared with other datasets, the model constructed by combining the GF-1, Sentinel-2, Sentinel-1 and ASTER GDEM data shows higher estimation accuracy. On the whole, the Boruta feature selection method is superior to VSURF and RFE. CatBoost outperforms other algorithms (SVR、KNN、RF and XGBoost) in modeling. (3) Based on the combination of GF-1, Sentinel-2, Sentinel-1, and ASTER GDEM, the estimation model built using Boruta for feature selection and CatBoost machine learning algorithm achieves the highest accuracy (R2 = 0.638 5, RMSE = 13.305 3 m3/ha).

    Conclusion 

    In the estimation of forest GSV in Baoding City based on multi-source remote sensing data, the combination of feature selection and machine learning algorithm can effectively improve the model estimation effect, obtain better GSV estimation results. The results of this study not only improve the current method of estimating forest GSV based on multi-source remote sensing data but also provide a new idea and reference basis for large-scale forest GSV monitoring.

  • 植物的寿命是其生活史上一个重要的特征,准确判断植物的生长年龄对理解植物在特定环境中的发育和繁殖更新状况,评估其生长影响因子及环境适应能力,由此制定合理的栽培管理及开发利用措施意义重大[1-5]。植物生长年龄一般可以通过周年生长形态、物候及生长轮等进行分析。在木本植物中,多年生茎中的年轮解剖结构特征可以反映其实际生长年限及生长发育状况[1,6]。研究表明,多年生草本植物位于地下的宿存器官(根茎,块茎,块根和鳞茎)中存在类似树木年轮的“生长轮”可以作为其生长年限判别的依据[1]。根茎是根茎类植物营养物质的重要贮存场所[7-9],也是其自然更新和分株繁殖的主要器官,是芽与根生理整合的枢纽通道[10],对根茎的形态特征、次生结构及其生长年龄的研究是揭示其生长发育及环境适应机制的重要基础,因而受到广泛关注。目前,对根茎生长年龄的判断一方面是根据其世代繁殖更新的形态特征来确定[2-5],另一方面可以通过其生长轮来进行判断,在灰白千里光(Senecio incanus),草甸鼠尾草(Salvia pratensis )及奇异蜂斗菜(Petasites paradoxus)等植物的根茎中均发现有生长轮的存在[1]

    芍药(herbaceous peony)是典型的根茎类多年生草本植物,野生遗传资源丰富[11],栽培品种繁多,形成了3大品种类群[12-15],有重要的观赏和药用价值[16-17]。目前关于芍药根茎的研究报道较少,仅对中国芍药品种群的个别品种的根茎生长发育及初生组织结构特征进行了初步的研究[18],对芍药根茎中是否存在生长轮以及不同品种间的生长轮差异尚未有报道。因此,本研究通过比较观察分析不同芍药品种群品种的根茎形态生长发育特点,对芍药根茎进行解剖学研究,观察其生长轮特点,判别其生长年限,以期为芍药合理栽培措施的制定、无性繁殖技术的优化及资源的开发利用研究提供一定的基础理论指导。研究结果对其他多年生根茎类植物的生长年龄判断及相关研究的开展也具有一定的借鉴意义。

    芍药不同品种群品种(表1),种植于国家花卉工程中心芍药种质资源圃(北京昌平区小汤山镇),供试材料为3年生分株苗。

    表  1  供试芍药品种信息
    Table  1.  Variety information of experimental materials
    编号 No.品种名称 Variety name品种群分类 Classification of cultivar groups倍性 Ploidy level
    1 ‘种生粉’ ‘Zhongshengfen’ 中国芍药品种群 Lactiflora group 2n = 2x = 10
    2 ‘粉玉奴’ ‘Fenyunu’ 中国芍药品种群 Lactiflora group 2n = 2x = 10
    3 ‘珊瑚落日’ ‘Coral Sunset’ 杂种芍药品种群 Hybrid group 2n = 3x = 15
    4 ‘乳霜之愉’ ‘Cream Delight’ 杂种芍药品种群 Hybrid group 2n = 4x = 20
    5 ‘草原风情’ ‘Prairie Charm’ 伊藤杂种品种群 Itoh hybrid group 2n = 3x = 15
    6 ‘抓狂的香蕉’ ‘Going Bananas’ 伊藤杂种品种群 Itoh hybrid group 2n = 3x = 15
    下载: 导出CSV 
    | 显示表格

    于2018年9月中旬至11月底,剪除芍药地上枯茎,将地下根茎整体起挖,去除泥土、杂物,沿根茎生长方向将其理顺并去除多余的肉质根以使根茎清晰可见,拍照观察并记录芍药根茎的生长更新特征。

    选取不同品种当年生根茎芽基部1 cm以下的成熟根茎组织,沿其横轴切取约2 mm的薄片,FAA固定液(50%乙醇∶甲醛∶冰醋酸 = 90∶5∶5,体积比)真空固定处理24 h以上,随后加入约1/5 FAA体积甘油软化处理10 d以上,随后经脱水,透明,浸蜡,包埋后切片,切片厚度16 ~ 25 μm,经固绿−番红染色后中性树胶封片,Leica EZ4HD体式显微镜观察和拍照。

    体式显微观察:按照根茎的着生规律,切取发育正常的不同生长年限的根茎,冰盒保存带至实验室,用自来水冲洗3遍,去除根茎表面的泥土及其他杂质,置于吸水纸上室温晾1 ~ 2 h左右,观察时不锈钢刀片沿其横轴方向截平,将切口晾3 ~ 5 min后Leica EZ4HD体式显微镜拍照观察。

    石蜡切片制备:按照根茎的着生规律,选取发育正常的芍药不同生长年限的根茎按1.2.2所述方法进行切片观察。

    不同芍药品种群品种植株地下的组织架构基本一致,即由根茎、着生于根茎上的根茎芽和根3部分组成,根茎与肉质根在颜色上基本一致,除顶部根茎上着生的根茎芽外,下部根茎上也宿存大量处于休眠状态的根茎芽。正常发育的芍药地下根茎发育形态具有较明显的年龄分级特征,我们把当年根茎芽萌发后形成的根茎作为1龄生根茎,则1龄生根茎所着生的上一年形成的母代根茎则为2龄生根茎,2龄生根茎所着生的上一年形成的母代根茎为3龄生根茎,以此类推,各生长年限的根茎之间以根茎上宿存的茎或者残留的茎痕为界,偶见有当年生根茎着生于2龄以上的母代根茎(图1)。

    图  1  芍药根茎结构发育示意
    1YR:1龄生根茎;2YR:2龄生根茎;3YR:3龄生根茎;4YR:4龄生根茎;5YR:5龄生根茎;RB:根茎芽;St:茎;AR:不定根。1YR, 1 year old rhizome; 2YR, 2 years old rhizome; 3YR, 3 years old rhizome; 4YR, 4 years old rhizome; 5YR, 5 years old rhizome; RB, rhizome bud; St, stem; AR, adventitious root.
    Figure  1.  Structural characteristic of rhizome of herbaceous peony

    ‘种生粉’‘粉玉奴’‘Coral Sunset’‘Prairie Charm’和‘Going Bananas’5个品种地下根茎结构形态类似:每年的纵向(长度)生长量适中且横向(直径)膨大变异较小,不同龄级的根茎组织结构易于区分,且根茎背地向上更新(图2ab)。四倍体品种‘Cream Delight’每年纵向生长量小而横向生长量较大,膨大明显,不同龄级的根茎组织结构紧凑而不易区分,且往往与地表水平方向横向更新(图2cd)。

    图  2  芍药不同品种地下根茎发育结构特征
    a、b. ‘珊瑚落日’根茎;c、d. ‘草原风情’根茎;RB:根茎芽;Rt:根;Rh:根茎;St:茎。a, b, the rhizome of‘Coral Sunset’; c, d, the rhizome of ‘Cream Delight’; RB, rhizome bud; Rt, root; Rh, rhizome; St, stem.
    Figure  2.  Structural characteristics of rhizomes of different cultivars of herbaceous peony

    6个芍药品种根茎截面解剖构造均符合双子叶植物茎的次生构造,由周皮、皮层、次生韧皮部、形成层、次生木质部和中央髓组成(图3)。

    图  3  不同品种根茎解剖结构
    a、b. ‘大富贵’根茎解剖结构;c、d. ‘粉玉奴’根茎解剖结构;e、f. ‘珊瑚落日’根茎解剖结构;g、h. ‘乳霜之愉’根茎解剖结构;i、j. ‘草原风情’根茎解剖结构;k、l. ‘抓狂的香蕉’根茎解剖结构;Pe:周皮;Sp:次生韧皮部;Vc:维管形成层;Sx:次生木质部;Pi:髓。标尺 = 1 000 μm。a, b, rhizome anatomy of ‘Dafugui’; c, d, rhizome anatomy of ‘Fenyunu’; e, f, rhizome anatomy of ‘Coral Sunset’; g, h, rhizome anatomy of ‘Cream Delight’; i, j, rhizome anatomy of ‘Prairie Charm’; k, l, rhizome anatomy of ‘Going Bananas’; Pe, periderm; Sp, secondary phloem; Vc, vascular cambium; Sx, secondary xylem; Pi, pith. Scale bar = 1 000 μm.
    Figure  3.  Anatomical structure of rhizomes of different cultivars of herbaceous peony

    ‘种生粉’‘粉玉奴’‘Coral Sunset’和‘Cream Delight’4个品种根茎次生木质部显微结构类似:大小导管有规律地依次排列,口径较大的导管和周围的小导管聚集形成群团状,导管群分布较稀疏,两导管群之间的间隔明显。与‘Cream Delight’相比,‘Coral Sunset’的导管群分布较紧凑。‘Prairie Charm’和‘Going Bananas’根茎的次生木质部大小导管分布较均匀,形成较连续的环带,并不聚集形成团块状(图3)。

    芍药根茎截面在脱水后维管组织凸起,呈白色或淡黄色,间断环状分布,中央髓部组织下凹,位于不同环的维管组织从髓部向皮层呈放射状排列(图4)。

    图  4  芍药‘粉玉奴’根茎横切面结构
    a、b. 2龄生根茎;c、d. 6龄生根茎;Sx:次生木质部;Pi:髓。标尺 = 1 000 μm。a, b, 2 years old rhizome; c, d, 6 years old rhizome; Sx, secondary xylem; Pi, pith. Scale bar = 1 000 μm.
    Figure  4.  Cross section structure of rhizome of Paeonia lactiflora ‘Fenyunu’

    次生木质部显微观察结果显示,口径较大的导管及其周围的小导管聚集呈团块状,导管群切向断续排列成与形成层平行的环,形成清晰的生长轮(图5)。

    图  5  芍药‘粉玉奴’根茎横切面显微结构
    a. 2龄生根茎;b. 4龄生根茎;Vc:维管形成层;Pi:髓。标尺 = 1 000 μm。a, 2 years old rhizome; b, 4 years old rhizome; Vc, vascular cambium; Pi, pith. Scale bar = 1 000 μm.
    Figure  5.  Microstructure of the cross section of the rhizome of Paeonia lactiflora ‘Fenyunu’

    对生长发育正常的芍药不同生长年限根茎进行组织切片观察发现,一年生根茎生长轮数目为1(图6a),2年生根茎生长轮的数目为2(图6b),3年生根茎的生长轮数目为3(图6c),依此类推。生长轮的数目与其实际生长年限一致。

    图  6  芍药根茎不同生长年限生长轮观察
    a. 1龄生根茎;b. 2龄生根茎;c. 3龄生根茎;d. 4龄生根茎;e. 5龄生根茎;f、g. 6龄生根茎;h、i. 7龄生根茎;①. 第1个生长轮;②. 第2个生长轮;③. 第3个生长轮;④. 第4个生长轮;⑤. 第5个生长轮;⑥. 第6个生长轮;⑦. 第7个生长轮。标尺 = 1 000 μm。a, 1 year old rhizome; b, 2 years old rhizome; c, 3 years old rhizome; d, 4 years old rhizome; e, 5 years old rhizome; f, g, 6 years old rhizome; h, i, 7 years old rhizome; ①, the first growth ring; ②, the second growth ring; ③, the third growth ring; ④, the fourth growth ring; ⑤, the fifth growth ring; ⑥, the sixth growth ring; ⑦, the seventh growth ring. Scale bar = 1 000 μm.
    Figure  6.  Observation on the growth rings of the rhizome of herbaceous peony under a stereomicroscope

    根茎的形态及生长年限反映了植物在特定气候环境条件下的生长发育状况。准确判断根茎的年龄结构对预知植物个体乃至种群繁殖发育现状及未来更新的动态发展,由此制定合理的栽培及开发利用措施意义重大[1]。目前,对根茎类植物年龄结构的判断尚无统一标准和方法,一般是根据其实际栽培年限[8, 19-21]、营养繁殖世代特征结合颜色及直径大小等进行判断[2-3]。本研究中,芍药每年夏秋形成的当年生根茎由位于上一年形成的母代根茎芽发育而来,由此逐年进行世代更替,通过这种繁殖世代特征可以初步判断芍药根茎的年龄结构。芍药根茎芽的更新严格受控于顶端优势的调控[22],因而在发育正常的情况下,芍药的根茎一般按照实际生长年限逐级生长[18],但是,在本研究中,我们观察到在一些植株中当年生根茎由2龄或更高级年龄的母代根茎发育而来,若非经全株整体观察及长时间的持续追踪,完全按照根茎由上至下的分级次序来判别每一级根茎的生长年限往往存在一定的困难,对母代根茎的实际生长年限易造成误判。近年来兴起的草本植物生长轮研究为草本植物生长年限的研究提供了新的思路[1, 17, 21]。本研究中,芍药根茎的初生结构与茎的结构基本类似,由表皮、皮层、维管束和中央髓组成[18, 23]。与地上茎不同的是,芍药根茎的次生结构外围形成了具有保护作用的周皮组织,因而其能多年宿存生长。芍药不同龄级根茎中存在明显的生长轮,且生长轮的数目与其对应根茎的实际生长年限一致,可以作为判别芍药根茎实际生长年限的稳定依据。

    芍药根茎生长轮的组织形态和根茎的发育状况受植物本身遗传差异和栽培环境的影响。本研究中,考虑到供试样本栽培环境基本一致,不同品种根茎形态及生长轮的差异可能主要与其亲本来源不同有关。中国芍药品种群和杂种芍药品种群各品种亲本来源于芍药属(Paeonia)的多年生草本植物类群,品种群内各品种根茎生长轮的组织结构类似,木质部导管群断续排列成环,而伊藤杂种品种群内两个品种根茎次生木质部呈现连续的环带分布,主要是由于其亲本融合了芍药属亚灌木的牡丹类群的遗传信息,因而生长轮结构与牡丹茎的次生结构类似[23],据此,可以将其与其他两个品种群的品种进行区分。至于这种次生结构差异对其存活年限的影响有待进一步研究。

    植物多倍体往往具有营养器官大、抗逆性强、生长迅速等特点[24-27]。与二倍体品种相比,芍药多倍体品种往往也表现出茎秆粗壮、直立性强等生长优势[15,28-29]。本研究中,从根茎生长表现来看,四倍体品种‘Cream Delight’相同龄级的根茎体量明显大于二倍体及三倍体品种,由于根茎每年生长量大,加之向地伸展空间有限,因而多呈水平状横向更新。而三倍体品种根茎形态并未表现出与二倍体品种明显的生长差异,可能原因及调控机制有待进一步研究。从根茎生长轮的组织结构特征来看,同一品种群内相同倍性的品种间根茎生长轮特征基本类似,而不同倍性的品种间差异较大;而品种群间不同品种染色体倍性与其根茎形态无明显关联,‘Coral Sunset’‘Prairie Charm’和‘Going Bananas’3个品种均为三倍体,但是根茎次生结构差异明显。因而,仅根据遗传倍性不能区分各品种的根茎生长轮特征。当然,由于生长轮的形成和发育受环境条件影响较大,加之芍药品种遗传背景复杂,关于生长轮的发育特性在芍药中的更普遍规律需要结合更多样本开展更进一步的研究。

    根茎由于随着生长年限的增大,受限于材料的大小以及软硬程度的差异,采用组织切片的方法不能一一鉴别且花费时间较长,因而徒手切片结合体式显微观察可以作为多年生根茎年龄判别的快速方法。在生产实践中,我们可以通过上述徒手切片的一般操作方式快速地区分根茎与根,鉴定根茎的年龄结构。

    芍药不同品种地下根茎组织架构特征基本一致,且存在明显的龄级特征。二倍体及三倍体品种根茎形态发育特征相似,而与四倍体品种不同。不同芍药品种根茎次生结构均由周皮、皮层、次生韧皮部、形成层、次生木质部和中央髓组成,中国芍药及杂种芍药品种群品种根茎生长轮结构相似而与伊藤杂种差异明显,杂种芍药品种群内三倍体及四倍体品种根茎生长轮结构差异较大,根茎生长轮结构特征与其品种倍性无关。芍药根茎中存在生长轮,且其数目能够反映芍药的实际生长年限。

  • 图  1   研究区位置和样地分布

    Figure  1.   Location of the study area and spatial distribution of sampling points

    图  2   4种数据集场景下的最佳估算模型

    注:黑色实线表示1∶1验证线,红色虚线表示拟合线。

    Figure  2.   The best model estimation results for four dataset scenarios

    图  3   4种数据集场景下的模型准确性评估结果

    Figure  3.   Model accuracy evaluation results for four dataset scenarios

    图  4   4种数据集场景下基于3种特征选择方法和5种机器学习算法的模型准确性评估结果

    Figure  4.   Model accuracy evaluation results based on three feature selection methods and five machine learning algorithms for four dataset scenarios

    图  5   基于3种特征选择方法的CatBoost模型的相关性和重要性分析

    Figure  5.   Correlation and importance analysis of CatBoost models for three feature selection methods

    图  6   研究区森林蓄积量空间分布图

    Figure  6.   Forest GSV Spatial distribution maps in the study area

    表  1   基于遥感影像提取的变量

    Table  1   Variables extracted from the remote sensing images

    影像类别
    变量类别
    变量名称
    GF-1 波段反射率
    B1 (Blue),B2 (Green),B3 (Red),B4 (NIR)
    植被指数
    改良土壤调整植被指数 (MSAVI)
    归一化差值植被指数 (NDVI)
    优化的土壤调整植被指数 (OSAVI)
    比值植被指数 (RVI)
    土壤调整植被指数 (SAVI)
    增强型植被指数 (EVI)
    纹理特征
    Bi_jCon,Bi_jDis,Bi_jMea,Bi_jHom,Bi_jSeM,Bi_jEnt,Bi_jVar,Bi_jCor
    Sentinel-2 波段反射率
    b2 (Blue),b3 (Green),b4 (Red),b5 (Red Edge1),b6 (Red Edge2),b7 (Red Edge3), b8 (NIR),b8A (Narrow NIR),b11 (SWIR1),b12 (SWIR2)
    纹理特征
    bi_jCon,bi_jDis,bi_jMea,bi_jHom,bi_jSeM,bi_jEnt,bi_jVar,bi_jCor
    Sentinel-1 后向散射系数
    VH,VV
    纹理特征 VH/VV_jCon,VH/VV_jDis,VH/VV_jMea,VH/VV_jHom,VH/VV_jSeM,VH/VV_jEnt,VH/VV_jVar,VH/VV_jCor
    ASTER GDEM 地形因子 海拔,坡度,坡面
    注:i表示波段,j表示窗口大小 (3 × 3,5 × 5,7 × 7,9 × 9),Con表示对比度,Dis表示异质性,Mea表示均值,Hom表示同质性,SeM表示二阶矩,Ent表示信息熵,Var表示方差,Cor表示相关性。
    下载: 导出CSV

    表  2   4种数据集情景下蓄积量建模的变量选择结果

    Table  2   Variable selection results for growing stock volume modeling under four dataset scenarios

    数据集 特征选择方法 选择的变量数量 选择的变量名称
    GF-1 + Sentinel-2
    (Gf1s2)
    VSURF 7 B2_3SeM,B2_9Dis,B4_3Con,B4_3Co,B4_3SeM,B4_5Ent,B4_7Ent
    RFE 16 B1_9Hom,B2_3Var,B2_5Cor,B2_7Hom,B2_9Cor,B4_3Con,B4_3Cor,B4_3Dis,B4_3Hom,B4_3Var,B4_5Hom,B4_7SeM,B4_9SeM,B4_9Ent,b7_9Hom,b8A_3Var
    Boruta 8 B2_9Ent,B4_3Dis,B4_3Var,B4_5Hom,B4_7Ent,B4_7SeM,B4_9Ent,b7_3cor
    Sentinel-2 + Sentinel-1
    (S2s1)
    VSURF 6 b4_7Mea,b6_9Hom,b7_3Con,VH_3SeM,VH_7Hom,VV_9Hom
    RFE 8 b6_5Cor,b6_7Mea,b6_9Mea,b7_3Cor,b8_3Ent,VH_3Var,VH_5Cor,VV_9Cor
    Boruta 6 b4_7Cor,b7_3Cor,b7_5Cor,b11_5Ent,VH_3Var,VH_7mea
    GF-1 + Sentinel-1
    (Gf1s1)
    VSURF 7 B2_9Dis,B4_3Con,B4_3Cor,B4_3SeM,B4_9Hom,VH_7Hom,VV_9Hom
    RFE 18 B2_7Hom,B4_3Con,B4_3Cor,B4_3Dis,B4_3Var,B4_5Hom,B4_7Dis,B4_9Hom,VV,VH_3Var,VV_3Mea,VH_5Cor,VV_5Mea,VH_7Mea,VH_9Cor,VH_9Hom,VV_9Cor,VV_9Var
    Boruta 13 B2_3Var,B2_9Dis,B2_9Ent,B4_3Con,B4_3Dis,B4_3Var,B4_3Hom,B4_5Hom,B4_7Ent,B4_7Hom,B4_9SeM,VH_7Mea,VV_9Cor
    GF-1 + Sentinel-2 + Sentinel-1 + ASTER GDEM (Gf1s2s1dem) VSURF 9 B2_9Dis,B3_9Var,B4_3Con,B4_3Cor,B4_3Ent,B4_3SeM,B4_5Ent,B4_9Ent,VV_9Hom
    RFE 18 B2_7Hom,B3_7Hom,B4_3Con,B4_3Cor,B4_3Dis,B4_3Var,B4_5Hom,B4_9Hom,b2_9Con,b2_9Dis,b5_9SeM,VH_3Var,VV_3Mea,VV_5Mea,VH_7Mea,VH_9Cor,VV_9Cor,Slope
    Boruta 8 B4_3Con,B4_3Dis,B4_3Var,B4_3Hom,B4_5Hom,B4_9SeM,b4_7Cor,VH_7Cor
    下载: 导出CSV

    表  3   3个因素的R2、RMSE和MAE的方差分析结果

    Table  3   ANOVA of R2, RMSE, and MAE for three different factors and their interaction

    因素dfR2RMSE/(m3·hm−2)MAE/(m3·hm−2)
    Sumsqη2PSumsqη2PSumsqη2P
    数据集30.100.083.120 × 10−5 ***17.570.085.010 × 10−6 ***20.700.133.720 × 10−7 ***
    特征选择20.020.022.610 × 10−2 *4.020.029.782 × 10−3**6.120.047.000 × 10−4 ***
    机器学习算法40.880.764.490 × 10-14 ***158.260.743.990 × 10-15 ***103.030.669.400 × 10-14 ***
    数据集 × 特征选择60.020.010.407 45.390.034.862 × 10−2 *4.600.035.070 × 10−2·
    数据集 × 机器学习算法120.030.030.422 05.750.030.256 7173.170.020.592 62
    特征选择 × 机器学习算法80.060.051.280 × 10−2 *15.370.075.910 × 10−4 ***10.050.063.39 × 10−3 **
    残差240.068.537.36
    注:·表示在0.05水平上显著,*表示在0.01水平上显著,**表示在0.001水平上显著,***表示在0.00水平上显著。
    下载: 导出CSV
  • [1]

    Lindberg E, Hollaus M. Comparison of methods for estimation of stem volume, stem number and basal area from Airborne Laser Scanning Data in a Hemi-Boreal Forest[J]. Remote Sensing, 2012, 4(4): 1004. doi: 10.3390/rs4041004

    [2]

    Li X Y, Zhang M, Long J P, et al. A novel method for estimating spatial distribution of forest above-ground biomass based on multispectral fusion data and ensemble learning algorithm[J]. Remote Sensing, 2021, 13(19): 3910. doi: 10.3390/rs13193910

    [3]

    Kumar L, Sinha P, Taylor S, et al. Review of the use of remote sensing for biomass estimation to support renewable energy generation[J]. Journal of Applied Remote Sensing, 2015, 9.

    [4]

    Sinha S, Jeganathan C, Sharma L K, et al. A review of radar remote sensing for biomass estimation[J]. International Journal of Environmental Science and Technology, 2015, 12(5): 1779−1792. doi: 10.1007/s13762-015-0750-0

    [5]

    Laurin G V, Chen Q, Lindsell J A, et al. Above ground biomass estimation in an African tropical forest with lidar and hyperspectral data[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2014, 89: 49−58. doi: 10.1016/j.isprsjprs.2014.01.001

    [6]

    Soja M J, Quegan S, D'Alessandro M M, et al. Mapping above-ground biomass in tropical forests with ground-cancelled P-band SAR and limited reference data[J]. Remote Sensing of Environment, 2021, 253.

    [7]

    López-Serrano P M, López-Sánchez C A, Alvarez-González J G, et al. A comparison of machine learning techniques applied to landsat-5 TM spectral data for biomass estimation[J]. Canadian Journal of Remote Sensing, 2016, 42(6): 690−705. doi: 10.1080/07038992.2016.1217485

    [8]

    Fu B L, Wang Y Q, Campbell A, et al. Comparison of object-based and pixel-based random forest algorithm for wetland vegetation mapping using high spatial resolution GF-1 and SAR data[J]. Ecological Indicators, 2017, 73: 105−117. doi: 10.1016/j.ecolind.2016.09.029

    [9]

    Feng L, Li J, Gong W S, et al. Radiometric cross-calibration of Gaofen-1 WFV cameras using Landsat-8 OLI images: a solution for large view angle associated problems[J]. Remote Sensing of Environment, 2016, 174: 56−68. doi: 10.1016/j.rse.2015.11.031

    [10]

    Liu Y A, Gong W S, Xing Y Q, et al. Estimation of the forest stand mean height and aboveground biomass in Northeast China using SAR Sentinel-1B, multispectral Sentinel-2A, and DEM imagery[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2019, 151: 277−289. doi: 10.1016/j.isprsjprs.2019.03.016

    [11] 张方圆, 吴胜义, 乔海亮, 等. 基于Landsat 8 OLI和资源3号立体像对数据的桉树森林蓄积量估测[J]. 中南林业科技大学学报, 2024, 44(5): 93−101.

    Zhang F Y, Wu S Y, Qiao H L, et al. Eucalyptus forest stock estimation study based on Landsat 8 OLI and Resource 3 stereo image[J]. Journal of Central South University of Forestry & Technology, 2024, 44(5): 93−101.

    [12]

    Agjee N H, Ismall R, Mutanga O. Identifying relevant hyperspectral bands using Boruta: a temporal analysis of water hyacinth biocontrol[J]. Journal of Applied Remote Sensing, 2016, 10: 042002. doi: 10.1117/1.JRS.10.042002

    [13]

    Ma L, Li M C, Ma X X, et al. A review of supervised object-based land-cover image classification[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2017, 130: 277−293. doi: 10.1016/j.isprsjprs.2017.06.001

    [14]

    Luo M, Wang Y F, Xie Y H, et al. Combination of feature selection and CatBoost for prediction: the first application to the estimation of aboveground biomass[J]. Forests, 2021, 12(2): 216. doi: 10.3390/f12020216

    [15] 刘兆华, 林辉, 龙江平, 等. 基于高分二号的旺业甸林场蓄积量估测模型研究[J]. 中南林业科技大学学报, 2020, 40(3): 79−84,118.

    Liu Z H, Lin H, Long J P, et al. Study on volume estimation model of Wangyedian forest farm based on GF-2[J]. Journal of Central South University of Forestry& Technology, 2020, 40(3): 79−84,118.

    [16] 王海宾, 彭道黎, 高秀会, 等. 基于GF-1 PMS影像和k-NN方法的延庆区森林蓄积量估测[J]. 浙江农林大学学报, 2018, 35(6): 1070−1078. doi: 10.11833/j.issn.2095-0756.2018.06.010

    Wang H B, Peng D L, Gao X H, et al. Forest stock volume estimates in Yanqing District based on GF-1 PMS images and k-NN method[J]. Journal of Zhejiang Agriculture and Forestry University, 2018, 35(6): 1070−1078. doi: 10.11833/j.issn.2095-0756.2018.06.010

    [17] 刘美艳, 聂胜, 王成, 等. 基于ICESat-2和Sentinel-2A数据的森林蓄积量反演[J]. 自然资源遥感, 2024, 36(1): 210−216.

    Liu M Y, Nie S, Wang C, et al. Forest stock volume inversion based on ICESat-2 and Sentinel-2A data[J]. Remote Sensing for Natural Resources, 2024, 36(1): 210−216.

    [18]

    Zhang C Y, Denka S, Cooper H, et al. Quantification of sawgrass marsh aboveground biomass in the coastal Everglades using object-based ensemble analysis and Landsat data[J]. Remote Sensing of Environment, 2018, 204: 366−379. doi: 10.1016/j.rse.2017.10.018

    [19]

    Wang J, Xu J, Peng Y, et al. Prediction of forest unit volume based on hybrid feature selection and ensemble learning[J]. Evolutionary Intelligence, 2020, 13(1): 21−32. doi: 10.1007/s12065-019-00219-4

    [20]

    Haralick R M, Shanmugam K, Dinstein I. Textural features for image classification[J]. IEEE Transactions on Systems, Man, and Cybernetics, 1973, SMC-3(6): 610−621. doi: 10.1109/TSMC.1973.4309314

    [21]

    Genuer R, Poggi J-M, Tuleau-Malot C. Variable selection using random forests[J]. Pattern Recognition Letters, 2010, 31(14): 2225−2236. doi: 10.1016/j.patrec.2010.03.014

    [22]

    Zhang Y Z, Liang S L, Sun G Q. Forest biomass mapping of Northeastern China using GLAS and MODIS Data[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2014, 7(1): 140−152. doi: 10.1109/JSTARS.2013.2256883

    [23]

    Kursa M B, Jankowski A, Rudnicki W R. Boruta - a system for feature selection[J]. Fundamenta Informaticae, 2010, 101(4): 271−286. doi: 10.3233/FI-2010-288

    [24]

    Mountrakis G, Im J, Ogole C. Support vector machines in remote sensing: a review[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2011, 66(3): 247−259. doi: 10.1016/j.isprsjprs.2010.11.001

    [25]

    Chirici, G, Mura M, McInerney D, et al. McRoberts. a meta-analysis and review of the literature on the k-nearest neighbors technique for forestry applications that use remotely sensed data[J]. Remote Sensing of Environment, 2016, 176: 282−294. doi: 10.1016/j.rse.2016.02.001

    [26]

    Breiman L. Random Forests[J]. Machine Learning, 2001, 45(1): 5−32. doi: 10.1023/A:1010933404324

    [27]

    Dorogush A V, Ershov V, Gulin A. CatBoost: gradient boosting with categorical features support[Z]. arXiv. 2018.

    [28]

    Chen T, Guestrin C. XGBoost: a scalable tree boosting system[Z]. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco, California, USA; Association for Computing Machinery. 2016: 785–794.

    [29]

    Zhang N, Chen M J, Yang F, et al. Forest height mapping using feature selection and machine learning by integrating multi-source satellite data in Baoding City, North China[J]. Remote Sensing, 2022, 14(18).

    [30]

    Chen M J, Qiu X C, Zeng W S, et al. Combining sample plot stratification and machine learning algorithms to improve forest aboveground carbon density estimation in Northeast China using airborne LiDAR Data[J]. Remote Sensing, 2022, 14(6): 1477. doi: 10.3390/rs14061477

    [31]

    Guiying L, Dengsheng L, Emilio M, et al. Comparative analysis of classification algorithms and multiple sensor data for land use/land cover classification in the Brazilian Amazon[J]. Journal of Applied Remote Sensing, 2012, 6(1): 061706. doi: 10.1117/1.JRS.6.061706

    [32]

    Li Y C, Li C, Li M Y, et al. Influence of variable selection and forest type on forest aboveground biomass estimation using machine learning algorithms[J]. Forests, 2019, 10(12): 1073. doi: 10.3390/f10121073

  • 期刊类型引用(4)

    1. 王慧娟,王二强,符真珠,李艳敏,王晓晖,袁欣,高杰,王利民,张和臣. 芍药根茎形成发育过程中内源激素和碳水化合物的变化. 河南农业科学. 2024(03): 118-124 . 百度学术
    2. 魏瑶,王娟,张岗,彭亮,颜永刚,陈莹. 不同年限黄芩根结构及黄酮类物质变化特征研究. 中南药学. 2023(01): 116-122 . 百度学术
    3. 董志君,高健洲,于晓南. 烯效唑对盆栽芍药生理特性及显微结构的影响. 北京林业大学学报. 2022(07): 117-125 . 本站查看
    4. 李艳敏,蒋卉,符真珠,张晶,袁欣,王慧娟,高杰,董晓宇,王利民,张和臣. 芍药花药愈伤组织诱导及体细胞胚发生. 植物学报. 2021(04): 443-450 . 百度学术

    其他类型引用(3)

图(6)  /  表(3)
计量
  • 文章访问数:  18
  • HTML全文浏览量:  9
  • PDF下载量:  5
  • 被引次数: 7
出版历程
  • 收稿日期:  2024-10-07
  • 修回日期:  2024-12-02
  • 录用日期:  2025-04-06
  • 网络出版日期:  2025-04-08

目录

/

返回文章
返回