Application of ANN-BiLSTM model to long-term gap-filling of carbon flux data in temperate desert shrub
-
摘要:目的 为提高净生态系统碳交换量(NEE)在长期缺失下的插补精度,利用人工神经网络(ANN)和双向长短期记忆网络(Bi-LSTM)将NEE的环境因子和时序特征相结合,提出了ANN-BiLSTM模型。方法 以宁夏盐池观测站NEE数据及微气象数据为研究对象,通过随机剔除连续7、15、30、45和90 d的5类缺失情景来评估ANN-BiLSTM模型、随机森林(RF)、人工神经网络(ANN)、K最邻近(KNN)、支持向量回归(SVR)和边际分布采样法(MDS)在NEE长期缺失下的插值结果。结果 当NEE缺失天数≤30 d时,各模型的插值精度相对可靠,ANN-BiLSTM模型的插值精度最高,决定系数(R2)均值在0.48 ~ 0.56之间,均方根误差(RMSE)和平均绝对误差(MAE)分别在0.68 ~ 1.92 μmol/(m2·s)、0.45 ~ 1.30 μmol/(m2·s)之间。当数据缺失天数 ≥ 45 d时,MDS不能对缺失值进行处理,ANN-BiLSTM模型的插值精度明显高于机器学习模型,R2均值 > 0.45,RMSE和MAE分别在0.79 ~ 1.95 μmol/(m2·s)、0.50 ~ 1.32 μmol/(m2·s)之间。结论 当温带荒漠灌丛生态系统的NEE数据缺失长度 > 30 d时,建议应用ANN-BiLSTM模型对缺失数据进行插补,可以在一定程度上提高NEE长期插值结果的精度。
-
关键词:
- 碳通量 /
- ANN-BiLSTM /
- 机器学习 /
- 长期插值
Abstract:Objective In order to improve the gap-filling accuracy of net ecosystem productivity (NEE) under long-term missing, this study used the artificial neural network (ANN) and bi-directional long short-term memory (Bi-LSTM) to combine the environmental factors and temporal characteristics of NEE, proposing the ANN-BiLSTM model.Method This study took the NEE data and micro-meteorological data of Yanchi Observatory in Ningxia of northwestern China as the research object, and evaluated the gap-filling results of the ANN-BiLSTM model, random forest (RF), ANN, K-nearest neighbor (KNN), support vector regression (SVR) and marginal distribution sampling (MDS) under long-term absence of NEE by randomly eliminating five kinds of missing scenarios for 7, 15, 30, 45 and 90 d.Result When the number of missing days was ≤ 30 d, the gap-filling accuracy of each model was relatively reliable. The ANBiLSTM model had the highest gap-filling accuracy. The mean coefficient of determination (R2) was 0.48−0.56. The root mean squares of errors (RMSE) and mean absolute error (MAE) were 0.68−1.92 μmol/(m2·s) and 0.45−1.30 μmol/(m2·s). When the missing data days were ≥ 45, MDS cannot process missing values. The gap-filling accuracy of ANN-BiLSTM model was significantly higher than machine learning. The mean value of R2 > 0.45, RMSE and MAE were 0.79−1.95 μmol/(m2·s) and 0.50−1.31 μmol/(m2·s).Conclusion When the length of missing NEE data in temperate desert shrub ecosystems is > 30 d, we suggest to use ANN-BiLSTM to interpolate the missing data, which can improve the accuracy of long-term NEE gap-filling results to a certain extent.-
Keywords:
- carbon flux /
- ANN-BiLSTM /
- machine learning /
- long-term gap-filling
-
涡度相关法(eddy covariance,EC)是目前测定大气与植被群落间净生态系统碳交换量(net ecosystem productivity,NEE)最直接且理论与技术发展最为迅速的一种微气象学方法[1−2],为分析陆地生态系统碳循环格局提供了基础数据[3]。然而受气象条件和数据质量控制等影响,EC的观测数据往往会出现缺失,在仪器故障时还会造成长达半个月甚至一个月的缺失[4−5],为了获得完整的碳通量数据集,我们需要选择合理的插补方法对缺失数据进行插补[6]。
目前常用的NEE插补方法有平均昼夜变化法(mean diurnal variation,MDV)、查表法(look-up table,LUT)、边际分布采样法(marginal distribution sampling,MDS)和非线性回归法(non-linear regression,NLR)等[7−13]。MDV使用邻近一段时间内相同时段的观测平均值来代替缺失值,插值结果较为可靠。但是该方法没有利用气象因子,在极端晴天或阴天条件下会产生偏差[14]。NLR和LUT保留了NEE与气象因子的响应关系[15−16]。NLR通过建立一定时间内气象因子与有效NEE数据之间的经验方程来对缺失数据进行插补[4,16],能够反应NEE的变化特征。但是该方法只能产生平均NEE值,无法模拟NEE的高频波动,造成低通滤波和高频特征损失,因此限制了该方法在NEE插补中的应用[17]。LUT以气象变量建立索引表,根据缺失数据时段的气象条件在索引表中查找相似环境下的观测值来代替缺失数据,插值结果要优于MDV[14−15],但会受到索引表选取的时间、云量和干旱等因素的影响[14]。Reichstein等[18]将MDV和LUT方法结合,提出的MDS方法是填补短期NEE数据的有效插补方法,已经成为大多通量观测网处理NEE缺失数据的标准方法[18]。然而MDS并不是为了填补长期缺失数据所设计的[19],更适用于NEE数据连续缺失小于15 d的情景[20],对于超过15 d的长时间缺失,MDS的性能会显著下降[21]。近年来,随机森林(random forest,RF)、人工神经网络(artificial neural network,ANN)、K最邻近(K-nearest neighbor,KNN)和支持向量回归(support vector regression,SVR)等机器学习模型用于缺失通量数据插补中的研究逐渐兴起。由于可以纳入更多的环境变量模拟与输出变量之间的非线性关系,机器学习的表现往往优于传统插补方法[19,22],广泛应用于NEE的插补中[11,17,20−22]。然而在填补超过30 d的缺失数据时,机器学习模型的插补精度会大幅下降[21]。ANN-BiLSTM模型由ANN和双向长短期记忆网络(bi-directional long short-term memory,Bi-LSTM)集合而成,不仅保留了环境因子与NEE之间的响应关系,还引入了NEE在时间上的自相关性,可以综合NEE的环境因子和时序特征来更加精确模拟NEE变化的内在机制。
我国已有的NEE插值研究多集中于森林生态系统[11,14−15,20,23],但在荒漠生态系统中少有研究。荒漠生态系统不仅在温度和降水方面具有更高的季节和年际变异[24],而且荒漠生态系统的NEE和环境因子具有多时间相关性[25],而这很可能给NEE的插值结果带来变化。尤其在NEE数据长期缺失下,现有插值方法的插补效果大幅下降[19−21],甚至会产生错误数据,导致模型模拟数据质量的降低,还会引起NEE与气候变量之间的关系发生失真[17],降低了气候变化背景下对荒漠生态系统碳收支预测的准确性。
基于上述认识和分析,本研究以宁夏盐池毛乌素沙地生态系统国家定位观测实验站(盐池站)黑沙蒿(Artemisia ordosica)灌丛2017−04−04—2018−12−31的碳通量数据为例,通过随机剔除连续7、15、30、45和90 d的5类缺失情景来评估ANN-BiLSTM、RF、ANN、KNN、SVR和MDS在不同缺失天数下的插值结果,以期为温带荒漠灌丛生态系统碳通量的长期插补提供数据支撑和方法参考。
1. 研究区概况与研究方法
1.1 研究地概况
研究地位于宁夏盐池毛乌素沙地生态系统国家定位观测实验站(37°42′31″N,107°13′37″E,海拔1 530 m),地处毛乌素沙地西南缘,属中温带大陆性季风半干旱气候区,年均气温 8.3 ℃(1954—2014年),年均降水量约292 mm,远低于年潜在蒸散量(1 300 mm)。研究区内地带性自然植被主要为沙生灌丛群落,优势灌木有黑沙蒿、蒙古羊柴(Corethrodendron fruticosum var. mongolicum)和细枝羊柴(Corethrodendron scoparium)等,优势草本植物包括赖草(Leymus secalinus)和白草(Pennisetum flaccidum)等。
1.2 数据获取
试验数据通过涡度通量观测系统获取。涡度协方差观测系统主要由红外气体分析仪(LI-7200,LI-COR,USA)、三维超声风速仪(CSAT3,Campbell,USA)和数据采集器(LI-7550,LI-COR,USA)组成,安装在地面以上6.2 m高度(植被平均高度约1.5 m)。原始数据采样频率为10 Hz。微气象测定仪器包括空气温、湿度传感器(HMP155A,Vaisala,Finland)、光量子传感器(PAR-LITE,Kipp & Zonen,the Netherlands)、总辐射量传感器(CMP3,Kipp & Zonen,the Netherlands)和翻斗式雨量筒(TR-525M,Campbell,USA)等。10、30、70和120 cm 4个深度的土壤温度和土壤含水量由ECH2O-5TE传感器(METER Environment,Pullman,USA)测量。有关仪器配置和维护的详细信息,参见Jia等[25−26]。
1.3 通量数据处理
采用EddyPro 4.0.0软件(LI-COR,USA)对半小时的涡度数据进行预处理,主要的预处理步骤包括野点剔除、二次坐标轴旋转、频率响应校正和WPL校正等操作,并剔除低于摩擦风速(µ*)阈值的夜间部分[27],通过此质量控制得到的CO2通量即为NEE。由于盐池站2017及2018年NEE缺失率相对较低,因此本研究选取2017−04−04—2018−12−31的NEE数据及微气象数据作为试验数据集,数据缺失情况见表1。
表 1 净生态系统交换量和环境因子缺失数据统计Table 1. Statistical analysis of missing data of net ecosystem exchange and environmental factors季节
Season数据总条数
Total number of data有效数据条数
Number of valid data缺失数据条数
Number of missing data缺失率
Rate of loss/%春季 Spring 7 171 5 129 2 042 28.5 夏季 Summer 8 832 6 316 2 516 28.5 秋季 Autumn 8 736 5 268 3 468 39.7 冬季 Winter 5 808 4 166 1 642 28.3 本研究通过随机剔除连续7、15、30、45和90 d(表2)的5类缺失情景来评估6种NEE插补模型在不同缺失天数下的插值结果,每类缺失约为试验数据集的20%。各类缺失片段随机重复10次,共生成50个缺失数据集。考虑到不同量纲的数据序列会增加数据处理成本与模型拟合时间,要对各数据集进行归一化处理。
表 2 5类数据缺失情景Table 2. Description of five gap scenarios缺失片段长度
Missing fragment length/d单位缺失片段数据条数
Number of missing pieces of data per unit缺失片段重复次数
Number of repeats in unit gap总缺失片段数据条数
Total number of missing pieces of data7 336 12 4 032 15 720 6 4 320 30 1 440 3 4 320 45 2 160 2 4 320 90 4 320 1 4 320 1.4 模拟方法
1.4.1 输入因子的选择
NEE取决于植被光合作用和呼吸作用的能力,这些过程主要受植被生长环境的影响[28]。光合有效辐射(photosynthetically active radiation,Par)是植被光合作用的最主要能量来源,直接影响着植物的生长、发育和生殖繁衍[29]。温度一方面会对植被光合作用能力产生重要影响,另一方面温度也是影响生态系统呼吸的关键因子[30−32]。由于荒漠生态系统气候干旱,降水稀少,植被长期面临水分胁迫的影响,因此植物根系发达,扎根较深,以便于吸收更深层的水分。同时,饱和水汽压差(vapor pressure deficit,VPD)可以反映空气的干燥程度,直接影响植物气孔的闭合,从而控制植物呼吸、光合等生理过程[33]。因此本研究选择空气温度(Ta)、土壤温度(Ts)、光合有效辐射(Par)、相对湿度(RH)、10 cm土壤含水率(SWC10)、30 cm土壤含水率(SWC30)、70 cm土壤含水率(SWC70)和VPD作为输入因子。
1.4.2 人工神经网络
ANN是基于计算机网络还原人脑或生物神经的网络结构和激励行为的并行非线性计算系统[34−35],主要通过自学习寻找输出变量与输入变量之间的映射关系,是NEE插补中较为常用的机器学习方法[20,23]。ANN主要由输入层、输出层以及中间的隐含层构成(图1),其学习过程由前向传播和反向传播组成。输入数据由输入层进入神经网络各结点后,各输入变量乘以其结点的相应权重值,经激活函数等作用后由输出层输出。若结果与预期结果误差较大,则通过反复修正各层神经元之间的连接权重进行反向传播,令损失函数的值最优,实现网络实际输出与期望输出误差最小化。神经网络中单个神经元模型见图2。
图 1 ANN结构图引自文献[36]。Xn.输入因子;Ta. 空气温度;Ts. 土壤温度;Par. 光合有效辐射;VPD. 饱和水汽压。f(·)表示激活函数。Cited from literature [36]. Xn, input factor; Ta, air temperature; Ts, soil temperature; Par, photosynthetically active radiation; VPD, vapor pressure deficit. f(·) expresses activation function.Figure 1. Diagram of ANN structure图 2 神经元模型示意图引自文献[36]。θj为第j个神经元的阈值,ωij为第i个输入信号与第j个神经元之间的连接权值,ωnj为第n个输入信号与第j个神经元之间的连接权值,yj为输出结果。Cited from literature[36]. θj is the threshold of the neuron.ωij is the connection weight between the input signal of i and the neuron of j. ωnj is the connection weight between the input signal of n and the neuron of j. yj is the output.Figure 2. Schematic diagram of neuron model若神经元的输入信号为Xi,i=1,2,···,n,输出为yj,则第j个神经元模型的输入输出关系为
Sj=n∑i=1(ωijXi)−θj (1) yj=f(Sj) (2) 式中:θj为第j个神经元的阈值,ωij为第i个输入信号与第j个神经元之间的连接权值,f为神经元j的激活函数。
1.4.3 双向长短期记忆网络
LSTM的每个神经元由输入门( {\boldsymbol I} )、输出门( {\boldsymbol o} )、遗忘门( {\boldsymbol f} )和记忆单元( {\boldsymbol c} )组成,并通过这些结构来控制历史信息对当前信息的影响,从而更好地捕捉时间序列中的长期依赖关系。LSTM单元结构如图3所示。
图 3 LSTM单元结构引自文献[37]。 {{\boldsymbol{x}}}_{t} 为t时刻NEE的输入值; {{\boldsymbol{c}}}_{t} 为t时刻记忆单元状态; {{\boldsymbol{c}}}_{t-1} 为t−1时刻记忆单元状态;σ为sigmoid函数;ht为t时刻输出;tanh为神经网络中的激活函数。Cited from literature[37]. {{\boldsymbol{x}}}_{t} is the input value of NEE at time t. {{\boldsymbol{c}}}_{t} is the state of memory unit at time t. {{\boldsymbol{c}}}_{t-1} is the state of memory unit at time t−1. σ is sigmoid function. {{\boldsymbol{h}}}_{t} is the current output; tanh is activation function of neural network.Figure 3. Unit construction of LSTMt时刻,LSTM的输入门 {{\boldsymbol I}}_{t} 、遗忘门 {{\boldsymbol f}}_{t} 、输出门 {{\boldsymbol o}}_{t} 、记忆单元的当前状态 {{\boldsymbol c}}_{t} 、单元结构的当前输出 {{\boldsymbol h}}_{t} 分别为
{{\boldsymbol I}}_{t}=\sigma \left({{\boldsymbol W}}_{{\boldsymbol I}} \cdot \left[{{\boldsymbol h}}_{{t}-1},{{\boldsymbol x}}_{t}\right] + {{\boldsymbol b}}_{{\boldsymbol I}}\right) (3) {{\boldsymbol f}}_{t}=\sigma \left({{\boldsymbol W}}_{{\boldsymbol f}} \cdot \left[{{\boldsymbol h}}_{{t}-1},{{\boldsymbol x}}_{t}\right] + {{\boldsymbol b}}_{{\boldsymbol f}}\right) (4) {{\boldsymbol o}}_{{t}}=\sigma \left({{\boldsymbol W}}_{{\boldsymbol o}} \cdot \left[{{\boldsymbol h}}_{{t}-1},{{\boldsymbol x}}_{t}\right] + {{\boldsymbol b}}_{{\boldsymbol o}}\right) (5) {{\boldsymbol c}}_{t}={{\boldsymbol f}}_{t}{{\boldsymbol c}}_{{t}-1} + {{\boldsymbol I}}_{t}\tanh\left({{\boldsymbol W}}_{{\boldsymbol{c}}} \left[{{\boldsymbol h}}_{{t}-1},{{\boldsymbol x}}_{t}\right] + {{\boldsymbol b}}_{{\boldsymbol c}}\right) (6) {{\boldsymbol h}}_{t}={{\boldsymbol o}}_{t}\tanh\left({{\boldsymbol c}}_{t}\right) (7) 式中: {{\boldsymbol x}}_{t}=[{x}_{1},{x}_{2}, \cdots ,{x}_{n}] 为t时刻NEE的输入值, {{\boldsymbol W}}_{{\boldsymbol I}} 、 {{\boldsymbol W}}_{{\boldsymbol f}} 、 {{\boldsymbol W}}_{{\boldsymbol o}} 、 {{\boldsymbol W}}_{{\boldsymbol c}} 为输入门 {{\boldsymbol I}}_{t} 、遗忘门 {{\boldsymbol f}}_{t} 、输出门 {{\boldsymbol o}}_{t} 和记忆单元状态 {{\boldsymbol c}}_{t} 的权重矩阵; {{\boldsymbol b}}_{{\boldsymbol I}} 、{{\boldsymbol b}}_{{\boldsymbol f}} 、{{\boldsymbol b}}_{{\boldsymbol o}}、{{\boldsymbol b}}_{{\boldsymbol c}} 为输入门 {{\boldsymbol I}}_{t} 、遗忘门 {{\boldsymbol f}}_{t} 、输出门 {{\boldsymbol o}}_{t} 和记忆单元状态 {{\boldsymbol c}}_{t} 的偏移量,σ为sigmoid函数, {{\boldsymbol h}}_{{t}-1} 为t−1时刻的输出。
Bi-LSTM模型由前向LSTM与后向LSTM组合而成,可以充分提取序列自身的前向及反向关联关系。
1.4.4 ANN-BiLSTM集成模型
集成学习的基本思想是通过构建多个学习器来完成学习任务,同单一的学习器相比,集成学习具有更强的非线性表达能力,泛化性能更好[38]。目前较为常用的集成模型有Boosting、Bagging和Stacking。Stacking模型是指训练一个用于组合所有个体学习器的模型,即利用数据集训练出若干个个体学习器后,再将这些个体学习器的预测结果作为新的训练集来训练元学习器,从而得到最终的输出结果。
ANN-BiLSTM集成模型由ANN学习器和Bi-LSTM学习器集合而成,模型结构见图4。其中ANN用于捕捉环境因子与NEE的关系,t时刻该模型的输入数据为[Tat,Tst, Part, VPDt,RHt,SWC10t,SWC30t,SWC70t]。Bi-LSTM用于捕捉NEE自身的时序特征,时间步参数为3,t时刻(t > 3)该模型的输入数据为[NEEt − 3,NEEt − 2,NEEt − 1,NEEt + 1,NEEt + 2,NEEt + 3]。然后将ANN及Bi-LSTM模拟得到的NEE值作为输入值,经过全连接层后得到NEE最后的模拟结果。
图 5 6种NEE插补模型在不同缺失天数下的插补效果对比NEE.生态系统碳交换量(μmol/(m2·s),以CO2物质的量计);RMSE. 插补所得NEE与实测NEE的均方根误差;MAE. 平均绝对误差;R2. 决定系数。图中箱体内的横线为插值结果的中位线,●为插值结果的均值,◇为插值结果中的异常值。箱体的上边缘线为第三分位数(Q3),下边缘线为第一分位数(Q1),Q3与Q1的差距为四分位间距(IQR)。箱体外的上横线代表插值结果的最大值(Q3 + 1.5IQR),下横线代表插值结果的最小值(Q1 − 1.5IQR)。下同。NEE, net ecosystem carbon exchange(μmol/(m2·s)), based on the amount of CO2 substances); RMSE, root mean squared error between measured NEE and predicted NEE; MAE, mean absolute error; R2, coefficient of determination. The horizontal line in the box is the median line of gap-filling result, ● is the mean value of gap-filling result, ◇ is the outliers of gap-filling result. The upper edge line of the box body is the third quantile (Q3), the lower edge line is the first quantile (Q1), and the gap between Q3 and Q1 is interquartile range (IQR). The upper horizontal line on the outside of the box body represents the maximum value of the gap-filling result (Q3 + 1.5IQR), and the lower horizontal line represents the minimum value of the gap-filling result (Q1 − 1.5IQR). The same below.Figure 5. Comparison of gap-filling effects of six NEE gap-filling models under different missing days1.4.5 随机森林模型
RF[39]是一种典型的集成学习算法,学习速度快,其结果具有可解释性,并且可以防止过拟合和共线性问题。
1.4.6 支持向量回归
SVR把输入变量映射到高维特征空间并找到最优超平面,从而将复杂的非线性问题转换为线性问题[40]。
1.4.7 K最邻近
KNN[41]是在样本集合空间中选择与预测样本最相似的K个训练样本,并选取训练样本的均值或中位数作为预测结果。
本研究以80%及20%的比例随机将数据集划分为训练集和测试集,训练集用于插补模型的训练,测试集用于插补模型的评价,最后将缺失数据集放入训练完成的模型中,对缺失的NEE数据进行预测。通过计算预测值和真实值的均方根误差(root mean squares of errors,RMSE)、平均绝对误差(mean absolute error,MAE)和决定系数(coefficient of determination,R2)来衡量不同模型在缺失数据集中的插补精度。
1.4.8 边际分布采样法
MDS是欧洲通量网和FLUXNET(全球长期通量观测网络)处理缺失值的标准方法[18]。MDS综合了MDV与LUT方法,当Ta、总辐射(Rg)和VPD观测数据均可用时,使用LUT方法在一定的时间窗口(缺失数据前后14 ~ 28 d)内进行插补;当仅有Rg数据时,依旧使用LUT方法进行插补,但是时间窗口要缩小至前后14 d;当气象数据全部缺失时,使用MDV方法插补。MDS模型由R 程序包‘REddyProc’完成。
本研究所用程序设计语言为Python 3.8,集成开发环境为Anaconda 3。ANN-BiLSTM模型、RF模型、ANN模型、SVR模型及KNN模型的编写和调参由Keras 2.7.0、TensorFlow 2.7.0及NNI 2.5完成。各模型的超参数见表3。
表 3 5种模型主要超参数设置Table 3. Primary hyper-parameter setting of five models模型 Model 超参数 Hyperparameter 含义 Meaning 设定值 Setting value ANN hidden_layer_sizes 隐藏层节点数量 Number of hidden nodes 11 activation 激活函数 Activation function sigmoid solver 权重优化器 Weight optimizer Adam learning_rate 学习率 Learning rate 0.095 batch_size 批量大小 Bach size 64 epoch 迭代次数 Iteration 1 000 Bi-LSTM hidden_layer_sizes 隐藏层节点数量 Number of hidden nodes 20、6 activation 激活函数 Activation function linear,relu solver 权重优化器 Weight optimizer Adam learning_rate 学习率 Learning rate 0.088 5 batch_size 批量大小 Bach size 64 epoch 迭代次数 Iteration 500 随机森林 Random forest (RF) n_estimators 决策树数量 Number of decision trees 193 max_depth 树的最大深度 Maximum depth of the tree 35 max_features 最大特征个数 Maximum number of features auto K最邻近 K-nearest neighbor (KNN) n_neighbors K值 K value 4 weights 样本权重 Sample weight distance p 距离度量 Distance measure 1 支持向量回归 Support vector regression (SVR) kernel 核函数 Kernel function rbf C 惩罚系数 Penalty coefficient 1 2. 结果与分析
2.1 NEE插值效果对比分析
当NEE数据连续缺失7 d时,各模型都表现出最优的性能(图5)。随着NEE数据缺失天数的增加,6种模型的插值精度均会降低。当NEE数据缺失天数 ≤ 30 d时,各模型的插值精度相对可靠。ANN-BiLSTM模型的插值精度最高,R2均值在0.48 ~ 0.56之间,RMSE和MAE在0.68 ~ 1.92 μmol/(m2·s)和0.45 ~ 1.31 μmol/(m2·s)之间。RF和ANN的R2均值在0.45 ~ 0.55之间,RMSE和MAE在0.77 ~ 1.98 μmol/(m2·s)、0.50 ~ 1.33 μmol/(m2·s)之间。MDS的插值精度要低于ANN,R2均值在0.39 ~ 0.52之间,RMSE和MAE在0.80 ~ 2.10 μmol/(m2·s)、0.53 ~ 1.44 μmol/(m2·s)之间。KNN的R2均值在0.39 ~ 0.45之间,RMSE和MAE在0.87 ~ 2.08 μmol/(m2·s)、0.59 ~ 1.42 μmol/(m2·s)之间。SVR的插值精度最低,R2均值在0.33左右,RMSE和MAE也远高于其他模型,RMSE在1.39 ~ 2.09 μmol/(m2·s)之间,MAE在0.98 ~ 1.51 μmol/(m2·s)之间。
当数据缺失天数 ≥ 45 d时,MDS无法填补缺失数据,ANN-BiLSTM模型的插值精度明显优于机器学习模型,R2均值 > 0.45,RMSE和MAE分别在0.79 ~ 1.95 μmol/(m2·s)、0.50 ~ 1.32 μmol/(m2·s)之间。RF和ANN的R2均值在0.4左右,RMSE和MAE在0.91 ~ 2.28 μmol/(m2·s)、0.55 ~ 1.60 μmol/(m2·s)之间。KNN 和SVR的R2均值在0.3左右,RMSE和MAE在1.02 ~ 2.42 μmol/(m2·s)、0.66 ~ 1.85 μmol/(m2·s)之间。综合考虑3个指标,当NEE数据缺失长度 > 7 d时,ANN-BiLSTM的插值结果最好,其次是RF、ANN、MDS和KNN,SVR的插值结果最差。
2.2 ANN-BiLSTM模型在不同季节下的插值效果
为研究季节变化对NEE数据插补的影响,本研究将试验数据划分为4个季节数据集(其中春季为3—5月,夏季为6—8月,秋季为9—11月,冬季为12月—次年2月)。在各季节数据集中以5 d为单位随机剔除20%的数据作为缺失数据集,每个季节数据集均生成10个缺失数据集。其余数据用于ANN-BiLSTM模型的构建,并用缺失数据集来模拟不同季节下NEE的插值结果。
由表4可知:NEE的插值结果会受到季节的影响。夏季NEE的拟合程度最高,R2为0.58,其次是秋季和春季,R2分别为0.46和0.29,冬季NEE难以拟合,R2接近0。
表 4 ANN-BiLSTM模型在不同季节下的插值结果Table 4. Gap-filling results of ANN-BiLSTM model under different seasons季节
SeasonRMSE/(μmol·m−2·s−1) MAE/(μmol·m−2·s−1) R2 春季 Spring 1.25 0.74 0.29 夏季 Summer 1.85 1.31 0.58 秋季 Autumn 1.18 0.72 0.46 冬季 Winter 0.64 0.39 0.00 注:RMSE、MAE和R2为均值结果。Notes: RMSE, MAE and R2 are the mean results. 3. 讨 论
3.1 季节变化对NEE插值结果的影响
通过对比不同季节下NEE的插值结果,本文发现NEE的模拟能力明显会受到季节影响。出现这一结果的原因很可能与植被变化有关。温带荒漠灌丛生态系统因植被类型和环境因子的变化导致NEE具有明显的季节变化特征[30],而植被物候变化又是影响NEE季节变化的关键因子[42−43]。春季为植被生长初期,随着气温缓慢回升,植被逐渐返青,NEE交换速率会随光合作用与呼吸作用的增加而加强;夏季为植被生长旺期,光合作用和呼吸作用旺盛,NEE交换速率达到最高,模型环境驱动变量强,模拟结果最好;秋季为生长季末期,植被覆盖度低,光合作用和呼吸作用下降,NEE交换速率变缓;冬季气候寒冷,植物枯死,光合作用与呼吸作用微弱,NEE交换速率最低,模型环境驱动变量弱,模拟结果差。除此之外,数据质量也会影响模型的模拟结果。受辐射影响,冬季对流减弱,大气层结相对稳定,涡度相关法通量观测结果较差,而且本研究冬季NEE可用数据要少于其他季节,导致冬季拟合结果远低于其他季节。
有研究[44]发现春季NEE的模拟效果要差于夏秋季节,这与本文的结果是一致的。对于温带荒漠灌丛生态系统,春季下垫面状况会因土壤消融过程、短期降水、春旱以及沙尘暴等极端事件的影响而发生显著改变,进而引起NEE的变化,而ANN-BiLSTM模型并不能很好地掌握这些短期过程的发生,导致模型在对NEE进行拟合时出现偏差,容易低估或高估NEE,这可能是春季NEE模拟效果相对较差的原因。在对温带荒漠灌丛的NEE进行长期插补时,我们应该考虑季节对NEE插值的影响。
3.2 不同模型在NEE插补中的适用性
本研究发现NEE的插补精度与数据缺失天数相关(图5),6种模型的插补精度均会随着NEE数据缺失天数的延长而降低。然而在对温带荒漠灌丛生态系统的NEE进行插补时,不同的插补模型有其适用范围[12,16,20,45]。MDS作为欧洲通量网和FLUXNET处理缺失值的标准方法,在填补长期缺失值的性能上要差于ANN和RF,这一结果与以往的结论一致[20−21,45],当温带荒漠灌丛生态系统的NEE数据连续缺失≤15 d时,MDS能较好地还原NEE的日变化,对于超过15 d的长时间缺失,MDS的插值精度会下降。
在应用机器学习模型对NEE进行缺失值插补时,本研究发现同ANN、KNN和SVR模型相比,RF的模拟结果最优(图5)。有研究[22,44]也表明RF能同时兼顾连续、非连续和分类变量的变化特征,相对于其他机器学习模型具有更强的处理非线性问题的能力,适用范围较广,当温带荒漠灌丛生态系统的NEE缺失天数≤30 d时,RF能够取得较为可靠的插补结果。尽管ANN的插补精度要低于RF,但仍能在NEE数据连续缺失30 d时获得较优的插补结果,这一结果与很多研究保持一致[20,45]。KNN的插值结果要差于MDS,更适用于数据缺失天数 ≤ 15 d的情景。SVR的插值结果最差,只适用于数据缺失天数 ≤ 7 d的情景。这可能是因为SVR模型架构简单,在解决小样本的问题上具有特有优势[46],而本研究数据量较多,而且温带荒漠灌丛生态系统的NEE与环境因子具有多时间相关性[25],导致SVR对特征捕捉的能力有限,并不能很好地对NEE进行拟合。
ANN-BiLSTM模型的插值精度最优且随数据缺失天数的增加,插值精度的降低幅度最小。当温带荒漠灌丛生态系统的NEE数据缺失天数 < 30 d时,RF与ANN-BiLSTM模型的插值精度相差较小,而当NEE数据缺失天数 > 30 d时,ANN-BiLSTM模型的插值结果明显优于机器学习模型(图5),即使NEE缺失天数达到90 d,插值结果也依旧可靠,在一定程度上提高了温带荒漠灌丛生态系统NEE长期插值结果的精度。这是因为ANN-BiLSTM模型引入了NEE在时间上的自相关性,有学者[23]曾以NEE作为输入数据,利用NEE在时间上的自相关性对缺失数据进行插补,发现插值结果要优于MDS。也有研究[47]以NEE的时序特征进行建模,发现其模拟结果要好于ANN。ANN-BiLSTM模型将NEE的环境因子与时序特征相结合来模拟NEE数据在长期缺失下的变化趋势,不仅保留环境因子与NEE之间的响应关系,还引入了NEE在时间上的自相关性,能够深入挖掘时序数据信息,从而更精确地模拟NEE变化的内在机制,提高数据插补精度。本研究也相信,当其他通量数据同NEE数据结构相似时,应用该模型依旧能够获得可靠的长期插值结果。
除插补方法之外,生态系统也是影响NEE插补结果的因素之一,尽管ANN-BiSLTM模型在一定程度上提高了NEE长期插值结果的精度,但是该模型是否适用于其他生态系统还需进一步验证。
4. 结 论
本研究在保留环境因子与NEE之间响应关系的基础上,采用Bi-LSTM模型引入了NEE在时间上的自相关性,并利用集成学习将NEE的环境因子和时序特征相结合,提出了ANN-BiLSTM模型。通过随机剔除连续7、15、30、45和90 d的5类缺失情景来评估6种NEE插补模型在不同缺失天数下的插值结果。研究表明:ANN-BiLSTM的插值结果最好,尤其当NEE数据缺失长度 > 30 d时,ANN-BiLSTM的插值精度明显优于机器学习模型,在一定程度上提高了温带荒漠灌丛生态系统NEE长期插值结果的精度。为了更好地将ANN-BiLSTM模型应用于NEE的长期插补,我们应验证该模型在其他生态系统中的表现,还应考虑季节变化对NEE插补结果的影响。
-
图 1 ANN结构图
引自文献[36]。Xn.输入因子;Ta. 空气温度;Ts. 土壤温度;Par. 光合有效辐射;VPD. 饱和水汽压。f(·)表示激活函数。Cited from literature [36]. Xn, input factor; Ta, air temperature; Ts, soil temperature; Par, photosynthetically active radiation; VPD, vapor pressure deficit. f(·) expresses activation function.
Figure 1. Diagram of ANN structure
图 2 神经元模型示意图
引自文献[36]。 {\theta }_{j} 为第j个神经元的阈值, {\omega }_{ij} 为第i个输入信号与第j个神经元之间的连接权值, {\omega }_{nj} 为第n个输入信号与第j个神经元之间的连接权值, {y}_{j} 为输出结果。Cited from literature[36]. {\theta }_{j} is the threshold of the neuron. {\omega }_{ij} is the connection weight between the input signal of i and the neuron of j. {\omega }_{nj} is the connection weight between the input signal of n and the neuron of j. {y}_{j} is the output.
Figure 2. Schematic diagram of neuron model
图 3 LSTM单元结构
引自文献[37]。 {{\boldsymbol{x}}}_{t} 为t时刻NEE的输入值; {{\boldsymbol{c}}}_{t} 为t时刻记忆单元状态; {{\boldsymbol{c}}}_{t-1} 为t−1时刻记忆单元状态;σ为sigmoid函数;ht为t时刻输出;tanh为神经网络中的激活函数。Cited from literature[37]. {{\boldsymbol{x}}}_{t} is the input value of NEE at time t. {{\boldsymbol{c}}}_{t} is the state of memory unit at time t. {{\boldsymbol{c}}}_{t-1} is the state of memory unit at time t−1. σ is sigmoid function. {{\boldsymbol{h}}}_{t} is the current output; tanh is activation function of neural network.
Figure 3. Unit construction of LSTM
图 5 6种NEE插补模型在不同缺失天数下的插补效果对比
NEE.生态系统碳交换量(μmol/(m2·s),以CO2物质的量计);RMSE. 插补所得NEE与实测NEE的均方根误差;MAE. 平均绝对误差;R2. 决定系数。图中箱体内的横线为插值结果的中位线,●为插值结果的均值,◇为插值结果中的异常值。箱体的上边缘线为第三分位数(Q3),下边缘线为第一分位数(Q1),Q3与Q1的差距为四分位间距(IQR)。箱体外的上横线代表插值结果的最大值(Q3 + 1.5IQR),下横线代表插值结果的最小值(Q1 − 1.5IQR)。下同。NEE, net ecosystem carbon exchange(μmol/(m2·s)), based on the amount of CO2 substances); RMSE, root mean squared error between measured NEE and predicted NEE; MAE, mean absolute error; R2, coefficient of determination. The horizontal line in the box is the median line of gap-filling result, ● is the mean value of gap-filling result, ◇ is the outliers of gap-filling result. The upper edge line of the box body is the third quantile (Q3), the lower edge line is the first quantile (Q1), and the gap between Q3 and Q1 is interquartile range (IQR). The upper horizontal line on the outside of the box body represents the maximum value of the gap-filling result (Q3 + 1.5IQR), and the lower horizontal line represents the minimum value of the gap-filling result (Q1 − 1.5IQR). The same below.
Figure 5. Comparison of gap-filling effects of six NEE gap-filling models under different missing days
表 1 净生态系统交换量和环境因子缺失数据统计
Table 1 Statistical analysis of missing data of net ecosystem exchange and environmental factors
季节
Season数据总条数
Total number of data有效数据条数
Number of valid data缺失数据条数
Number of missing data缺失率
Rate of loss/%春季 Spring 7 171 5 129 2 042 28.5 夏季 Summer 8 832 6 316 2 516 28.5 秋季 Autumn 8 736 5 268 3 468 39.7 冬季 Winter 5 808 4 166 1 642 28.3 表 2 5类数据缺失情景
Table 2 Description of five gap scenarios
缺失片段长度
Missing fragment length/d单位缺失片段数据条数
Number of missing pieces of data per unit缺失片段重复次数
Number of repeats in unit gap总缺失片段数据条数
Total number of missing pieces of data7 336 12 4 032 15 720 6 4 320 30 1 440 3 4 320 45 2 160 2 4 320 90 4 320 1 4 320 表 3 5种模型主要超参数设置
Table 3 Primary hyper-parameter setting of five models
模型 Model 超参数 Hyperparameter 含义 Meaning 设定值 Setting value ANN hidden_layer_sizes 隐藏层节点数量 Number of hidden nodes 11 activation 激活函数 Activation function sigmoid solver 权重优化器 Weight optimizer Adam learning_rate 学习率 Learning rate 0.095 batch_size 批量大小 Bach size 64 epoch 迭代次数 Iteration 1 000 Bi-LSTM hidden_layer_sizes 隐藏层节点数量 Number of hidden nodes 20、6 activation 激活函数 Activation function linear,relu solver 权重优化器 Weight optimizer Adam learning_rate 学习率 Learning rate 0.088 5 batch_size 批量大小 Bach size 64 epoch 迭代次数 Iteration 500 随机森林 Random forest (RF) n_estimators 决策树数量 Number of decision trees 193 max_depth 树的最大深度 Maximum depth of the tree 35 max_features 最大特征个数 Maximum number of features auto K最邻近 K-nearest neighbor (KNN) n_neighbors K值 K value 4 weights 样本权重 Sample weight distance p 距离度量 Distance measure 1 支持向量回归 Support vector regression (SVR) kernel 核函数 Kernel function rbf C 惩罚系数 Penalty coefficient 1 表 4 ANN-BiLSTM模型在不同季节下的插值结果
Table 4 Gap-filling results of ANN-BiLSTM model under different seasons
季节
SeasonRMSE/(μmol·m−2·s−1) MAE/(μmol·m−2·s−1) R2 春季 Spring 1.25 0.74 0.29 夏季 Summer 1.85 1.31 0.58 秋季 Autumn 1.18 0.72 0.46 冬季 Winter 0.64 0.39 0.00 注:RMSE、MAE和R2为均值结果。Notes: RMSE, MAE and R2 are the mean results. -
[1] Baldocchi D. How eddy covariance flux measurements have contributed to our understanding of global change biology[J]. Global Change Biology, 2020, 26: 242−260. doi: 10.1111/gcb.14807
[2] 陈世苹, 游翠海, 胡中民, 等. 涡度相关技术及其在陆地生态系统通量研究中的应用[J]. 植物生态学报, 2020, 44(4): 291−304. doi: 10.17521/cjpe.2019.0351 Chen S P, You C H, Hu Z M, et al. Eddy covariance technique and its applications in flux observations of terrestrial ecosystems[J]. Chinese Journal of Plant Ecology, 2020, 44(4): 291−304. doi: 10.17521/cjpe.2019.0351
[3] Chu H S, Luo X Z, Ouyang Z T, et al. Representativeness of eddy-covariance flux footprints for areas surrounding AmeriFlux sites[J/OL]. Agricultural and Forest Meteorology, 2021, 301/302: 108350[2022−12−10]. https://doi.org/10.1016/j.agrformet.2021.108350.
[4] Richardson A D, Braswell B H, Hollinger D Y, et al. Comparing simple respiration models for eddy flux and dynamic chamber data[J]. Agricultural and Forest Meteorology, 2006, 141(2): 219−234.
[5] 苏荣瑞, 刘凯文, 耿一风, 等. 江汉平原稻−油连作系统冠层CO2通量变化特征[J]. 中国农业气象, 2012, 33(3): 362−367. Su R R, Liu K W, Geng Y F, et al. CO2 flux variation over canopy rice rape succession system in Jianghan Plain[J]. Chinese Journal of Agrometeorology, 2012, 33(3): 362−367.
[6] 徐小军, 周国模, 杜华强, 等. 缺失数据插补方法及其参数估计窗口大小对毛竹林CO2通量估算的影响[J]. 林业科学, 2015, 51(9): 141−149. Xu X J, Zhou G M, Du H Q, et al. Effects of interpolation and window sizes in Phyllostachys edulis forest for parameter estimation on calculation of CO2 flux[J]. Scientia Silvae Sinicae, 2015, 51(9): 141−149.
[7] Foltynová L, Fischer M, McGloin R P. Recommendations for gap-filling eddy covariance latent heat flux measurements using marginal distribution sampling[J]. Theoretical and Applied Climatology, 2020, 139(1): 677−688.
[8] Lucas-Moffat A M, Schrader F, Herbst M, et al. Multiple gap-filling for eddy covariance datasets[J/OL]. Agricultural and Forest Meteorology, 2022, 325[2022−12−10]. https://doi.org/10.1016/j.agrformet.2022.109114.
[9] Safa B, Arkebauer T J, Zhu Q, et al. Net ecosystem exchange (NEE) simulation in maize using artificial neural networks[J/OL]. Ifac Journal of Systems & Control, 2019, 7: 100036[2022−12−10]. https://doi.org/10.1016/j.ifacsc.2019.100036.
[10] Teng D X, He X M, Wang J Z, et al. Uncertainty in gap filling and estimating the annual sum of carbon dioxide exchange for the desert Tugai forest, Ebinur Lake Basin, Northwest China[J/OL]. PeerJ, 2020, 8[2022−12−10]. https://doi.org/10.7717/peerj.8530.
[11] Soloway A D, Amiro B D, Dunn A L, et al. Carbon neutral or a sink? Uncertainty caused by gap-filling long-term flux measurements for an old-growth boreal black spruce forest[J]. Agricultural and Forest Meteorology, 2017, 233: 110−121. doi: 10.1016/j.agrformet.2016.11.005
[12] Du Q, Liu H Z, Feng J W, et al. Effects of different gap filling methods and land surface energy balance closure on annual net ecosystem exchange in a semiarid area of China[J]. Science China Earth Sciences, 2014, 57(6): 1340−1351. doi: 10.1007/s11430-013-4756-5
[13] Zhu S Y, McCalmont J, Cardenas L M, et al. Gap-filling carbon dioxide, water, energy, and methane fluxes in challenging ecosystems: comparing between methods, drivers, and gap-lengths[J/OL]. Agricultural and Forest Meteorology, 2023, 332[2022−12−10]. https://doi.org/10.1016/j.agrformet.2023.109365.
[14] Falge E, Baldocchi D, Olson R, et al. Gap filling strategies for defensible annual sums of net ecosystem exchange[J]. Agricultural and Forest Meteorology, 2001, 107(1): 43−69. doi: 10.1016/S0168-1923(00)00225-2
[15] Falge E, Baldocchi D, Olson R, et al. Gap filling strategies for long term energy flux data sets[J]. Agricultural and Forest Meteorology, 2001, 107(1): 71−77. doi: 10.1016/S0168-1923(00)00235-5
[16] Zhao X, Huang Y. A comparison of three gap filling techniques for eddy covariance net carbon fluxes in short vegetation ecosystems[J/OL]. Advances in Meteorology, 2015: 1−12[2022-12-20]. https://doi.org/10.1155/2015/260580.
[17] Hui D, Wan S Q, Su B, et al. Gap-filling missing data in eddy covariance measurements using multiple imputation(MI) for annual estimations[J]. Agricultural and Forest Meteorology, 2004, 121(1−2): 93−111. doi: 10.1016/S0168-1923(03)00158-8
[18] Reichstein M, Falge E, Baldocchi D, et al. On the separation of net ecosystem exchange into assimilation and ecosystem respiration: review and improved algorithm[J]. Global Change Biology, 2005, 11(9): 1424−1439. doi: 10.1111/j.1365-2486.2005.001002.x
[19] Kang M, Ichii K, Kim J, et al. New gap-filling strategies for long-period flux data gaps using a data-driven approach[J/OL]. Atmosphere, 2019, 10(10): 568[2022−12−10]. https://doi.org/10.3390/atmos10100568.
[20] 周宇, 黄辉, 张劲松, 等. 森林生态系统涡度相关法碳通量长时间连续性缺失数据插补方法的比较[J]. 中国农业气象, 2021, 42(4): 330−343. Zhou Y, Huang H, Zhang J S, et al. Comparison of gap-filling methods for long-term continuous missing data in carbon flux observation by eddy covariance method of forest ecosystem[J]. Chinese Journal of Agrometeorology, 2021, 42(4): 330−343.
[21] Zhu S Y, Clement R, McCalmont J, et al. Stable gap-filling for longer eddy covariance data gaps: a globally validated machine-learning approach for carbon dioxide, water, and energy fluxes[J/OL]. Agricultural and Forest Meteorology, 2022, 314: 108777[2022−12−10]. https://doi.org/10.1016/j.agrformet.2021.108777.
[22] Kim Y, Johnson M S, Knox S H, et al. Gap-filling approaches for eddy covariance methane fluxes: a comparison of three machine learning algorithms and a traditional method with principal component analysis[J]. Global Change Biology, 2020, 26(3), 1499−1518. doi: 10.1111/gcb.14845
[23] 窦兆一, 刘建军. 人工神经网络在通量观测资料插补中的应用[J]. 西北林学院学报, 2009, 24(3): 58−62. Dou Z Y, Liu J J. Application of artificial neural networks to interpolation and extrapolation of flux data[J]. Journal of Northwest Forestry University, 2009, 24(3): 58−62.
[24] Biederman J A, Scott R L, Bell T W, et al. CO2 exchange and evapotranspiration across dryland ecosystems of southwestern north America[J]. Global Change Biology, 2017, 23(10), 4204–4221. doi: 10.1111/gcb.13686
[25] Jia X, Zha T S, Gong J N, et al. Multi-scale dynamics and environmental controls on net ecosystem CO2 exchange over a temperate semiarid shrubland[J]. Agricultural and Forest Meteorology, 2018, 259: 250−259. doi: 10.1016/j.agrformet.2018.05.009
[26] Jia X, Mu Y, Zha T S, et al. Seasonal and interannual variations in ecosystem respiration in relation to temperature, moisture, and productivity in a temperate semi-arid shrubland[J/OL]. Science of the Total Environment, 2020, 709, 136210[2022−12−10]. https://doi.org/10.1016/j.scitotenv.2019.136210.
[27] Wutzler T, Lucas-Moffat A, Migliavacca M, et al. Basic and extensible post-processing of eddy covariance flux data with REddyProc[J]. Biogeoences, 2018, 15(16):5015−5030.
[28] 申冲, 王春林, 赵晓松, 等. 人工红树林碳通量变化特征及其影响因素分析[J]. 南京信息工程大学学报(自然科学版), 2022, 14(1): 11−20. Shen C, Wang C L, Zhao X S, et al. Variations and controlling factors of carbon fluxes from a restored mangrove wetland[J]. Journal of Nanjing University of Information Science and Technology (Natural Science Edition) , 2022, 14(1): 11−20.
[29] 彭丽, 赵仲辉, 项文化, 等. 辐射变化对中亚热带杉木人工林净CO2交换的影响[J]. 应用生态学报, 2022, 33(1): 17−24. Peng L, Zhao Z H, Xiang W H, et al. Effects of radiation changes on net ecosystem exchange of carbon dioxide in a middle subtropical Chinese fir plantation[J]. Chinses Journal of Applied Ecology, 2022, 33(1): 17−24.
[30] 龚婷婷. 中国北方荒漠区水碳通量变化规律研究[D]. 北京: 清华大学, 2017. Gong T T. Variations of water and carbon fluxes on the dryland of north China[D]. Beijing: Tsinghua University, 2017.
[31] 张悦, 冯会丽, 王维枫,等. 洪泽湖地区杨树人工林碳水通量昼夜和季节变化特征[J]. 南京林业大学学报(自然科学版), 2019, 43(5): 113−120. Zhang Y, Feng H L, Wang W F, et al. Diurnal and seasonal changes of fluxes over a poplar plantation in Hongze Lake Basin[J]. Journal of Nanjing Forestry University (Natural Science Edition), 2019, 43(5): 113−120.
[32] Xu L, Baldocchi D D. Seasonal variation in carbon dioxide exchange over a mediterranean annual grassland in California[J]. Agricultural and Forest Meteorology, 2004, 123(1−2): 79−96. doi: 10.1016/j.agrformet.2003.10.004
[33] 吴东星, 李国栋, 亢琼琼,等. 华北平原冬小麦农田生态系统CO2通量特征及其影响因素[J]. 应用生态学报, 2018, 29(3): 827−838. Wu D X, Li G D, Kang Q Q, et al. Characteristics of CO2 flux and its influence factors over winter wheat agroecosystem in the north China plain[J]. Chinses Journal of Applied Ecology, 2018, 29(3): 827−838.
[34] 齐建东, 黄金泽, 贾昕. 基于XGBoost-ANN的城市绿地净碳交换模拟与特征响应[J]. 农业机械学报, 2019, 50(5): 269−278. Qi J D, Huang J Z, Jia X. Simulation of NEE and characterization of urban green-land ecosystem responses to climatic controls based on XGBoost-ANN[J]. Transactions of the Chinese Society for Agricultural Machinery, 2019, 50(5): 269−278.
[35] Dannenberg M P, Barnes M L, Smith W K, et al. Upscaling dryland carbon and water fluxes with artificial neural networks of optical, thermal, and microwave satellite remote sensing[J]. Biogeosciences, 2023, 20(2):383–404. doi: 10.5194/bg-20-383-2023
[36] 张琨, 朱高峰, 白岩, 等. 基于人工神经网络的涡度相关仪观测蒸散量的数据插补方法[J]. 兰州大学学报(自然科学版), 2014, 50(3): 348−355. doi: 10.13885/j.issn.0455-2059.2014.03.009 Zhang K, Zhu G F, Bai Y, et al. Gap filling for evapotranspiration based on BP artificial neural networks[J]. Journal of Lanzhou University (Natural Sciences), 2014, 50(3): 348−355. doi: 10.13885/j.issn.0455-2059.2014.03.009
[37] 齐建东, 黄俊尧. 基于深度学习的草地生态系统净碳交换模拟[J]. 农业机械学报, 2020, 51(6): 152−161. doi: 10.6041/j.issn.1000-1298.2020.06.016 Qi J D, Huang J Y. Simulation of NEE in grassland ecosystems based on deep learning[J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(6): 152−161. doi: 10.6041/j.issn.1000-1298.2020.06.016
[38] 黄婕, 张丰, 杜震洪, 等. 基于RNN-CNN集成深度学习模型的PM2.5小时浓度预测[J]. 浙江大学学报(理学版), 2019: 46 (3): 370−379. Huang J, Zhang F, Du Z H, et al. Hourly concentration of PM2.5 based on RNN-CNN ensemble deep learning model[J]. Journal of Zhejiang University (Science Edition), 2019: 46 (3): 370−379.
[39] Chang X G, Xing Y Q, Gong W S, et al. Evaluating gross primary productivity over 9 ChinaFlux sites based on random forest regression models, remote sensing, and eddy covariance data[J/OL]. Science of the Total Environment, 2023, 875: 162601[2023-08-10]. 10.1016/j.scitotenv.2023.162601 . doi: 10.1016/j.scitotenv.2023.162601
[40] Ellsäßer F, Röll A, Ahongshangbam J, et al. Predicting tree sap flux and stomatal conductance from drone-recorded surface temperatures in a mixed agroforestry system: a machine learning approach[J/OL]. Remote Sensing, 2020, 12(24): 4070[2022−12−10]. https://doi.org/10.3390/rs12244070.
[41] Adjuik T A, Davis S C. Machine learning approach to simulate soil CO2 dluxes under cropping systems[J/OL]. Agronomy, 2022, 12(1): 197[2022−12−10]. https://doi.org/10.3390/agronomy12010197.
[42] Puma I P L, Philippi T E, Oberbauer S F. Relating NDVI to ecosystem CO2 exchange patterns in response to season length and soil warming manipulations in arctic Alaska[J]. Remote Sensing of Environment, 2007, 109(2): 225−236. doi: 10.1016/j.rse.2007.01.001
[43] Wylie B K, Johnson D A, Laca E, et al. Calibration of remotely sensed, coarse resolution NDVI to CO2 fluxes in a sagebrush-steppe ecosystem[J]. Remote Sensing of Environment, 2003, 85(2): 243−255. doi: 10.1016/S0034-4257(03)00004-X
[44] 王少影, 张宇, 孟宪红,等. 机器学习算法对涡动相关缺失通量数据的插补研究[J]. 高原气象, 2020, 39(6): 1348−1360. doi: 10.7522/j.issn.1000-0534.2019.00142 Wang S Y, Zhang Y, Meng X H, et al. Fill the gaps of eddy covariance fluxes using machine learning algorithms[J]. Plateau Meteorology, 2020, 39(6): 1348−1360. doi: 10.7522/j.issn.1000-0534.2019.00142
[45] Moffat A M, Papale D, Reichstein M, et al. Comprehensive comparison of gap-filling techniques for eddy covariance net carbon fluxes[J]. Agricultural and Forest Meteorology, 2007, 147(3−4): 209−232. doi: 10.1016/j.agrformet.2007.08.011
[46] Suykens J A K, Vandewalle J. Least squares support vector machine classifiers[J]. Neural Processing Letters, 1999, 9: 293−300. doi: 10.1023/A:1018628609742
[47] 黄金泽. 神经网络模型在碳通量数据模拟的研究与应用[D]. 北京: 北京林业大学, 2019. Huang J Z. Application of artificial neural networks in modelling carbon flux[D]. Beijing: Beijing Forestry University, 2019.
-
期刊类型引用(3)
1. 陈彩云. 天然染料在鲜茧丝染色中的应用. 轻纺工业与技术. 2023(02): 145-147 . 百度学术
2. 杨雨桐,张卿硕,符韵林,孙静. 巴里黄檀心材色素的提取及其抑菌活性. 东北林业大学学报. 2020(10): 100-103+119 . 百度学术
3. 王敬贤. 木材染色技术研究进展. 林业科技. 2020(06): 42-47 . 百度学术
其他类型引用(4)