TSIT-PatchTST model: a missing value interpolation method for net ecosystem exchange (NEE)
-
摘要:目的
净生态系统交换量(NEE)是评估陆地生态系统在全球碳循环中作用的重要指标,NEE原始观测数据缺失值的插补精度会直接影响生态系统关键参数的可靠性和精确性。为提高不同植被NEE在长时间连续性数据缺失情景下的插补精度,提出一种融合时间序列表征向量的TSIT-PatchTST深度学习模型。
方法以全球长期通量观测网络站点的碳通量因子数据为研究对象,通过构造短缺失(1 d)、中缺失(7 d)、长缺失(30 d)3种随机连续数据缺失场景,评估边际分布采样法(MDS)、PatchTST模型、TS2Vec-PatchTST模型和TSIT-PatchTST模型在8种不同植被类型下NEE的插补结果。
结果在短缺失场景下,4种插补方法都表现出最优的性能。随着连续缺失天数的增多,MDS的插补精度逐渐下降,该方法在长缺失场景下已不能对NEE进行有效插补,而其他3种深度学习模型能够有效地插补NEE缺失数据。综合3种缺失场景,TSIT-PatchTST模型表现出最优的插补性能,尤其在长缺失场景下该模型具有较高的插补精度。长缺失场景下,TSIT-PatchTST模型对31个站点插补结果的平均均方误差(MSE)为0.942 μmol/(m2·s),平均绝对误差(MAE)为0.628 μmol/(m2·s),平均R2为0.457。与PatchTST模型的插补结果相比,TSIT-PatchTST模型平均MSE下降了53.3%, 平均MAE下降了39.7%,平均R2相持平。
结论综合8种植被类型和3种缺失场景的应用结果,得出TSIT-PatchTST模型的插补效果最佳,并具有适应性。TSIT-PatchTST模型可应用于时间序列数据缺失场景以提高数据插补精度。
-
关键词:
- 深度学习 /
- 模型开发 /
- 数据插补 /
- TSIT-PatchTST模型 /
- 碳循环 /
- 植被类型 /
- 净生态系统交换量(NEE)
Abstract:ObjectiveNet ecosystem exchange (NEE) is an important indicator for evaluating the role of terrestrial ecosystems in the global carbon cycle. The accuracy of imputation of missing values in NEE raw observation data directly affects the reliability and precision of key ecosystem parameters. To enhance the imputation accuracy of NEE in scenarios of continuous long-term data gaps across different vegetation types, a TSIT-PatchTST model was proposed based on deep learning.
MethodUsing carbon flux factor data from sites within the global long-term flux observation network as the research object, three types of random continuous data gap scenarios were constructed, including short missing (1 d), medium missing (7 d), and long missing (30 d). The imputation results of marginal distribution sampling (MDS) method, PatchTST model, TS2Vec-PatchTST model, and TSIT-PatchTST model under eight different vegetation types were evaluated.
ResultIn the scenario of short missing, all imputation methods demonstrated optimal performance. As the number of consecutive missing days increased, the imputation accuracy of MDS method gradually declined, and it was no longer effective for imputing NEE in the long missing scenario. In contrast, the three deep learning models were capable of effectively imputing missing NEE data. Considering all three missing scenarios, the TSIT-PatchTST model exhibited the best imputation performance, particularly with a high accuracy in long missing scenarios. In the long missing scenario, the TSIT-PatchTST model achieved an average mean squared error (MSE) of 0.942 μmol/(m2·s), an average mean absolute error (MAE) of 0.628 μmol/(m2·s), and an average R2 of 0.457 across 31 sites. Compared with PatchTST model, the TSIT-PatchTST model reduced the average MSE by 53.3%, average MAE by 39.7% and the average R2 remained unchanged.
ConclusionIntegrating the performance across eight vegetation types and three missing scenarios, the TSIT-PatchTST model demonstrates the best imputation effect and adaptability. It can be applied to the problem of missing data in time series to improve the accuracy of data imputation.
-
化肥过量施用、土壤侵蚀、河岸植被破坏等易使面源污染物通过地表径流和地下渗流进入河湖水体中[1−2]。全球范围内近50%的地表水资源已经受到面源污染的影响。然而,面源污染具有很大的随机性,分布面积广,时间和空间变化幅度较大,所以在监测、控制和治理上存在诸多困难和复杂性,这使得减轻农业面源污染成为一项艰巨的任务,也使面源污染治理逐渐成为水环境保护与水资源利用中的重点和难点[3]。
河岸植被缓冲带是一个由土壤、水、植被等构成的生态系统,通过植物吸收、土壤吸附等一系列物理、化学和生物过程,截留、吸收和转化污染物,阻止径流水中的污染物进入水体,被认为是面源污染防治的有效管理措施[4]。黄斌斌等[5]研究发现,森林的水质净化率最高,达91%,其次是灌丛(87.80%)和草地(82.28%)。Haukos等[6]研究发现,40 ~ 60 m宽的植被缓冲带可以显著减少地表径流中的养分、重金属和其他污染物的负荷。农业区河流失去河岸植被,可能会对河流生态系统的结构和功能产生深远的影响[3,6]。因此,恢复和重建河岸缓冲带以减少农业活动对河流的污染负荷,应受到重视并成为流域治理的重要途径。
生物炭是由生物质在低氧或无氧、高温条件下裂解产生的一种富碳物质[7−8]。由于生物炭化学性质稳定,具有碱性、多孔的结构、良好的阳离子交换能力以及大的比表面积等特点,在土壤污染修复、提高土壤肥力、增加土壤碳封存等方面都有重要意义[9]。特别是生物炭通过改善土壤物理性质,改变土壤微生物群落结构和功能,影响土壤养分循环和有机质分解,并可能减少氮的淋溶,提高氮的滞留[10]。因此,生物炭作为一种环境功能性材料在改善土壤、净化水质、物质循环、土壤固碳等方面得到了广泛的应用。但生物炭的生态效益因植被类型、生物炭性质、土壤类型和土地利用类型而异[10]。以往的研究表明[11],河岸缓冲带的植被类型对污染物截留去除效果差异显著,但也有研究[6]表明缓冲带的植被类型对污染物去除差异不大。生物炭通过影响土壤微生物群落和土壤酶活性对土壤微生物产生影响,但生物炭对微生物群落的影响仍存在争议。一些研究认为生物炭对微生物群落有促进作用或抑制作用,而另一些研究认为生物炭对微生物群落没有影响。因此,生物炭对污染物截留去除的效果,对土壤微生物群落变化的影响尚不完全清楚,有待进一步的研究。同时,现有的研究更多关注生物炭对农田的影响,且多室内盆栽试验,野外研究相对匮乏,生物炭添加对河岸林地影响的研究相对较少。
白洋淀的生态环境是雄安新区健康发展的重要保障,而入淀河流的水质影响着白洋淀的水环境质量。近年来,白洋淀流域通过减少外源污染排入、建立人工湿地、清淤和生态补水等方式进行了综合治理,但入淀河流仍然存在热点污染区域[12]。研究发现,白洋淀流域水体和沉积物的氮污染一直处于较高水平,是影响白洋淀流域水质的主要污染因子[13]。由于白洋淀流域河岸缓冲带存在生态功能脆弱、破碎化程度高的特点,且流域农业种植面积广、化肥施用量高,农业面源污染物很容易通过地表径流进入河流生态系统,影响流域污染治理效果[14]。因此,本研究选择白洋淀流域毛白杨林地为研究对象,探究不同生物炭添加量对河岸林土壤化学因子、微生物群落组成的影响,以及生物炭添加对河岸林地氮污染的阻控机制。研究旨在通过添加生物炭,强化河岸植被缓冲带的截留去污能力,减轻农业面源污染对流域水环境的威胁,为流域面源污染阻控及生态修复技术提供依据。
1. 研究区概况与研究方法
1.1 研究区域
白洋淀流域属海河流域大清河水系(113°39′ ~ 116°11′ E,38 °12′ ~ 39 °54′ N),跨山西和河北两省以及北京市,流域面积31 200 km2。属典型的温带大陆性季风气候,夏季高温多雨,冬季寒冷干燥,雨热同期,年平均气温7 ℃,多年平均降水量564 mm,年内降水量分配不均,70% ~ 80%集中在6—8月份,且多以暴雨形式出现[15]。流域地形地貌复杂,地势西高东低,其中山区占 43%,平原占57%,山区的土地利用类型主要是林地和草地等,土壤为褐土,平原地区主要是农田、城镇用地,土壤为潮土[16]。该流域农业种植面积广、化肥施用量高,氮肥和磷肥的平均施用量分别为100 ~ 300 kg/hm2和50 ~ 150 kg/hm2[17]。2017年雄安新区成立,围绕白洋淀而建,建设定位是中国未来生态与经济协调发展的先进新区,这对白洋淀流域生态环境提出了更高要求。由于其独特的自然条件和社会因素,白洋淀流域对维护华北地区生态环境具有不可替代的作用[18]。
1.2 样地概况和样地布设
白洋淀流域平原地区的河岸林基本都为毛白杨(Populus tomentosa),因此选择毛白杨河岸林为研究对象。于2023年5月18日,在白洋淀流域府河沿岸选择毛白杨人工林布设试验(图1a)。毛白杨行距为4 m,株距为3 m,密度为840株/hm2,林地郁闭度为0.75,林下植被稀少,偶见平车前(Plantago depressa)、艾(Artemisia argyi)、藜(Chenopodium album)等草本植物。林下稀疏生长毛白杨更新幼苗。
1.3 试验设计
所用的生物炭原材料为板栗壳。管式炉(型号KJ-T1200-S80-800S,规格为80 mm × 800 mm)通入高纯氮气30 min,以排净管中的空气。当管式炉温度升到指定温度(500 ℃)时,将装有板栗壳的石英管放入管式炉中进行炭化,炭化停留时间为2 h,自然冷却获得本试验所用生物炭。其表面积15.6 m2/g,容重0.23 g/cm3,pH8.56,全碳485.30 g/kg,全氮4.56 g/kg,全磷0.82 g/kg。
设置3种处理:未添加生物炭的对照(BC0)、添加生物炭3 t/hm2(BC3)、添加生物炭6 t/hm2(BC6)。每种处理3次重复,共设置9个样地,各处理组样地条件基本一致。样地设置在河流和农田之间的林地内(图1b),起始段和末端分别距农田、河流3 ~ 5 m,呈长方形布局,面积为2 m × 10 m。样地土壤为潮土,坡度为25°,坡长28 m。9块样地平行排列,间隔5 m。
在样地内开横沟施加生物炭,横沟长2 m,宽20 cm,深20 cm。每块样地开10条沟,沟与沟之间间距1 m。生物炭沟渠与地表径流方向垂直。在每块样地起始端(靠近农田处)添加氮肥(尿素,含N量为46%),添加带长3 m,宽0.5 m。模拟农业面源氮污染(图2),氮肥按照1 t/hm2,30 m2面积添加,每块样地的总添加量为3 kg。每月添加一次,连续添加4个月(5—8月),每次添加量为0.75 kg。
1.4 样品采集及指标测定
2023年9月中旬,采用五点取样法,清除地表枯枝落叶,采集样地中部0 ~ 20 cm表层土壤,装入塑封袋后放入保温箱中带回实验室。样品分为两部分,一份置于4 ℃冰箱用于土壤化学性质和土壤酶指标的测定;一份置于−80 ℃冰箱用于土壤微生物多样性的测定。
参照鲍士旦[19]提到的方法,进行土壤化学性质和酶的测定。土壤养分指标全氮的测定采用凯氏定氮法(Kjeltec 8400);用重铬酸钾氧化加热法测定土壤有机质。土壤pH值使用玻璃电极pH计进行测定(水土比5∶1);铵态氮和硝态氮采用流动分析仪测定(Smartchem 200)。土壤脲酶活性采用苯酚−次氯酸钠法测定,土壤硝酸还原酶活性采用酚二磺酸比色法测定,土壤亚硝酸还原酶活性用格里试剂显色与酶促反应前后NO−2-N变化表征。
1.5 细菌群落结构分析
采用高通量测序分析土壤细菌群落结构,在北京百迈克生物科技有限公司进行测序分析。采用E.Z.N.A. ® Soil DNA Kit提取土壤总DNA,以土壤总DNA为模板,采用341F(5′-ACTCCTACGGGAGGCAGCAG-3′)和806R(5′-GGACTACHVGGGTWTCTAAT-3′)对细菌16S rRNA基因的V3-V4高变区片段进行PCR扩增,扩增后的PCR产物用2%琼脂糖凝胶回收PCR产物,使用 AxyPrep DNA Gel Extraction kit进行纯化,Tris-HCl洗脱,2%琼脂糖电泳检测。利用QuantiFluorTM-ST检测定量,然后根据测序量需求将各样品按相应比例混合,构建Miseq文库,使用Illumina MiSeq平台测序。
1.6 数据处理和分析
采用SPSS26.0进行数据处理和分析,数据由平均值 ± 标准误表示,对土壤化学性质、土壤酶活性进行单因素方差分析和相关性分析。优势菌门与环境因子之间进行相关性热图分析,确定影响土壤细菌群落的关键环境因子。使用R、Origin 2021 软件进行绘图。
2. 结果与分析
2.1 不同处理组毛白杨林地土壤化学性质和酶活性
不同生物炭添加量的毛白杨林地土壤化学性质具有显著性差异(P < 0.05)(表1),其中BC6的土壤养分含量多高于BC3。与对照相比,BC3生物炭添加组全氮(TN)、铵态氮(NH+4-N)、硝态氮(NO−3-N)、有机质(SOM)、有机碳(SOC)分别提高10.39%、46.15%、8.57%、38.03%和 51.23%。BC6生物炭添加组TN、NH+4-N、NO−3-N、SOM、SOC分别提高 26.62%、92.31%、65.00%、78.05%和135.47%。
表 1 生物炭添加量对土壤养分和酶活性的影响Table 1. Effects of biochar addition on soil nutrients and enzyme activities指标 处理 BC0 BC3 BC6 全氮/(g·kg−1) 1.54 ± 0.05c 1.70 ± 0.1b 1.95 ± 0.02a 铵态氮/(mg·kg−1) 0.13 ± 0.04b 0.19 ± 0.03a 0.25 ± 0.07a 硝态氮/(mg·kg−1) 1.40 ± 0.21b 1.52 ± 0.23b 2.31 ± 0.60a 有机质/(g·kg−1) 8.02 ± 0.66c 11.07 ± 1.23b 14.28 ± 1.11a 有机碳/(g·kg−1) 4.06 ± 0.30c 6.14 ± 0.46b 9.56 ± 0.43a pH值 6.63 ± 0.21a 6.61 ± 0.29a 6.72 ± 0.19a 脲酶/(mg·g−1) 0.60 ± 0.03b 0.81 ± 0.06a 0.98 ± 0.07a 硝酸还原酶/(μg·g−1) 2.55 ± 0.64c 4.32 ± 1.01b 5.21 ± 1.35a 亚硝酸还原酶/(mg·g−1) 0.77 ± 0.15b 1.43 ± 0.19a 1.37 ± 0.25a 注:不同处理BC0、BC3、BC6的生物炭添加量分别为0、3、6 t/hm2。不同小写字母表示同一指标不同处理间差异显著(P<0.05)。下同。 不同生物炭添加量的毛白杨林地土壤酶活性具有显著性差异(P < 0.05),BC6生物炭添加组土壤酶活性高于BC3。同对照相比,BC3生物炭添加组脲酶(S-UE)、硝酸还原酶(S-NR)、亚硝酸还原酶(S-NIR)活性分别提高35.00%、69.41%和85.71%。BC6生物炭添加组S-UE、S-NR、S-NIR活性分别提高63.33%、104.31%和77.92%(表1)。
2.2 土壤酶活性与理化因子的相关性分析
表2显示:NO−3-N与NH+4-N、SOC、SOM之间呈现出极其显著正相关(P < 0.001)。TN与NO−3-N、SOC、SOM之间呈现极显著或显著正相关(P < 0.01或P < 0.05)。S-NR与S-NIR呈极其显著正相关(P < 0.001)。S-UE与pH呈极其显著正相关(P < 0.001)。S-NR、S-NIR分别与NH+4-N、NO−3-N、SOC、SOM呈极显著正相关(P < 0.01)。
表 2 土壤酶活性与养分因子相关分析Table 2. Correlation analysis of soil enzyme activity and nutrient factors指标 TN NO−3-N NH+4-N SOC SOM S-NR S-NIR S-UE pH TN 1 0.65** 0.21 0.55* 0.55* 0.41 0.41 0.42 0.42 NO−3-N 1 0.78*** 0.72*** 0.72*** 0.69** 0.69** 0.18 0.18 NH+4-N 1 0.37 0.37 0.60** 0.60** −0.10 −0.10 SOC 1 1.00*** 0.64** 0.64** −0.06 −0.06 SOM 1 0.64** 0.64** −0.06 −0.06 S-NR 1 1.00*** −0.21 −0.21 S-NIR 1 −0.21 −0.21 S-UE 1 1.00*** pH 1 注:*表示相关性在0.05水平显著,**表示相关性在0.01水平极显著,***表示相关性在0.001水平极其显著。TN.全氮;NO−3-N.硝态氮;NH+4-N.氨态氮;SOC.有机碳;SOM.有机质;S-NR.硝酸还原酶;S-NIR.亚硝酸还原酶;S-UE.脲酶。下同。 2.3 生物炭对毛白杨林地土壤细菌群落结构的影响
2.3.1 土壤细菌OTU数量分析
对不同处理组细菌操作性分类单元(operational taxonomic unit,OTU)进行韦恩分析。3个处理9个样品得到812 706个细菌有效序列,对土壤样品序列通过拆分、去冗余后,在97%相似度下进行OTU聚类共得到36 720个细菌OTU,不同处理土壤样品中共有的细菌OTU总数有1 023个。其中BC0处理14 923个OTU,BC3处理12 469个 OTU,BC6处理13 344个 OTU。BC0、BC3、BC6所特有的 OTU 数目分别为12 616、10 130、10 981个,占比分别为 34.36%、27.59%、29.91%。与BC0相比较,2种生物炭添加量都降低了土壤细菌中的OTU数量。
2.3.2 微生物群落α多样性分析
表3显示:土壤样本的覆盖率均在99%以上,且无显著差异(P > 0.05),这表明各组测得的数据都具有代表性,测序结果能够准确反应供试土样真实情况。各处理间Ace、Chao指数、Shannon多样性指数和Simpson多样性指数均无显著性差异(P > 0.05),生物炭添加对土壤细菌的α多样性影响较小。
表 3 不同处理生物覆盖度和多样性指数Table 3. Biological coverage and diversity indices under different treatments处理 Ace Chao指数 Shannon多样性指数 Simpson多样性指数 覆盖度/% BC0 2 802.2 ± 45.62 2 796.4 ± 45.58 10.12 ± 0.04 0.99 ± 0.00 99.96 ± 0.00 BC3 2 093.6 ± 125.69 2 089.1 ± 123.69 9.76 ± 0.39 0.99 ± 0.00 99.97 ± 0.00 BC6 2 587.6 ± 228.70 2 581.2 ± 226.47 10.14 ± 0.02 0.99 ± 0.00 99.96 ± 0.00 注:数值为均值 ± 标准误差。 2.3.3 土壤微生物门水平群落结构组成
在相似性水平97%的条件下,对OTU的代表序列做分类分析,共得到42个门,105纲,314个目,624个科,
1105 个属,1343 个种的土壤细菌(图3)。不同处理下土壤中主要的细菌群落组成相似,但相对丰度却有差异。在门分类水平上,相对丰度前10的细菌门包括变形杆菌门(Proteobacteria)、酸杆菌门(Acidobacteriota)、放线菌门(Actinobacteriota)、未分类菌门、绿弯菌门(Chloroflexi)、拟杆菌门(Bacteroidota)、芽单胞菌门(Gemmatimonadota)、黏球菌门(Myxococcota)、甲基微菌门(Methylomirabilota)、疣微菌门(Verrucomicrobiota)。前六大优势菌门的相对丰度占总群落的比重接近80%,各处理变形杆菌门的相对丰度分别为BC6(27.86%) > BC3(27.52%) > BC0(26.76%);酸杆菌门:BC3(23.84%) > BC0(22.28%) > BC6(21.37%);放线菌门为BC0(13.09%) > BC3(9.61%) > BC6(8.12%);未分类菌门为BC6(9.15%) > BC0(6.64%) > BC3(4.86%);绿弯菌门为BC0(7.06%) > BC3(6.29%) > BC6(5.22%);拟杆菌门为BC6(7.19%) > BC3(4.84%) > BC0(4.36%)。
总体来看,生物炭添加提高了变形杆菌门、未分类菌门和拟杆菌门的相对丰度;降低了酸杆菌门的相对丰度。变形杆菌门在生物炭添加组的相对丰度占比较高,其中含有大量的反硝化细菌,是影响反硝化效果的重要因素。反硝化作用是土壤中氮素转化与去除的主要方式之一。因此,生物炭添加通过影响土壤主要细菌门的相对丰度(如变形杆菌门),进而影响土壤中氮素的转化与去除。
2.4 环境因子与微生物群落结构相关性
土壤化学性质、酶活性与相对丰度前10的细菌门的相关性分析如图4所示。NO−3-N、NH+4-N、SOC、SOM、S-NR、S-NIR分别与变形杆菌门、拟杆菌门、疣微菌门正相关,其中SOC、SOM、S-NR、S-NIR分别与变形杆菌门、拟杆菌门、疣微菌门显著正相关(P < 0.05),NO−3-N、NH+4-N与变形杆菌门显著正相关(P < 0.05)。
NO−3-N、NH+4-N、SOC、SOM、S-NR、S-NIR分别与芽单胞菌门、酸杆菌门、绿弯菌门负相关,其中SOC、SOM、S-NR、S-NIR分别与芽单胞菌门、酸杆菌门、绿弯菌门显著负相关(P < 0.05),NO−3-N、NH+4-N与芽单胞菌门显著负相关(P < 0.05),SOC、SOM还与放线菌门显著负相关(P < 0.05)。
可见,SOC、SOM、S-NR、S-NIR是影响土壤微生物群落门水平的主要因子。
3. 讨 论
3.1 生物炭添加对毛白杨林地土壤养分和酶活性的影响
河流和河岸林地联系密切,通过物质循环、能量流动、动植物栖息、洪水和光照等相互作用高度交织在一起[3]。根据流域治理中的“源头减排−过程阻断−末端治理”模式,通过对污染物迁移、转化、扩散过程的拦截和阻断,能够有效减少污染物进入河湖水体[20]。研究[21−22]表明,生物炭对土壤水分和营养元素有较强吸持能力,能提高土壤保水能力,改良土壤质量,减少土壤养分淋失。本研究发现,6 t/hm2(BC6)处理组对氮素的截持能力更强,这可能是因为生物炭能够通过改善土壤结构来增强土壤的持水能力和吸附点位[23]。生物炭富含碳元素,能够提升土壤中的无机碳含量,从而增强土壤的养分保持能力和水分保持能力。此外,它还可以促进林地表面及土壤内部木质素的分解[24]。张晗芝[25]研究发现,生物炭施于土壤中能显著提高土壤碳含量。与对照组相比,6 t/hm2(BC6)处理组林地SOC、SOM分别提高了78.05%、135.47%。生物炭不仅增加了林地土壤有机质含量,还有助于降低土壤压实和侵蚀、增强土壤持水能力,并维持立地生产力[26]。同时,乔木叶片木质素含量高,分解有限[27],导致微生物可利用碳源不足,生物炭添加使林地土壤碳含量提高,为微生物提供充足的碳源。
微生物群落及其产生的胞外酶在有机质分解和养分循环等过程中扮演着重要的调节角色,能够反映生物炭等土壤添加剂对土壤养分循环的潜在长期影响[28]。与赵蕊蕊等[24]研究结果一致,本研究中生物炭处理组林地土壤酶活性显著高于对照(P < 0.05)。土壤硝酸还原酶能够将硝酸还原成亚硝酸,而亚硝酸还原酶能将亚硝酸还原成氮气,进而影响土壤中氮素的转化与去除。因此,随生物炭添加量增加,毛白杨林地土壤氮循环相关酶活性也随之提高,有助于土壤中氮素被还原成氮气并从土壤中去除。
3.2 生物炭添加对毛白杨林地土壤细菌群落结构的影响
生物炭添加在改变土壤化学性质的同时,也可影响土壤微生物群落结构和多样性[29]。有研究[30]表明,随着稻壳生物炭添加浓度的增加,樟子松(Pinus sylvestris var. mongolica)的细菌群落总数和丰度出现了下降。本研究发现,生物炭添加不同处理的Ace、Chao指数、Shannon多样性指数和Simpson多样性指数均无显著性差异(P > 0.05),生物炭添加对毛白杨林地土壤细菌群落α多样性的影响小。这可能与生物炭添加时间较短有关,有待进一步长期观测研究。本研究中随着生物炭添加浓度的增高,毛白杨林地土壤细菌OTU总数有所下降,且微生物群落结构发生了明显变化。优势门水平上,生物炭添加提高了变形菌门、拟杆菌门的相对丰度;降低了放线菌门的相对丰度。
河岸植被缓冲带的土壤干湿交替频繁,有利于土壤中微生物的生长,也有利于好氧硝化作用和厌氧反硝化作用的进行。在微生物作用下,铵态氮被氧化成亚硝态氮和硝态氮,然后再被反硝化细菌还原成N2或N2O等气体排入空气中,反硝化作用被认为是清除土壤里氮素的最佳途径[31]。变形菌门在反硝化过程中起着主导作用,其相对丰度的多少是影响反硝化效果的重要因素。本研究中,变形菌门在生物炭添加组的相对丰度占比较高。Zhang等[8]研究也发现生物炭的的添加能显著提高系统中的变形杆菌门的比例,强化系统脱氮性能,并通过优化生物炭的添加量,使系统中全氮的最终去除率达67%。与此同时,BC6和BC3的拟杆菌门的相对丰度较高,这是由于该菌门是一种典型的兼性厌氧菌,能适应交替的好氧缺氧环境,将亚硝酸盐还原为NO,有利于高效脱氮[32]。
生物炭比表面积大于土壤,为微生物提供附着表面和栖息环境,从而影响土壤微生物活性和群落结构,进而影响胞外酶的活性[33−34]。本研究中生物炭添加对毛白杨林地土壤养分提高和土壤酶活性增加也具有显著的促进作用,这可能与相关土壤微生物的活性增大和生物量增加有关。相关性分析表明,SOC、SOM、S-NR、S-NIR是影响土壤微生物群落门水平的主要因子,SOC、SOM与S-NR、S-NIR极显著正相关(P < 0.01),这与土壤微生物多为异养有关,生物炭添加会为微生物提供碳源和能量,从而提高了土壤氮循环相关酶活性[34]。
4. 结 论
(1)生物炭添加能够显著提升毛白杨林地土壤对氮素的截留能力以及氮循环相关酶活性。生物炭处理组土壤养分均高于对照,其中6 t/hm2处理效果更好。
(2)高通量测序结果表明,随着生物炭添加量的增大,毛白杨林地土壤细菌OTU总数有所下降,但对土壤细菌多样性影响较小。生物炭添加影响了毛白杨林地土壤优势细菌门的相对丰度,促进了河岸林地氮素的转化与去除。
(3)相关性分析表明,土壤化学性质(SOC、SOM)以及酶活性(S-NR、S-NIR)是影响土壤微生物群落门水平结构的主要因素。
-
表 1 站点数据集植被分类
Table 1 Vegetation classification of site dataset
站点 纬度 经度 时间区间(年月日时刻) 数据量/条 植被类型 罗林斯 US-GLE 41°21′59″N 106°14′24″W 201205241430 − 201406221530 36 435 常绿针叶林 梅托利乌斯 US-Me2 44°27′08″N 121°33′27″W 200401181300 − 200601041530 34 422 常绿针叶林 尼沃特岭 US-NR1 40°01′58″N 105°32′47″W 201009281530 − 201208101900 32 744 常绿针叶林 内华达 US-Var 38°24′48″N 120°57′03″W 201303280000 − 201407070030 22 370 草地 埃尔福特 DE-Geb 51°05′59″N 10°54′53″E 201202171030 − 201303141130 18 771 农田 波特科尔伯恩 CA-TP3 42°42′25″N 80°20′54″W 200512160530 − 200612260930 18 009 常绿针叶林 科奇斯 US-SRG 31°47′22″N 110°49′40″W 201101270030 − 201201160300 16 998 草地 坦普斯通 US-Whs 31°44′38″N 110°03′08″W 201007281300 − 201106081130 15 118 开放灌木地 埃森纳赫 DE-Hai 51°04′45″N 10°27′08″E 200602280300 − 200612240230 14 352 落叶阔叶林 默里桥 AU-Lox 34°28′14″S 140°39′18″E 200808191630 − 200906091000 14 100 落叶阔叶林 诺福克 CA-TP1 42°39′39″N 80°33′34″W 200512311330 − 200610131230 13 727 常绿针叶林 库特韦克 NL-Loo 52°09′59″N 5°44′37″E 200205220830 − 200303031230 13 689 常绿针叶林 内珀维尔 US-IB2 41°50′26″N 88°14′28″W 200508221300 − 200605310200 13 515 草地 韦兰德 CA-TP4 42°42′37″N 80°21′27″W 200207201400 − 200304271900 13 499 常绿针叶林 斯普林斯 AU-TTE 22°17′13″S 133°38′24″E 201305220130 − 201401180230 11 571 草地 先锋市 US-Ton 38°25′51″N 120°57′58″W 201305081200 − 201312312200 11 397 木本灌草丛 沙欣尼 US-LWW 34°57′38″N 97°58′44″W 199802181030 − 199810040000 10 924 草地 罗尔斯顿 AU-Emr 23°51′31″S 148°28′29″E 201202062100 − 201209191500 10 837 草地 巴梅拉 AU-Cpr 34°00′08″S 140°35′21″E 201206020930 − 201301041100 10 372 稀树草原 鲍威 US-Wkg 31°44′12″N 109°56′31″W 200506171000 − 200601170230 10 258 草地 科菲维尔 US-Goo 34°15′17″N 89°52′25″W 200510170000 − 200605161030 10 150 草地 埃尔奥拜德 SD-Dem 13°16′58″N 30°28′42″E 200810141400 − 200905031400 9 649 稀树草原 拉龙日 CA-SF1 54°29′06″N 105°49′04″W 200603130130 − 200609202100 9 208 常绿针叶林 诺德豪森 DE-Lnf 51°19′42″N 10°22′04″E 200302221030 − 200308311030 9 121 落叶阔叶林 凯瑟琳 AU-DaS 14°09′34″S 131°23′17″E 201104081600 − 201110142230 9 086 稀树草原 西姆科 CA-TP2 42°46′28″N 80°27′32″W 200505171330 − 200511190730 8 917 常绿针叶林 西斯特斯 US-Me4 44°29′57″N 121°37′21″W 200006081300 − 200012070630 8 724 常绿针叶林 伍德拉夫 US-Syv 46°14′31″N 89°20′52″W 200305310000 − 200311241930 8 536 混合林 塞拉维斯塔 US-SRM 31°49′17″N 110°51′58″W 200910211530 − 201004131300 8 348 木本灌草丛 纽伦比 AU-DaP 14°03′48″S 131°19′05″E 200905081630 − 200910272100 8 266 草地 比格里弗 CA-SF3 54°05′30″N 106°00′20″W 200405051330 − 200410230830 8 199 开放灌木地 注:混合林由树木主导,覆盖百分比超过60%,高度超过2 m。包括交错混合或其他4种森林类型的树木,且任何一种植被类型都不超过60%。 表 2 NEE响应因子字段
Table 2 NEE response factor field
字段名称 中文名称 单位 SW_IN_F 短波辐射 W/m2 VPD_F_MDS 饱和水汽压差 hPa TA_F_MDS 空气温度 ℃ NETRAD 净辐射能量 W/m2 WS 风速 m/s WD 风向 G_F_MDS 土壤热通量 TS_F_MDS 土壤温度 ℃ RH 相对湿度 % SWC_F_MDS 土壤含水量 % 表 3 模型主要超参数设置
Table 3 Primary hyper-parameter setting of models
超参数 含义 设定值 top_k 准确率 5 layers 层 2 dmin, dmax 深度范围 (64, 128) batch_size 批量大小 1500 learning_rate 学习率 0.001 epoch 迭代次数 10 注:因长缺失场景需要制造连续1 440条数据缺失,故模型批量大小设置为1 500;上述超参数设置可以满足模型对NEE缺失数据插补的需要。 表 4 数据插补结果
Table 4 Data imputation results
缺失情况 植被类型 PatchTST TS2Vec-PatchTST TSIT-PatchTST 边际分布采样法 MDS MSE/
(μmol·m−2·s−1)MAE/
(μmol·m−2·s−1)R2 MSE/
(μmol·m−2·s−1)MAE/
(μmol·m−2·s−1)R2 MSE/
(μmol·m−2·s−1)MAE/
(μmol·m−2·s−1)R2 MSE/
(μmol·m−2·s−1)MAE/
(μmol·m−2·s−1)R2 短缺失 农田 1.547 0.950 0.886 0.736 0.570 0.641 0.191 0.230 0.879 0.233 0.293 0.002 落叶阔叶林 1.550 0.936 0.611 0.824 0.657 0.450 0.457 0.465 0.596 2.201 0.813 0.014 常绿针叶林 1.208 0.865 0.448 0.913 0.690 0.323 0.617 0.518 0.439 4.792 1.014 0.045 草地 2.057 1.046 0.329 1.804 0.935 0.247 1.428 0.798 0.309 17.340 1.542 0.039 混合林 2.596 1.223 0.834 1.176 0.771 0.591 0.377 0.392 0.847 2.307 0.677 0.064 开放灌木地 1.116 0.856 0.423 1.007 0.745 0.304 0.750 0.592 0.439 1.114 0.521 0.025 稀树草原 2.232 1.175 0.388 2.043 1.085 0.284 1.534 0.895 0.409 3.551 0.864 0.032 木本灌草丛 3.853 1.289 0.531 2.141 1.026 0.391 1.149 0.726 0.536 18.586 1.816 0.023 中缺失 农田 1.501 0.939 0.875 0.903 0.607 0.633 0.237 0.224 0.874 0.810 0.529 0.026 落叶阔叶林 1.577 0.942 0.647 0.738 0.621 0.476 0.403 0.426 0.652 5.777 1.308 0.034 常绿针叶林 1.198 0.862 0.475 0.910 0.683 0.351 0.588 0.502 0.475 14.790 1.574 0.119 草地 2.046 1.044 0.313 1.888 0.954 0.218 1.452 0.796 0.316 16.691 1.547 0.102 混合林 2.610 1.223 0.850 1.178 0.757 0.604 0.371 0.355 0.844 2.370 0.684 0.087 开放灌木地 1.084 0.844 0.612 0.967 0.718 0.399 0.590 0.486 0.601 1.027 0.516 0.045 稀树草原 2.159 1.160 0.403 2.277 1.136 0.293 1.615 0.914 0.394 2.804 0.755 0.091 木本灌草丛 3.927 1.290 0.529 2.078 1.026 0.372 1.141 0.732 0.528 14.882 2.472 0.055 长缺失 农田 1.538 0.948 0.901 0.835 0.598 0.648 0.177 0.209 0.903 1.248 0.733 0.008 落叶阔叶林 1.559 0.939 0.603 0.695 0.607 0.447 0.398 0.436 0.607 6.709 1.539 0.013 常绿针叶林 1.206 0.864 0.442 0.912 0.690 0.323 0.610 0.518 0.439 20.316 2.492 0.047 草地 2.052 1.046 0.292 1.877 0.954 0.204 1.458 0.801 0.297 38.533 2.238 0.041 混合林 2.603 1.223 0.851 1.136 0.778 0.615 0.354 0.401 0.850 4.565 1.006 0.065 开放灌木地 1.106 0.852 0.589 1.028 0.745 0.389 0.640 0.506 0.579 2.098 0.699 0.021 稀树草原 2.205 1.170 0.423 2.290 1.138 0.310 1.593 0.907 0.422 8.449 1.237 0.031 木本灌草丛 3.878 1.290 0.548 2.006 1.014 0.385 1.092 0.714 0.544 37.945 2.534 0.013 注:加粗字体表示在同一植被类型下插补效果最佳方法。下同。 表 5 长缺失下数据插补结果的平均R2对比
Table 5 Comparison of average R2 of data imputation results under long missing
插补方法 农田 落叶阔叶林 常绿针叶林 草地 混合林 开放灌木地 稀树草原 木本灌草丛 TSIT-PatchTST 0.903 0.607 0.439 0.297 0.850 0.579 0.422 0.544 RFR10[20] 0.700 0.623 0.547 0.638 0.689 0.397 0.784 0.437 表 6 US-GLE站点日间与夜间NEE插补结果
Table 6 Daytime and nighttime NEE imputation results of US-GLE station
时间段 评价指标 短缺失 中缺失 长缺失 日间 MSE 0.509 0.635 0.709 MAE 0.429 0.514 0.502 R2 0.479 0.285 0.321 夜间 MSE 0.448 0.537 0.498 MAE 0.387 0.418 0.404 R2 0.439 0.386 0.429 注:日间时间段为上午10点至下午16点,夜间时间段为下午16点至次日上午10点。 表 7 US-GLE站点生长季与非生长季NEE插补结果
Table 7 NEE imputation results during growing and non-growing seasons of US-GLE station
时期 评价指标 短缺失 中缺失 长缺失 生长季 MSE 0.424 0.429 0.451 MAE 0.402 0.411 0.416 R2 0.486 0.398 0.392 非生长季 MSE 1.005 0.913 0.647 MAE 0.552 0.578 0.480 R2 0.191 0.105 0.204 注:生长季为4月到10月,非生长季为10月到次年4月。 -
[1] 田容才, 文双雅, 阳会兵. 基于涡度相关法的农田生态系统碳通量研究进展[J]. 激光生物学报, 2019, 28(5): 415−420. doi: 10.3969/j.issn.1007-7146.2019.05.005 Tian R C, Wen S Y, Yang H B. Research progress on carbon flux in agro-ecosystem based on eddy covariance system[J]. Acta Laser Biology Sinica, 2019, 28(5): 415−420. doi: 10.3969/j.issn.1007-7146.2019.05.005
[2] 王秀英, 周秉荣, 苏淑兰, 等. 青藏高原高寒草甸和荒漠碳交换特征及其气象影响机制[J]. 生态学报, 2023, 43(3): 1194−1208. Wang X Y, Zhou B R, Su S L, et al. Carbon exchange characteristics and meteorological influence mechanism of alpine meadow and desert in Qinghai-Tibet Plateau[J]. Acta Ecologica Sinica, 2023, 43(3): 1194−1208.
[3] Bopucki R, Kiersztyn A, Pitucha G, et al. Handling missing data in ecological studies: ignoring gaps in the dataset can distort the inference[J]. Ecological Modelling, 2022, 468: 109964. doi: 10.1016/j.ecolmodel.2022.109964
[4] 周宇, 黄辉, 张劲松, 等. 森林生态系统涡度相关法碳通量长时间连续性缺失数据插补方法的比较[J]. 中国农业气象, 2021, 42(4): 330−343. doi: 10.3969/j.issn.1000-6362.2021.04.007 Zhou Y, Huang H, Zhang J S, et al. Comparison of gap-filling methods for long-term continuous missing data in carbon flux observation by eddy covariance method of forest ecosystem[J]. Chinese Journal of Agrometeorology, 2021, 42(4): 330−343. doi: 10.3969/j.issn.1000-6362.2021.04.007
[5] Reichstein M, Falge E, Baldocchi D, et al. On the separation of net ecosystem exchange into assimilation and ecosystem respiration: review and improved algorithm[J]. Global Change Biology, 2005, 11(9): 1424−1439. doi: 10.1111/j.1365-2486.2005.001002.x
[6] 王少影, 张宇, 孟宪红, 等. 机器学习算法对涡动相关缺失通量数据的插补研究[J]. 高原气象, 2020, 39(6): 1348−1360. doi: 10.7522/j.issn.1000-0534.2019.00142 Wang S Y, Zhang Y, Meng X H, et al. Fill the gaps of eddy covariance fluxes using machine learning algorithms[J]. Plateau Meteorology, 2020, 39(6): 1348−1360. doi: 10.7522/j.issn.1000-0534.2019.00142
[7] Xiao Q, Geng G, Cheng J, et al. Evaluation of gap-filling approaches in satellite-based daily PM2.5 prediction models[J]. Atmospheric Environment, 2021, 244: 117921. doi: 10.1016/j.atmosenv.2020.117921
[8] Mahabbati A, Beringer J, Leopold M, et al. A comparison of gap-filling algorithms for eddy covariance fluxes and their drivers[J]. Geoscientific Instrumentation, Methods and Data Systems, 2021, 10(1): 123−140. doi: 10.5194/gi-10-123-2021
[9] Soloway A D, Amiro B D, Dunn A L, et al. Carbon neutral or a sink? uncertainty caused by gap-filling long-term flux measurements for an old-growth boreal black spruce forest[J]. Agricultural and Forest Meteorology, 2017, 233: 110−121. doi: 10.1016/j.agrformet.2016.11.005
[10] Yang L, Fan X, Zhang Z. Your time series is worth a binary image: machine vision assisted deep framework for time series forecasting[J/OL]. arXiv: 2302.14390v1. [2024−07−14]. https://arxiv.org/pdf/2302.14390.
[11] Irvin J, Zhou S, Mcnicol G, et al. Gap-filling eddy covariance methane fluxes: comparison of machine learning model predictions and uncertainties at FLUXNET-CH4 wetlands[J]. Agricultural and Forest Meteorology, 2021, 308−309: 108528. doi: 10.1016/j.agrformet.2021.108528
[12] Zhu S, Clement R, Mccalmont J, et al. Stable gap-filling for longer eddy covariance data gaps: a globally validated machine-learning approach for carbon dioxide, water, and energy fluxes[J]. Agricultural and Forest Meteorology, 2022, 314: 108777. doi: 10.1016/j.agrformet.2021.108777
[13] Vu M T, Jardani A, Massei N, et al. Reconstruction of missing groundwater level data by using long short-term memory (LSTM) deep neural network[J]. Journal of Hydrology, 2021, 597: 125776. doi: 10.1016/j.jhydrol.2020.125776
[14] Guo X, Yao Y, Tang Q, et al. Multimodel ensemble estimation of Landsat-like global terrestrial latent heat flux using a generalized deep CNN-LSTM integration algorithm[J]. Agricultural and Forest Meteorology, 2024, 349: 109962. doi: 10.1016/j.agrformet.2024.109962
[15] 冯新妍, 贾昕, 黄金泽, 等. ANN-BiLSTM模型在温带荒漠灌丛碳通量数据缺失值插补中的应用[J]. 北京林业大学学报, 2023, 45(9): 62−72. doi: 10.12171/j.1000-1522.20220510 Feng X Y, Jia X, Huang J Z, et al. Application of ANN-BiLSTM model to long-term gap-filling of carbon flux data in temperate desert shrub[J]. Journal of Beijing Forestry University, 2023, 45(9): 62−72. doi: 10.12171/j.1000-1522.20220510
[16] Qian L, Wu L, Zhang Z, et al. A gap filling method for daily evapotranspiration of global flux data sets based on deep learning[J]. Journal of Hydrology, 2024, 641: 131787. doi: 10.1016/j.jhydrol.2024.131787
[17] Jerse G, Marcucci A. Deep learning LSTM-based approaches for 10.7 cm solar radio flux forecasting up to 45-days[J]. Astronomy and Computing, 2024, 46: 100786. doi: 10.1016/j.ascom.2024.100786
[18] Chen Z, Xu H, Jiang P, et al. A transfer learning-based LSTM strategy for imputing large-scale consecutive missing data and its application in a water quality prediction system[J]. Journal of Hydrology, 2021, 602: 126573. doi: 10.1016/j.jhydrol.2021.126573
[19] Lucarini A, Cascio M L, Marras S, et al. Artificial intelligence and eddy covariance: a review[J]. Science of the Total Environment, 2024, 950: 175406. doi: 10.1016/j.scitotenv.2024.175406
[20] Trotta C, Canfora E, Cheah Y, et al. The FLUXNET2015 dataset and the ONEFlux processing pipeline for eddy covariance data[J]. Scientific Data, 2020, 7(1): 225−227. doi: 10.1038/s41597-020-0534-3
[21] Vekuri H, Tuovinen J, Kulmala L, et al. A widely-used eddy covariance gap-filling method creates systematic bias in carbon balance estimates[J]. Scientific Reports, 2023, 13(1): 1720. doi: 10.1038/s41598-023-28827-2
[22] 宋亮, 万建洲. 缺失数据插补方法的比较研究[J]. 统计与决策, 2020, 36(18): 10−14. Song L, Wan J Z. Comparative research on interpolation method of missing data[J]. Statistics and Decision, 2020, 36(18): 10−14.
[23] 郑小波. 基于机器学习的MIMIC数据库缺失数据插补研究[D]. 合肥: 安徽大学, 2021. Zheng X B. Study on missing data imputation in MIMIC database based on machine learning [D]. Hefei: Anhui University, 2021.
[24] Nie Y, Nguyen N H, Sinthong P, et al. A time series is worth 64 words: long-term forecasting with transformers[J/OL]. arXiv: 2211.14730v2. [2024−07−14]. https://arxiv.org/pdf/2211.14730.
[25] Yue Z, Wang Y, Duan J, et al. TS2Vec: towards universal representation of time series[J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2022, 36(8): 8980−8987. doi: 10.1609/aaai.v36i8.20881
[26] Liu Y, Hu T, Zhang H, et al. iTransformer: inverted transformers are effective for time series forecasting[J/OL]. arXiv: 2310.06625v3. [2024−08−14]. https://arxiv.org/pdf/2310.06625v3.
[27] Wu H, Hu T, Liu Y, et al. TimesNet: temporal 2D-variation modeling for general time series analysis[J/OL]. arXiv: 2210.02186v3. [2024−08−14]. https://arxiv.org/pdf/2210.02186.
[28] Rivera-Muñoz L M, Giraldo-Forero A F, Martinez-Vargas J D. Deep matrix factorization models for estimation of missing data in a low-cost sensor network to measure air quality[J]. Ecological informatics, 2022, 71: 101775. doi: 10.1016/j.ecoinf.2022.101775
[29] 李润东, 范雅倩, 冯沛, 等. 北京松山天然落叶阔叶林生态系统净碳交换特征及其影响因子[J]. 应用生态学报, 2020, 31(11): 3621−3630. Li R D, Fan Y Q, Feng P, et al. Net ecosystem carbon exchange and its affecting factors in a deciduous broad-leaved forest in Songshan, Beijing, China[J]. Chinese Journal of Applied Ecology, 2020, 31(11): 3621−3630.
[30] 张弥, 于贵瑞, 张雷明, 等. 太阳辐射对长白山阔叶红松林净生态系统碳交换的影响[J]. 植物生态学报, 2009, 33(2): 270−282. doi: 10.3773/j.issn.1005-264x.2009.02.004 Zhang M, Yu G R, Zhang L M, et al. Effects of solar radiation on net ecosystem exchange of broadleaved-Korean pine mixed forest in changbai mountain, china[J]. Chinese Journal of Plant Ecology, 2009, 33(2): 270−282. doi: 10.3773/j.issn.1005-264x.2009.02.004
[31] 游桂莹, 张志渊, 张仁铎. 全球陆地生态系统光合作用与呼吸作用的温度敏感性[J]. 生态学报, 2018, 38(23): 8392−8399. You G Y, Zhang Z Y, Zhang R D. Temperature sensitivity of photosynthesis and respiration in terrestrial ecosystems globally[J]. Acta Ecologica Sinica, 2018, 38(23): 8392−8399.