文章摘要
基于特征筛选与随机森林的土壤有机质空间预测
Spatial prediction of soil organic matter based on feature screening and random forests
投稿时间:2025-06-16  修订日期:2025-08-23
DOI:
中文关键词: 土壤有机质  特征筛选  随机森林  空间预测
英文关键词: soil organic matter  characterization screening  random forest  spatial prediction
基金项目:第三次新疆综合考察项目(2021xjkk0200601);粮食作物创新团队土壤评价与质量提升岗位专家项目(BAIC02-2023);国家重点研发计划项目(2020YFC1908601)
作者单位邮编
焦扬庆 安徽理工大学 地球与环境学院 232000
张世文* 安徽理工大学 地球与环境学院 232000
颜芳 北京市耕地建设保护中心 
王胜涛 北京市耕地建设保护中心 
赵宝玉 安徽理工大学 地球与环境学院 
摘要点击次数: 90
全文下载次数: 0
中文摘要:
      【目的】针对冗余特征变量对随机森林模型存在负面影响的问题,本研究选取不同类型环境变量进行组合并优化,探究不同环境变量对随机森林模型预测土壤有机质空间分布的影响。【方法】选择地形因素、气候因素、植被因素、土壤属性和人为因素进行排列组合,构建不同环境变量组合的土壤有机质随机森林预测模型。通过Spearman相关性分析与重要性分析方法遴选最优环境变量集合。【结果】结果表明,以土壤属性和人为因素作为输入变量的随机森林预测模型结果较优,其均方根误差和决定系数分别为4.387 g·kg-1和0.802;以气候因素作为单独输入时,预测精度最低,决定系数为0.747;经特征筛选后去掉冗余变量,随机森林预测模型效果达到最优,均方根误差和决定系数分别为2.785 g·kg-1和0.911;相关性和重要性分析结果表明,地形是研究区土壤有机质的主要影响因素。【结论】随机森林模型预测精度优于传统的普通克里格、回归克里格和地理加权回归克里格模型。特征筛选后的环境变量能够有效提高随机森林预测模型精度,在变量减少的情况下,仅用高程、坡度、成土母质和年平均降水量进行研究区土壤有机质含量空间预测精度达0.8以上。本研究可为土壤有机质空间预测和环境变量筛选提供参考。
英文摘要:
      1、本研究改变了以往的研究中学者们直接采用选择的环境变量作为输入变量构建模型的方式,考虑了不同变量组合之间的互补性,以及变量之间的冗余和分类变量所带来的影响,通过特征筛选具有显著影响力的环境变量作为输入,可以有效的提高随机森林模型的预测精度。 2、通过进一步减少环境变量,发现仅用高程、坡度、成土母质和年平均降水量进行研究区SOM含量空间预测精度仍达0.8以上,不仅减少了变量输入,同时也减少了模型的计算量,可为土壤有机质空间预测和环境变量筛选提供参考。
HTML    View Fulltext   查看/发表评论  下载PDF阅读器