摘要:为快速、准确地估测小麦产量,有效提高育种工作效率,本文以小麦品系为研究对象,收集了小麦灌浆期无人机高光谱数据和产量数据。首先基于递归特征消除法筛选出特征波长作为模型输入变量,然后利用岭回归(Ridge regression,RR)、偏最小二乘回归(Partial least squares regression,PLS)、多元线性回归(Multiple linear regression,MLR)3种线性算法和随机森林(Random forest,RF)、梯度提升回归(Gradient boosting regression,GBR)、极限梯度提升(eXtreme gradient boosting,XGB)、高斯过程回归(Gaussian process regression,GPR)、支持向量回归(Support vector regression,SVR)、K最邻近算法(K-nearest neighbor,KNN)6种非线性算法构建单一算法产量估测模型并进行精度比较,最后基于Stacking算法构建多模型集成组合,筛选最佳集成模型。结果表明,基于不同算法的产量估测模型精度差异显著,非线性模型要优于线性模型,基于GBR的产量估测模型在单一模型中表现最优,训练集R2为0.72,RMSE为534.49kg/hm2,NRMSE为11.10%,测试集R2为0.60,RMSE为628.73kg/hm2,NRMSE为13.88%。基于Stacking算法构建的集成模型性能与初级模型和次级模型的选择密切相关,以KNN、RR、SVR为初级模型组合,GBR为次级模型的集成模型有效提高了估测精度,相比单一模型GBR,训练集R2提高了1.39%,测试集R2提高了3.33%。本研究可为基于高光谱技术的小麦品系产量估测提供应用参考。
文章目录
0引言
1 材料与方法
1.1研究区概况
1.2产量数据获取
1.3无人机影像获取及预处理
1.4研究方法
1.4.1遥感特征选择方法
1.4.2模型构建及精度验证
1.4.3精度验证
2 结果与分析
2.1不同产量下的小区冠层光谱反射率变化分析
2.2光谱特征选择
2.3基于单一算法的产量估测模型构建
2.4基于Stacking集成的产量估测模型构建
3 讨论
4 结论