金银花贮藏过程中绿原酸含量的高光谱无损检测(4)

来源：无损检测 【在线投稿】栏目：期刊导读时间：2021-03-10

作者:网站采编
关键词:
摘要：表3 基于不同预处理方法的PLSR的模型结果Table 3 Results of PLSR models based on different pretreatment methods预处理方法Pre-treatment methods潜变量数LVs校正集Calibration set预

表3 基于不同预处理方法的PLSR的模型结果Table 3 Results of PLSR models based on different pretreatment methods预处理方法Pre-treatment methods潜变量数LVs校正集Calibration set预测集Prediction set R2RMSE /%R2RMSE /% 原始光谱250.966 90.315 40.941 60.384 9 70.230 60.976 40.273 0 90.229 70.976 60.271 1 30.214 10.974 70.290 1 70.237 30.975 90.286 8 Moving 50.234 80.976 10.286 0 70.236 70.974 80.291 3

2.4 特征波长提取

2.4.1 UVE方法提取特征波长

UVE方法用于剔除原始824个波段中的无信息变量，金银花贮藏过程中CGA含量的UVE变量的稳定性分布结果如图2所示。2条平行线表示变量稳定性的上、下限，两条阈值分界线内的波长变量全部剔除，分界线以外的变量保留用于进一步分析。经UVE方法筛选后，共得到192个波长变量，占全波长的23.3%。

注：垂直虚线左侧为光谱变量的稳定性分布曲线，右侧为UVE中引入的824个随机噪声变量的稳定性分布结果。Note: The left side of the vertical dashed line is the stability distribution curve of spectral variables, and the right side is the stability distribution result of 824 random noise variables introduced in UVE. 图2 UVE 筛选结果Fig.2 Variables selected by UVE method

2.4.2 CARS方法提取特征波长

运行CARS算法时，迭代次数和蒙特卡罗采样运行次数分别设置为800和55。基于CARS筛选金银花CGA含量高光谱特征波长的过程如图3所示。图3a，3b和3c分别表示随着采样次数的增加，采样变量的个数，RMSECV值和每个波长的回归系数路径的变化趋势。

图3 CARS方法筛选结果Fig.3 Variables selected by CARS method

从图3a可以看出，第一阶段变量数减少较快，随后逐渐减慢，这是由于指数衰减函数的作用，体现了使用CARS算法筛选特征波长中有“粗选”和“精选”2个阶段[38]。图3b反映了随着采样次数增加RMSECV的变化趋势。采样次数从1到26，RMSECV值差距不大。随后RMSECV值升高，可能是因为在剔除无信息变量时丢失了一些重要信息变量。结合图3c分析可知，当采样次数为26时（“*”列所对应的位置），获得最佳变量子集且RMSECV值最小（0.347 7%）。最终，CARS算法从824个波段中选择了51个最佳波长，占整个波长的6.2%。

2.4.3 SPA方法提取特征波长

SPA算法的最大有效波长设置为30，对应的RMSE分布如图4a所示，其中方块对应所选变量数。由图可知，随着变量数的增加，RMSE值呈下降趋势，当波长数增加到17后，RMSE值基本不变。通过SPA算法从824个波长中选择了17个最佳波长，分布如图4b所示，其中正方形对应所选择的波长所对应的具体波段（共17个），全光谱变量被极大压缩，占全波长的2.1%。

注：a图中方块表示最终筛选的变量个数；b图中方块表示筛选变量具体对应的波长。Note: Blocks in Fig. a denote the number of variables that are finally selected; blocks in Fig. b denote the specific wavelength corresponding to the selected variables.图4 SPA方法筛选结果Fig.4 Variables selected by SPA method

2.5 模型建立与比较

由于高光谱图像在采集过程中存在非线性因素在内的多种因素的影响，如背景干扰，散光和CCD噪声等，不利于对光谱数据的分析。而BP神经网络是一种常用的非线性的建模方法，它可以有效地处理非线性问题[39]。因此，本试验分别以UVE，CARS，SPA这3种算法提取的特征波长变量作为输入变量，金银花CGA含量值作为因变量建立线性PLSR和非线性BP神经网络模型。为了评估提取的特征波长对预测金银花不同贮藏时间的CGA含量的有效性，将其与全光谱数据的模型相比较，结果如表4所示。

表4 金银花CGA含量的PLSR和BP模型的预测结果Table 4 Prediction results of CGA content in honeysuckle by PLSR and BP models模型Model筛选方法Screeningmethods变量数Variable number建模集Calibration set预测集Prediction set R2RMSE /%R2RMSE /% PLSR全光谱8240.981 90.229 70.976 60.271 1 50.269 40.970 40.298 6 10.335 10.958 90.342 0 60.401 20.948 50.387 5 60.268 30.974 60.286 3 30.364 60.941 40.413 1 BP全光谱8240.989 80.172 50.977 10.258 1 70.211 30.971 50.287 1 20.218 90.971 20.287 8 90.225 10.974 30.290 5 80.172 40.978 40.250 3 40.237 60.964 90.316 4

对比线性的PLSR模型的结果可知，全光谱-PLSR模型校正集的R2为0.981 9，RMSE为0.229 7%，预测集的R2为0.976 6，RMSE为0.271 1%，代表模型效果较好。从特征波长选择的角度可知，不同波长筛选方法对相应模型的建立会发生不同程度的变化。UVE-PLSR，CARS- PLSR和SPA-PLSR模型的预测结果较全光谱-PLSR模型均有不同程度的降低，但校正集和预测集的R2均高于0.9，说明基于特征波长建立的PLSR模型还是可行的，具有良好的预测性能，其中UVE-PLSR模型的预测效果优于CARS-PLSR和SPA-PLSR，预测集的R2为0.970 4，RMSE为0.298 6%，且结果与全光谱-PLSR接近。表明UVE方法可以有效地剔除无用的信息变量，保留与金银花品质相关性强的信息，而SPA算法可能在剔除冗余变量的同时将有用的信息也剔除。但是，与CARS、SPA算法相比，UVE算法提取的特征波长数量较多（192个）占全波长的23.3%，导致模型运算时间相对较长。因此，为了提高UVE-PLSR模型的运算时间，将UVE分别与CARS和SPA算法相结合提取特征波长变量，UVE-CARS选取特征变量26个，占UVE的13.5%，UVE-SPA选取9个特征变量，占UVE的4.7%，并建立相应的模型，模型的预测结果见表4。由表4可知，UVE-CARS-PLSR模型的预测集R2为0.974 6，RMSE为0.286 3%，UVE-SPA-PLSR模型的预测集R2为0.9414， RMSE为0.413 1%。与UVE-PLSR对比可知，UVE-CARS-PLSR不仅减少了模型的输入变量，还提高了模型的预测精度，而UVE-SPA虽提取的特征波长数较少，减少了模型的运行时间，但其预测精度降低。综合考虑PLSR模型的复杂度，选择UVE-CARS-PLSR为CGA最优的PLSR预测模型。得到的UVE-CARS-PLSR模型如式（2）：

文章来源：《无损检测》网址: http://www.wsjczzs.cn/qikandaodu/2021/0310/422.html

上一篇：大麦籽粒总淀粉含量近红外快速无损检测模型的
下一篇：用光照法无损检测鸡蛋煮熟程度