最新目录

金银花贮藏过程中绿原酸含量的高光谱无损检测(7)

来源:无损检测 【在线投稿】 栏目:期刊导读 时间:2021-03-10
作者:网站采编
关键词:
摘要:1.4 数据预处理方法 高光谱图像采集时,由于样品表面不均匀、仪器的基线漂移、随机噪声、光散射等原因使得原始光谱中包含无用的信息[20-21]。为了提高

1.4 数据预处理方法

高光谱图像采集时,由于样品表面不均匀、仪器的基线漂移、随机噪声、光散射等原因使得原始光谱中包含无用的信息[20-21]。为了提高模型预测精度和建模的效率,本研究采用了6种光谱预处理方法来增强原始光谱数据信息,包括savizky-golay卷积平滑(SG),移动窗口平滑(moving average),标准正态变量(standard normal variable,SNV),基线校正(baseline correction,BC),多元散射校正(multiplicative scatter correction,MSC),正交信号校正(orthogonal signal correction,OSC)。

1.5 特征波长选择方法

本试验中采集的每个高光谱图像的大小是1 032×270像素,每个像素光谱包含1 288个变量,数据维度较高。为了解决高光谱原始数据量庞大、冗余信息多、预测精度降低的问题,需要对全波段数据进行降维。因此,使用无信息变量消除(uninformative variable elimination,UVE),连续投影算法(successive projections algorithm,SPA),竞争性自适应加权算法(competitive adaptive reweighted sampling,CARS)来筛选原始光谱数据中与检测样品相关性较高的特征波长,并通过对比模型的精度确定最佳变量筛选方法。

UVE是一种基于偏最小二乘回归(partial least squares regression,PLSR)算法中回归系数稳定性来消除无信息变量的算法,可以有效筛选有用的波长变量[22-23]。UVE算法就是把与光谱矩阵同维数的随机变量矩阵(人工添加随机噪声信息)加入到光谱矩阵中,通过交叉验证逐一剔除法建立PLSR模型,得到相应的回归系数向量b,分析回归系数向量b的平均值和标准偏差的商C的稳定性,去除光谱矩阵X对应的Ci<Cmax变量(i表示光谱矩阵中第i列向量),其中Ci表示回归系数向量bi的平均值和标准偏差的商,Cmax为随机噪声的稳定性C的最大值。把Ci>Cmax对应的列向量作为新矩阵Xnew用于建立PLSR模型,Xnew即为UVE算法提取的特征变量矩阵。

SPA是一种前向变量选择算法,可以减少变量之间的共线性,使冗余度最低,以选择矢量空间共线性最小的变量集合[24-25]。SPA算法详细的模型步骤可见参考文献[26]。

CARS算法是根据自适应重加权采样技术和指数衰减函数选择PLSR中回归系数绝对值较大的变量,去掉权重较小的波长点,寻出最佳变量组合[27-28],CARS算法详细的模型步骤可见参考文献[9]。

1.6 模型建立与性能评估

PLSR模型是一种线性多变量数据分析方法,集中了主成分分析和典型相关分析的特点,通过从自变量和因变量数据中提取包含原数据变异信息的主成分来建立回归模型[10, 29],被广泛应用于食品和农产品内部含量的预测。PLSR是一种常用算法,具体模型可详见参考文献[25]。

为了得到适合CGA含量的预测模型,本试验除了建立PLSR模型外,又建立了CGA含量的BP神经网络模型。BP神经网络是一种基于误差逆传播算法的多层前馈网络,是目前应用较广泛的神经网络模型,它可以处理复杂的非线性问题[30-31]。本试验采用3层结构的BP神经网络:输入层、隐含层、输出层。每一层之间通过神经元连接,同层之间无连接,用tansig函数作为隐层神经元传递函数、trainlm函数为训练函数、pureline函数为输出层神经元传递函数,输入层为光谱变量个数(本试验中全光谱数据的输入变量数为824,特征波长输入变量分别与对应的特征波长数一致),输出层为测定的CGA值,隐含层节点数设为6,迭代次数、训练目标误差和学习速率分别设为1 000、0.000 1和0.01。

以决定系数(R2)和均方根误差(RMSE)来估计模型性能。R2较高且RMSE较低时,模型性能较好[32]。若R2的值高于0.90,则表示该模型有很高的预测能力[33]。本试验所有数据处理与结果分析均在Matlab 2014a软件中进行。

2 结果与分析

2.1 CGA含量分析

通过HPLC法测得的金银花贮藏过程中CGA含量变化结果如表1所示。金银花中CGA含量与其品质呈正相关。初始CGA质量分数最高,为4.864 2%,表明相应的金银花品质也是最高。随着贮藏时间从第5到20天,平均CGA含量降低至初始含量的6.1%,表明CGA在本贮藏试验中损失严重。这可能是由于金银花中CGA等活性成分在较高湿度的贮藏环境下易发生酶促氧化降解[34],从而导致金银花质量在短时间内明显下降。此外,由于贮藏20 d后,金银花发生了明显霉变,说明本研究中金银花的贮藏条件适合部分微生物生长,从而消耗了金银花中的CGA等活性成分[34],这可能是CGA大量损失的另一个主要原因。

在基于光谱数据和CGA含量值建模之前,先将500个样品按照2∶1的比例随机划分为校正集和预测集。划分结果与对应的CGA含量统计结果见表2。由表可知,在不同的贮藏期(0、5、10、15、20 d),CGA含量之间有较大的差异,而校正集与预测集之间的差异很小,这有利于建立精度更高的金银花CGA含量检测模型。

文章来源:《无损检测》 网址: http://www.wsjczzs.cn/qikandaodu/2021/0310/422.html



上一篇:大麦籽粒总淀粉含量近红外快速无损检测模型的
下一篇:用光照法无损检测鸡蛋煮熟程度

无损检测投稿 | 无损检测编辑部| 无损检测版面费 | 无损检测论文发表 | 无损检测最新目录
Copyright © 2019 《无损检测》杂志社 版权所有
投稿电话: 投稿邮箱: