基于PLS-DA和LS-SVM的可见_短波近红外光谱鉴定港种四九、十月红和九月鲜菜心种子的可行性研究.pdf
第44卷,第6期光谱学与光谱分析Vol44,No.6,pp1718-1723
2024年6月SpectroscopyandSpectralAnalysisJune,2024
基于PLS-DA和LS-SVM的可见/短波近红外光谱鉴定港种四九、
十月红和九月鲜菜心种子的可行性研究
章海亮,聂训1,廖少敏,詹白勺,罗微,刘书玲,刘雪梅2*,谢潮勇1*
1.华东交通大学电气与自动化工程学院,江西南昌330013
2.华东交通大学土木建筑学院,江西南昌330013
3.江西省科学技术信息研究所,江西南昌330046
摘要目前市面上菜心的品种复杂,不同菜心种子的品质与发芽率不同,但菜心种子单从外观上差别不
大,因此区分菜心种子的类别成为了一大难题。为了实现菜心种子类别的快速区分,探究了基于可见/短波
近红外光谱分析菜心种子类别的可行性。从南昌市种子交易场所购买了港种四九、十月红和九月鲜三个品
种的菜心种子,从中挑选出品相较好且大小适中的子粒,将每种菜心种子均匀分为30份,按照2:1划分为
建模集和预测集,所有样本共计90份。通过近红外光谱仪获取采样间隔为1nm的菜心种子的光谱反射率,
波长覆盖范围325~1075nm,将原始光谱数据采用多元散射校正(MSC)、卷积平滑(S-G)和标准正态变换
(SNV)三种预处理方法进行预处理,预处理后的光谱变量建立偏最小二乘回归(PLSR)模型,确定了SNV
是最佳预处理方法。采用主成分分析(PCA)对菜心种子进行了聚类分析,从前三个主成分因子(PCs)得分图
可知三种菜心种子存在光谱特征差异。将原始光谱变量、前三个PCs(累计贡献97.15%)和基于随机蛙跳
(RF)算法挑选的13个特征波长作为偏最小二乘判别(PLS-DA)和最小二乘支持向量机(LS-SVM)模型的输
入变量,从模型结果可知:三种输人变量中,采用RF筛选特征波长作为模型输人变量时,模型预测效果最
好,PCs建立的模型最差,相比于PCA分析,采用RF筛选出的特征波长更能够反映原始光谱信息。比较不
同模型预测效果,LS-SVM模型比PLS-DA模型得到的预测精度更好,其中RF-LS-SVM模型是所有模型中
最佳的预测模型,建模集和预测集均为100%。采用可见/短波近红外光谱研究菜心种子的类别可行,并且
能够获得很好地预测效果,为菜心种子的快速区分提供了理论依据。
关键词菜心种子;主成分分析;随机青蛙;偏最小二乘判别;最小二乘支持向量机
中图分类号:S339.3+1文献标识码:AD0I:10.3964/j.issn.1000-0593(2024)06-1718-06
茶籽油[1]、大米[2]等掺假问题的研究,以及西瓜[3]、小麦
引言粉[4]、麦[5]、茶叶[6]等分类研究和中药[7]的惨假问题研
究。目前已经有不少学者运用近红外光谱技术对玉米[8种
我国地大物博,种植的蔬菜在品种与形态上各异。目前子、番茄9种子等分类识别问题进行了一系列的研究,并取
市面上菜心的品种复杂,不同菜心种子的品质与发芽率不得了较好结果,但是对菜心种子的分类研究却几乎没有。
同,但菜心种子单从外观上差别不大,因此区分菜心种子的本工作采用可见/短波近红外光谱(325~1075nm)对菜
类别成为一大难题。仅依靠人为挑选难以保证正确分辨各种心种子的类别进行研究分析,获取了港种四九、十月红和九
月鲜三种品种的菜心种子,共计90份。采用偏最小二乘回归
菜心种子,而且分辨过程中存在区分时间长等缺点,迫切需
要一种快速、高准确率的菜心种子鉴别方法。模型对多元散射校正(MSC)、标准正态变换(SNV)和卷积平
近红外光谱作为一种