基于AlexNet卷积神经网络的大米产地高光谱快速判别

吴静珠1,李晓琪1,林 珑1,刘翠玲1,刘 志2,袁玉伟2

1 北京工商大学 食品安全大数据技术北京市重点实验室 北京 100048 2 浙江省农业科学院 农业部农产品信息溯源重点实验室 杭州 310021)

摘要 采集我国东北和非东北10 个产地、4 个品种共计1 000 份单粒大米样本在波长950~1 700 nm 区间的高光谱图像,按照单粒大米轮廓提取感兴趣区域并计算平均光谱,采用主成分分析从样本集光谱矩阵提取累计贡献率大于99%的第一、二主成分,根据载荷矩阵系数最大值筛选与第一、二主成分相关性最强的特征波长1 396.67 nm 和1 467.38 nm。针对两组特征波长图像进行主成分分析,分别选取前三维主成分,共计可得2×3 组训练样本集。结果表明:基于AlexNet 卷积神经网络训练建立6 组东北/非东北大米产地高光谱快速判别模型,均有较高的识别准确率,其中基于1 467.38 nm 波长的第三主成分图像建立的东北/非东北大米产地判别模型的性能最佳,其识别准确率可达99.5%。

关键词 高光谱;大米产地鉴别;主成分分析;AlexNet 卷积神经网络

随着我国国民生活水平的提高,以东北大米为代表的优质高端大米日趋受到青睐[1-2]。东北大米以粳米为主,除东北产区外,我国粳米产区还包括华东、华北黄淮、西北等地区。东北平原特有的自然环境,如土壤肥沃、日照时间长、昼夜温差大等为稻米生长提供了良好的条件。真正的东北大米营养价值高,口感好,腹白小,价格相对于我国非东北产地大米较高。然而,目前我国农产品市场准入制度、溯源体系和检测手段尚不完善[3-4],不法商贩受经济利益驱动制售假冒或是掺伪东北大米的事件频发[5],严重扰乱了我国大米流通市场的秩序,侵犯了消费者的权益。

传统的大米品质检测方法多以湿化学分析方法为主[6-7],其检测精度高,然而普遍存在耗时长、繁琐、试样具有破坏性等弊端,无法满足我国大米市场监督和流通行业日益增长的快速、无损检测需求。高光谱技术[8]将光谱技术与成像技术的优势相结合,可用于待测目标的二维几何空间及一维光谱信息的快速、无损探测,目前已成为大米品种[9-10]、成分[11-14]、掺伪[15-16]、产地[17-20]检测领域的新兴热点。其中,王朝晖等[21]利用高光谱9 个特征波长对梅河大米与柳河县大米进行SPSS 判别分析,整体正确率达95%。孙大文等[22]提出了一种应用高光谱成像技术检测大米产地的发明专利,通过大米高光谱图像特征提取,并结合概率神经网络PNN 建立预测模型,可以快速、稳定、有效地对大米产地进行分类。Mo 等[23]应用可见/近红外(VNIR) 高光谱成像技术快速识别国内和进口大米原产地,识别精度可达99%。上述研究结果表明高光谱技术结合化学计量学方法、模式识别方法用于大米产地鉴别等具有较好的应用前景。

在市场上出现的东北大米制假情况中,较难识别的是采用相同品种而非东北产区的大米售卖。相同品种不同产区的大米在外观表征上差异不明显,而内部品质存在的差异则很难通过现有技术手段进行直观、快速地判别。近年来,卷积神经网络[24-26]以其局部感知和参数共享等特点在图像处理领域表现出独特的优越性。本文探索将卷积神经网络和高光谱图像技术结合,快速判别相同品种、不同产区大米的可行性,以期能构建符合市场需求,适用范围广,稳健性好的东北/非东北大米产地快速鉴别模型。

1 材料与方法

1.1 试验材料

东北大米品种主要有长粒香、圆粒香、稻花香和小町米。为建立适用范围较广的东北大米产地判别模型,本试验分别从浙江省农业科学院(2018年6月) 和北京古船米业有限公司 (2018年11月) 收集了东北产地大米样本5 份和非东北产地大米样本共计10 份,包括黑龙江长粒香1 份,吉林稻花香1 份,吉林圆粒香1 份,辽宁小町米2 份(不同产地),江苏长粒香1 份,江苏小町米1 份,浙江圆粒香1 份,安徽小町米1 份,河北小町米1份。每份样本随机取样100 粒,共计10×100 颗单粒大米样本。

1.2 仪器与设备

SPECIM FX17 高光谱相机,芬兰SPECIM 公司。仪器参数设置:波长范围:950~1 700 nm,FWHM 谱宽8 nm,波段数224 个,曝光时间3.8 μs,帧频40 Hz,空间采样分辨率640 px/line。

1.3 高光谱图像采集

采用SPECIM FX17 高光谱相机采集大米样本高光谱图像。将每个产地的100 颗大米样本放在10×10 的数粒板上,然后将数粒板放置于移动载物台进行成像试验。试验共计采集10×100 个单粒大米样本的高光谱图像。

1.4 数据处理方法及平台

1.4.1 高光谱预处理 首先对大米样本高光谱原始数据进行黑白板校正,以去除暗电流噪声的影响,获得大米样本反射率高光谱图像;按照大米轮廓,手动选取感兴趣区域,并将感兴趣区域内所有像素点光谱取平均作为该粒大米样本光谱,得到1 000 个大米样本的光谱数据集,如图1所示。

图1 大米样本近红外光谱
Fig.1 Near-infrared spectrums of rice samples

1.4.2 高光谱特征提取 高光谱图像分类中主要面临Hughes 现象和维数灾难问题,因此本试验采用经典的PCA (Principal components analysis,PCA) 方法对原始高光谱数据进行降维处理以消除数据共线性[17],同时还可以借助PCA 分别从光谱维和图像维对高光谱图像进行特征提取。

1.4.3 AlexNet 卷积神经网络 2012年提出的AlexNet 卷积神经网络掀起了深度学习的应用热潮[27]。AlexNet 结构如图2所示,共有8 层,前5 层为卷积层,后3 层为全连接层。它首次在CNN 中成功应用了ReLU、Dropout 和LRN 等。AlexNet 利用ReLU 代替sigmoid 提升了模型的收敛速度;通过LRN 局部响应归一化增强模型的泛化能力;最重要的是采用Dropout 方式可以有效避免小样本数据集训练过程中极易出现的过拟合现象。本文采用AlexNet 卷积神经网络构建大米产地高光谱判别高精度模型。

图2 AlexNet 卷积神经网络结构
Fig.2 Structure of AlexNet convolutional neural network

AlexNet 网络训练的试验平台如下:ubuntun16.04+Caffe;CPU:Intel(R)Core(TM)i7-6700k CPU@4.00GHZ;内存:16GB;GPU:NVIDIA GeForce GTX 1070;显存:64 GB。

2 结果与分析

2.1 特征波长提取

相同品种不同产区的大米由于生长的自然环境不同,因此在内部品质上有着较为明显的差异,而近红外光谱可以反映样本内部成分信息,因此试验拟采用PCA 方法筛选反映产地信息的关键波长。

PCA 分解思路是按照原始数据方差递减顺序依次找出相互正交的新坐标轴来重构原始数据。首先采用标准化处理上述原始光谱数据集后,再进行PCA 分解计算可得第一、第二和第三主成分的贡献率分别为95.20%,4.50%,0.22%,其中前两维主成分累积贡献率可达99.70%,涵盖了原始光谱数据的绝大部分信息,因此后续主要针对前两维主成分进行深入分析。

PCA 分析中新坐标轴的选择与原始数据本身是密切相关的,其中主成分载荷矩阵主要反映的是主成分与原始数据之间的相关性,载荷矩阵中权重系数越大,则其所对应的波长与该主成分关系越密切。图3为第一、第二主成分载荷对应的全波长权重系数分布图。根据最大值选取与第一、二主成分密切相关的特征波长,则第一主成分对应特征波长为1 396.67 nm,第二主成分对应特征波长为1 467.38 nm。其中1 396.67 nm 附近谱区主要反映游离水O-H 键的一级倍频信息以及C-H 键的组合频信息;而1 468.37 nm 附近谱区主要是N-H 键的一级倍频,反映了大米蛋白中各种丰富的氨基酸信息。因此,试验选取1 396.67,1 467.38 nm 特征波长图像进行下一步图像特征提取。

图3 第一、二主成分载荷权重分布图
Fig.3 Weight distribution of the loading of the first and second principal component

2.2 特征图像提取

试验样本集共包含了4 个品种的大米,不同品种的大米其外形和纹理特征存在显著差别,即便是相同品种、不同产区的大米也会因为内部成分的差异,导致大米的外观品质存在微小的差异。PCA 变换可以把多波段图像中的有用信息集中到数量尽可能少的新的主成分图像中,并使这些主成分图像之间互不相关,从而大大减少总的数据量。因此,试验在上述选取的1 396.67,1 467.38 nm 特征波长图像上分别做主成分分析。

图4所示为安徽产地小町米在1 467.38 nm波长处的图像进行PCA 分解得到第一、二、三主成分图像。从图4c 可以直观地看出,第三主成分图像比第一、二主成分图像能更好地区分背景和大米样本,不仅弱化了放置大米样本的数粒板背景,而且还突出显示大米样本的图像特征。这是由于PCA 变换对噪声比较敏感,本试验中大米样本是信号,数粒板背景是噪声,第一、二主成分虽然信息含量比较高,但是此时噪声方差明显大于信号方差,导致信噪比较低,因此,第一、二主成分分量形成的图像质量不如第三主成分图像。为确证试验结果,仍旧选取前三维主成分图像作为下一步分析输入。

图4 1 467.38 nm 波长图像主成分分析
Fig.4 Principal component analysis of the image at 1 467.38 nm

2.3 基于AlexNet 的大米产地鉴别模型的建立与分析

1) 数据集准备。采用网格分割法分别对1 396.67,1 467.38 nm 特征波长图像的第一、二、三主成分图像进行逐粒分割,得到单粒大米样本图像作为样本集,共计2(波长)×3(主成分图像)=6 组样本集。每组样本集包括1 000 个单粒大米样本图像,按4∶1 的比例划分,得到训练集样本800个和测试集样本200 个,训练AlexNet 模型用于大米产地鉴别。

2) 网络参数设计。在AlexNet 网络的第1 层卷积层,应用96 个11×11 卷积模板对输入图像进行滤波,得到的卷积数据先进行局部响应归一化,然后进行池化传递到第2 层卷积层中,应用256个5×5 的卷积模板对图像进行卷积后再进行LRN与pooling,第3,4,5 层的卷积模板为3×3,且之后的生成与上一层相似。在全连接层中,dropout_ratio 为0.5,最后输出为融合的softmax loss,其中训练时参数设置为:学习率0.01,迭代次数5 000。

3) 网络训练测试。试验共计训练得到6 个AlexNet 网络用于东北/非东北大米产地鉴别模型,测试结果如表1所示。

表1 基于AlexNet 的大米产地鉴别模型训练及测试结果
Table 1 The training and test results of rice origin identification model based on AlexNet

?

①基于1 467.38 nm 图像的整体识别率高于1 396.67 nm,尤其是1 467.38 nm 第三主成分图像测试集识别准确率达99.5%,较1 396.67 nm 的最大识别率提高了17.7%。试验结果表明,特征波长筛选可以显著提高模型识别准确率,其中基于1 468.37 nm 建立的东北/非东北大米产地鉴别模型表现尤为突出。1 468.37 nm 谱区附近主要反映的是大米蛋白中各种丰富的氨基酸信息,就本试验结果而言,大米蛋白质能作为区分东北/非东北产地大米的关键性指标之一。

②对于同一特征波长图像而言,基于第三主成分图像建立的AlexNet 模型识别率最高,第一主成分图像识别率最低:其中基于1 467.38 nm 的第三主成分图像比第一主成分图像识别率提高了21.3%,比第二主成分图像识别率提高了4.7%;基于1 396.67 nm 的第三主成分图像比第一主成分提高了22.5%,比第二主成分提高了11.2%。试验结果表明,图像特征提取可以有效改善模型的识别准确率,并且佐证了2.2 节中提取的第三主成分图像能具有更高的信噪比。

3 结论

本文采集了东北/非东北10 个产地、4 个品种、共计1 000 份大米样本的近红外高光谱数据,采用PCA 预处理分别从光谱维度和图像维度进行特征提取,选取1 396.67 nm 和1 467.38 nm 特征波长图像的第一、二、三主成分作为输入,结合AlexNet 深度学习神经网络训练用于大米产地快速分类的判别模型,最终1 467.38 nm 波长处图像的第三主成分作为输入时,模型识别准确率可达99.5%。试验结果表明,近红外高光谱技术结合深度学习方法有望为大米产地溯源提供快速、无损、高通量、精细化的检测方法。

参 考 文 献

[1]中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.地理标志产品 五常大米:GB/T 19266-2008[S].北京:中国标准出版社,2008:1-12.

General Administration of Quality Supervision Inspection and Quarantine of the People's Republic of China,Standardization Administration.Product of geographical indication.Wuchang rice:GB/T 19266-2008[S].Beijing:Standards Press of China,2008:1-12.

[2]中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.地理标志产品 盘锦大米:GB/T 18824-2008[S].北京:中国标准出版社,2008:1-12.

General Administration of Quality Supervision Inspection and Quarantine of the People's Republic of China,Standardization Administration.Product of geographical indication.Panjin rice:GB/T 18824-2008[S].Beijing:Standards Press of China,2008:1-12.

[3]王东亭,饶秀勤,应义斌.世界主要农业发达地区农产品追溯体系发展现状[J].农业工程学报,2014,30(8):236-250.

WANG D T,RAO X Q,YING Y B.Development of agri-products traceability in main developed agriculture region of the world[J].Transactions of the Chinese Society of Agricultural Engineering,2014,30(8):236-250.

[4]杨健,张星灿,华苗苗,等.稻米全产业链可追溯关键技术研究进展[J].粮油食品科技,2020,28(2):43-48.

YANG J,ZHANG X C,HUA M M,et al.Progress in key technologies for traceability of rice industry chain[J].Science and Technology of Cereals,Oils and Foods,2020,28(2):43-48.

[5]余云新.基于高光谱技术的掺假大米快速检测研究[D].武汉:华中科技大学,2019.

YU Y X.Study on the rapid analysis of adulterated rice based on hyperspectral imaging[D].Wuhan:Huazhong University of Science and Technology,2019.

[6]中华人民共和国国家卫生和计划生育委员会,国家食品药品监督管理总局.食品安全国家标准 食品中蛋白质的测定:GB 5009.5-2016[S].北京:中国标准出版社,2016:1-12.

National Health and Family Planning Commission of People's Republic of China,China Food and Drug Administration.National food safety standard.Determination of protein in foods:GB 5009.5-2016[S].Beijing:Standards Press of China,2016:1-12.

[7]中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.大米 直链淀粉含量的测定:GB/T 15683-2008[S].北京:中国标准出版社,2008:1-16.

General Administration of Quality Supervision Inspection and Quarantine of the People's Republic of China,Standardization Administration.Rice.determination of amylose content:GB/T 15683-2008[S].Beijing:Standards Press of China,2008:1-16.

[8]陈李品,于繁千惠,陶然,等.基于高光谱成像技术预测牡蛎干制加工过程中的水分含量[J].中国食品学报,2020,20(7):261-268.

CHEN L P,YU F Q H,TAO R,et al.Prediction of moisture content in oyster drying process based on hyperspectral imaging[J].Journal of Chinese Institute of Food Science and Technology,2020,20(7):261-268.

[9]WANG L,LIU D,PU H,et al.Use of hyperspectral imaging to discriminate the variety and quality of rice[J].Food Analytical Methods,2015,8(2):515-523.

[10]QIU Z,CHEN J,ZHAO Y,et al.Variety identification of single rice seed using hyperspectral imaging combined with convolutional neural network[J].Applied Sciences,2018,8(2):212.

[11]孙俊,唐凯,毛罕平,等.基于MEA-BP 神经网络的大米水分含量高光谱技术检测[J].食品科学,2017,38(10):272-276.

SUN J,TANG K,MAO H P,et al.Hyperspectral detection of moisture content in rice based on MEA-BP neural network[J].Food Science,2017,38(10):272-276.

[12]王朝辉,赵层,赵倩,等.基于高光谱成像的大米中蛋白质含量的可视化研究[J].食品研究与开发,2020,41(6):124-129.

WANG Z H,ZHAO C,ZHAO Q,et al.Visualization of protein content in rice based on hyper-spectral imaging[J].Food Research and Development,2020,41(6):124-129.

[13]孙俊,靳海涛,芦兵,等.基于高光谱图像及深度特征的大米蛋白质含量预测模型[J].农业工程学报,2019,35(15):295-303.

SUN J,JIN H T,LU B,et al.Prediction model of rice protein content based on hyperspectral image and deep feature[J].Transactions of the Chinese Society of Agricultural Engineering,2019,35(15):295-303.

[14]赵层.基于高光谱图像技术的梅河大米品质的无损检测研究[D].吉林:吉林农业大学,2019.

ZHAO C.Nondestructive testing of Meihe rice quality based on hyperspectral image technology [D].Jilin:Jilin Agricultural University,2019.

[15]孙俊,金夏明,毛罕平,等.高光谱图像技术在掺假大米检测中的应用[J].农业工程学报,2014,30(21):301-307.

SUN J,JIN X M,MAO H P,et al.Application of hyperspectral imaging technology for detecting adulterate rice[J].Transactions of the Chinese Society of Agricultural Engineering,2014,30(21):301-307.

[16]秦润蒙.基于SVM 和KNN 算法的地理标志大米掺假鉴别模型研究[D].吉林:吉林农业大学,2019.

QIN R M.Study on identification model of geographic indication rice adulteration based on SVM and KNN algorithm[D].Jilin:Jilin Agricultural University,2019.

[17]YU Y,YU H,GUO L,et al.et al.Accuracy and stability improvement of identification for Wuchang rice adulteration by Piece-Wise Multiplicative scatter correction in the hyperspectral imaging system [J].Analytical Methods,2018,10:3224-3231.

[18]WENG S,TANG P,YUAN H,et al.et al.Hyperspectral imaging for accurate determination of rice variety using a deep learning network with multifeature fusion [J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2020,234:118237.

[19]曹崴.基于高光谱成像技术的大米产地鉴别研究[D].吉林:吉林农业大学,2019.

CAO W.Rice origin identification based on hyperspectral imaging technology[D].Jilin:Jilin Agricultural University,2019.

[20]杨郡洲.应用高光谱成像技术对梅河大米产地确证的研究[D].吉林:吉林农业大学,2019.

YANG J Z.Study on confirmation of Meihe rice producing area by hyperspectral imaging technology[D].Jilin:Jilin Agricultural University,2019.

[21]王朝辉,杨郡洲,王艳辉,等.基于高光谱成像技术的梅河大米产地确证因子研究[J].中国粮油学报,2019,34(11):113-119.

WANG Z H,YANG J Z,WANG Y H,et al.Confirmation factors of Meihe rice producing area based on hyperspectral imaging technology[J].Journal of the Chinese Cereals and Oils Association,2019,34(11):113-119.

[22]孙大文,王璐,曾新安,等.一种基于高光谱图像技术区分大米产地的检测方法:201410438820.9[P].2014-12-17.

SUN D W,WANG L,ZENG X A,et al.A detection method for discriminate rice origin based on hyperspectral imaging technology:201410438820.9[P].2014-12-17.

[23]MO C,LIM J,KWON S,et al.Hyperspectral imaging and partial least square discriminant analysis for geographical origin discrimination of white rice[J].Journal of Biosystems Engineering,2017,42(4):293-300.

[24]周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251.

ZHOU F Y,JIN L P,DONG J.Review of convolutional neural network[J].Chinese Journal of Computers,2017,40(6):1229-1251.

[25]卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17.

LU H T,ZHANG Q C.Applications of deep convolutional neural network in computer vision [J].Journal of Data Acquisition and Processing,2016,31(1):1-17.

[26]谢为俊,丁冶春,王凤贺,等.基于卷积神经网络的油茶籽完整性识别方法[J].农业机械学报,2020,51(7):13-21.

XIE W J,DING Y C,WANG F H,et al.Integrity recognition of Camellia oleifera seeds based on convolutional neural network[J].Transactions of the Chinese Society of Agricultural Machinery,2020,51(7):13-21.

[27]KRIZHEVSKY A,SUTSKEVER I,HINTON G E.ImageNet classification with deep convolutional neural networks[C].Curran Associates Inc:International Conference on Neural Information Processing Sys tems,2012[2020-09-30].https://doi.org/10.1145/3065386.

Fast Hyperspectral Discrimination of Rice Origin Based on AlexNet Convolutional Neural Network

Wu Jingzhu1,Li Xiaoqi1,Lin Long1,Liu Cuiling1,Liu Zhi2,Yuan Yuwei2
1Beijing Key Laboratory of Big Data Technology for Food Safety,Beijing Technology and Business University,Beijing 100048 2Key Laboratory of Information Traceability of Agricultural Products,Zhejiang Academy of Agricultural Sciences,Hangzhou 310021)

Abstract There were 1 000 single-grain rice samples collected from 10 origins and 4 varieties in Northeast and non-Northeast China.Near-infrared hyperspectral images were acquired within the wavelength range of 950 nm to 1 700 nm.The region of interest was selected according to the outline of single rice from the images to calculate average spectra.Firstly,principal component analysis was used to extract the first and second principal components with a cumulative contribution rate greater than 99%.According to the maximum value of the weight coefficient in the loading matrix,the characteristic wavelengths of the first and second principal components of 1 396.67 nm and 1 467.38 nm are screened respectively.The principal component analysis was performed on the two sets of characteristic wavelength images,and the first three-dimensional principal components were selected respectively,and a total of 2×3 sets of training sample sets can be obtained.Finally,there were 6 models established to discriminate Northeast/ Non-Northeast rice.Among them,the best performing model was built based on the 1 467.38 nm third principal component image,and its recognition accuracy can reach 99.5%.

Keywords hyperspectral image;rice origin identification;principal component analysis;AlexNet convolutional neural network

文章编号 1009-7848(2022)01-0282-07

DOI:10.16429/j.1009-7848.2022.01.030

收稿日期:2021-01-20

基金项目:农业部农产品信息溯源重点实验室开放课题(2018);国家留学基金委访学项目(2019);国家重点研发计划子课题(2018YFD0101004-03)

作者简介:吴静珠(1979—),女,博士,教授 E-mail:pubwu@163.com