摘要:为探究拉曼光谱数据处理方式对大米产地鉴别模型的影响,以盘锦大米、响水大米、西江大米、建三江大米、五常大米和延边大米为例,考察各数据处理方式下大米产地鉴别模型的准确度。稻谷样品经精米加工、粉碎、筛分,收集粒度为100~140目的米粉,在5个测量点分别采集拉曼光谱,然后经相对标准偏差和层次聚类分析剔除差异数据,最后将剔除差异前、后的数据和取平均值前、后的数据分别建立分类模型。结果表明:通过层次聚类分析可找出潜在的差异数据,通过相对标准偏差分析可初步判断是否存在差异数据及最终验证是否是差异数据。此外,取平均值后的数据可使相同大米样品内的数据差异缩小,而不同大米样品间的差异扩大,有效提高了模型的识别准确率。本文所探究的先剔除差异数据再取平均值的数据处理方式,可将大米产地鉴别模型的识别准确率提高12.89%,为大米产地溯源分析提供更为准确、有效的分析方法。