1. 研究目的与意义
地理标志产品指原材料产自特定的地域,其质量、声誉或者特色本质上取决于原产地的地域特征,并符合规定经审核批准后以原产地地理名称来命名的产品。随着地理标志越来越受到人们的重视,地理标志已经成为了产品的品质和特征的象征,产生了品牌效益,具有良好的口碑和知名度,日益受到消费者的青睐,因此价格也远高于市场中同类的产品。巨大的经济利益面前,假冒伪劣产品层出不穷。以五常大米为例,因其颗粒饱满、营养丰富、口感香糯的特点被评为地理标志大米,赢得广大消费者的喜爱,一些不法商贩看准了广阔的市场前景,借此为“良机”,以“调和米”鱼目混珠,掩人耳目,出现了五常大米百万吨产量与千万吨销量严重不符的乱象,不仅地理标志的品牌得不到保护,而且极大地扰乱了市场秩序,损害消费群体的利益。因此,为实现对地理标志更有效的保护,迫切需要发展地理标志产品有效鉴别技术和方法,有必要开发一种快速鉴别地理标志技术。[1]
目前大米的品质检测分为感官检测和仪器检测。感官检测虽然具有速度快的优点,但是准确度不高,尤其像“调和米”的出现加大了辨别的难度,有的甚至无法用肉眼进行识别;仪器检测则需要借助多种化学仪器,虽然其检验结果更加精准,但是耗时耗力且所需成本高,而且无法投入到日常生活的使用中,不能给消费者带来直接的便利。现在市场上针对地理标志产品防伪体系采用了二维码作为防伪溯源标识,基于二维码的地理标志产品防伪体系包括生产企业数据采集器及消费者的手机或电脑。[2]其中涉及大量的数据信息,尽管大量的数据蕴含着丰富的信息,然而并不是所有信息都是有价值的,必须对数据进行有效处理才能发掘出有价值的信息。因此,很有必要在现有的技术基础上,对特征数据进行选择、分析,从海量信息中快速、高效的提取关键数据,揭示特征数据差异化的原因,从而提高地理标识鉴别技术的算法效率,使日常生活中的鉴别更加便捷、准确、快速、全面。2. 研究内容和预期目标
1 研究内容
本文以拉曼光谱技术为主要手段,结合化学计量学方法,采集不同种类大米的谱图信息,对得到的拉曼图谱进行主成分分析,基于MATLAB 2016a平台使用多谱数据结合SVM算法,提取谱图特征信息,对数据进行降维处理,找出导致特征数据差异的关键因素,提高算法的效率,对不同种类大米的地理标志进行更加准确、快速、便捷的鉴别。
2 拟解决的关键问题
3. 国内外研究现状
近年来,拉曼光谱开始运用到农作物领域,但对比其它类型的光谱在这方面研究还比较少。国外Young Kee Chae等人从提取物中鉴定出三个不同水稻品种的19种不同地理来源的代谢物,并通过二维核磁共振(NMR)光谱进行比较。利用代谢组数据库和统计软件对核磁共振数据进行了分析。根据每个代谢物根据地理起源或品种的不同而变化的程度,由于共振强度与代谢物的浓度成正比,因此可以比较每个代谢物的相对丰度。可以找到一些特征性的代谢物,这些代谢物可作为地理起源的标记物。参考了三个不同的数据库(mmcd、hmdb和prime),并相应地分配了共振。尽管这些数据库有助于识别共振,但由于缺乏这些数据库中的标准光谱,仍然存在未经指定的共振。数据库越完整,就越能取得更好的效果[7];Ill-Min Chunga等人通过元素同位素组成分析和化学计量学技术相结合的地理鉴定来区分六个亚洲国家的大米,由于水稻籽粒稳定同位素比值和多元素含量随地理位置的变化,根据稳定同位素比值的地理来源差异选取特征数据,亚洲某些地理起源的水稻样品碳、氮、氧、硫同位素比值差异显著(Plt;0.05),统计分析采用单因素方差分析,有助于理解元素和同位素组成的变化在水稻取决于地理来源。用 IRMS ICP-MS 分别测定了大米中 25 种元素的轻元素 (C,O,S) 同位素比值和组成。此外,为了评估本研究中测定的化学标记物的辨别能力,使用化学计量学技术,包括主成分分析 (PCA) 对结果进行分析和基于正交投影的潜在结构判别分析(OPLS-DA),研究证明了使用多元素组合的可行性和轻元素同位素比率,以区分水稻的地理位起源于亚洲国家[8];Namaporn Attaviroj等人采用傅里叶变换近红外光谱 (FT-NIR) 技术,通过全粒法对糙米的种类进行了鉴别。在9088-4000 cm-1长波长的原始光谱使用类别类别的软独立建模(SIMCA)和偏最小二乘判别分析(PLSDA)方法进行识别。 SIMCA模型的最高识别精度为74.42%,PLSDA模型的识别精度为99.22%。最好的PLSDA模型显示KDML105样品的正确识别率约为97%,其他样品则为100%。将 PLSDA 应用于 MSC,并与 Savitzky-Golay 二阶导数光谱数据结合,在9088-4000 cm-1的整个波长范围内。省略水带的数据也产生了高精度 (98%) 。遵循PLSDA 技术与 PLS2,而 SIMCA技术精确度达到了74%。光谱证明了碳水化合物和蛋白质等组分存在差异,促进了校准算法的成功识别。虽然用 FT-NIR 光谱法测定谷物及其制品的质量已被证明 (Manley 等人 2002; Shon 等人 2005; Sinelli 等人 2006), 利用此技术对大米进行鉴定的研究较少[9]。国内黄嘉荣等人利用拉曼光谱和化学计量学方法,建立快速分类模型对大米进行区分。用主成分分析法对3 种大米全波段的拉曼光谱进行降维分析,前三个主成分的方差成分的方差贡献率分别为86.63%,7.78%,3.73% ,累计方差贡献率达到98.14%。经线性判别方法( Linear discrimination analysis,LDA)对样品进行分类,结果显示采用前两个主成分能达到93. 8% 的正确分类,采用前三个主成分能达到97. 9% 的正确分类。优化之后的模型对于大米的判别分析具有很好的效果,但该项工作缺乏与全波段数据的鉴别模型结果比较,且降维对模型效率的影响也未提及 [10];赵迎等人利用拉曼光谱技术结合化学判别方法建立新陈大米拉曼光谱判别模型, 应用主成分分析法(PCA)对光谱数据进行降维处理及粗分类鉴别。为提高模型的准确性,每份样品测试8次,并对异常拉曼数据剔除。选取特定波数范围进行主成分分析,以前2组主成分为坐标建立样本的PCA得分图,样品在得分图中的分布可大致反映样品的特征。基于偏最小二乘分析法(PLS),建立新陈大米快速鉴别模型,该模型对建模训练集鉴别正确率为100%,模型验证集鉴别正确率为95%。结果表明:该模型判断新陈大米是可行的,为稻谷新陈度的快速判别提供了一种新的方法[11];黄亚伟等人采用拉曼光谱结合判别分析方法对新陈玉米进行了判别研究,运用主成分马氏距离判别分析方法建立了判别模型,对光谱数据进行降维处理,主成分数为9,光谱建模范围为914~1369 cm-1 时模型结果最优,此时建模集总正确判别率为92.7%,验证集总正确判别率为90%。然后运用偏最小二乘判别分析方法建立了相应的识别模型,当建模因子数为7,采用全谱建模时结果最优,此时建模集样品正确判别率为100%,验证集样品正确判别率为95%。偏最小二乘判别分析方法正确识别率较高,结果表明拉曼光谱可以应用于玉米新陈度的快速识别,在粮食储藏品质评价中具有极大的应用潜力。但本文样品比较单一,还需要对不同地域、不同生长环境以及不同的玉米品种或者是混合品种样品进行深入的探讨研究。[12];陈国培等人使用分子生物学方法,通过构建ISSR分子标记图谱,对地理标志产品增城丝苗米7 个品种、马坝油粘米3 个品种、盘锦大米5 个品种进行分析。本实验使用23 个ISSR 引物共扩增出216 个条带,依据216 个条带可完全区分实验所分析的15 个品种,其均为在构建分子标记谱图的基础上筛选出可以用于鉴定不同大米品种的特异性DNA 片段,再在此基础上设计成特异性引物组合, 对ISSR 引物所扩增出的216个条带进行统计学分析, 从中寻找3 种地理标志产品各自的特异性条带。结果显示,该方法可完全区分实验所分析的15 个品种。此次研究将ISSR 分子标记技术应用到三种大米品种鉴定中,研究结果找到了盘锦大米区别于另两种籼米的特异性条带,并且找到了16 个特异条带可区别增城丝苗米与马坝油粘米,但是用于区分增城丝苗米与马坝油粘米的单独特异条带的查找却还有待深入研究[13];钱丽丽等人为建立地理标志大米的快速检测技术,利用近红外光谱技术结合定性分析( 鉴别分析和聚类分析) 试验选取建三江、五常、响水3 个地域的152 份试验田样品进行产地溯源研究,依据样品光谱波段的差异对差异波段范围, 按RMSECV 值升序,在波段为9 400. 9 ~ 4 249. 8 cm-1处,采用减去一条直线的预处理方法结合偏最小二乘法( PLS)对数据进行降维处理,得出R2 为99. 26%,RMSECV 为0. 043 0,维数为4,故以此建立定量分析模型,结果表明: 建三江、五常、响水3 个地域的预测正确率分别为95. 83%、100%、95. 83%。近红外光谱技术达到了对黑龙江大米快速无损检测的要求,是一种方便快捷的方法,为黑龙江大米产地溯源的研究提供借鉴[14];黄小龙等人应用电感耦合等离子体质谱(ICP-MS)法对三种地理标志产品的大米中27 种元素进行了系统研究。通过ICP-MS 系统检测了三种地理标志大米(马坝油粘米、增城丝苗米、盘锦大米)中27 种元素的含量。结果显示大米中含有大量的铝、铁、铜、锌、铷,含量都在1000μg/kg 以上。以上元素都随着地理条件的不同差异较大,作为特征数据除了确定大米的质量,还可以确定大米的产地。由于数据采集有限,对于各元素含量在不同品种或不同地理位置的分布统计有待进一步研究 [15];黎永乐应用电感耦合等离子体光谱及电感耦合等离子体质谱测定大米中无机元素含量,结合主成分分析(PCA)、Fisher判别、人工神经网络(ANN)对五常大米鉴别模型进行研究。通过R自带函数princomp()对原数据进行主成分分析。第一主成分和第二主成分的累计方差为40.2%,反映出前两个主成分包含原变量的信息较少。当主成分数量增加至七个时,累计方差为82.9%,表明通过主成分分析对数据降维的效果较差。尝试通过Fisher判别法和人工神经网络法对样品进行分类,从139个样品数据中随机挑选出100个作为训练集,39个作为验证集。通过R的MASS工具包,基于五常地区和其他地区(其他东北地区和南方地区)对训练集做Fisher判别,对验证集和训练集模型的判别准确率都达到了较高的水平,其平均判别准确率为93.5%。基于人工神经网络法建立五常大米鉴别模型,建模方法为多层感知器,选择10个隐藏层,隐藏层激活函数为双曲正切函数,最大迭代次数为100,其他参数为默认设置,而ANN法对同样的校正集和验证集样品的平均准确识别率为96.4%,优于Fisher判别法。可准确对五常大米进行鉴别,为该产品的地理标志保护提供了一种技术手段[16]。
综上,对地理标志的检测技术有很多,但是利用拉曼光谱技术对大米检测的案例较少,过去的检测方案中有使用PCA主成分分析法对拉曼光谱数据进行降维处理,但是对数据降维的效果较差。为了更深入探究影响大米差异的成分信息,使研究从宏观进入到微观水平。找出同种样本间差异小,不同样本间差异大的特征。采用PCA PCA载荷分析、HCA、移动窗口法对数据进行降维处理,结合控制图法进行分析,揭示特征数据差异化的原因,从而提高地理标识鉴别技术的算法效率。
4. 计划与进度安排
(1) 2022年11月14日—2022年1月15日:搜集并阅读资料确定选题,撰写开题报告;(2) 2022年1月16日—2022年3月26日:初稿写作;
(3) 2022年3月27日—2022年4月9日:中期检查;
(4) 2022年4月10日—2022年5月7日:反复修改论文并提交修改稿(二稿、三稿)、提交外文文献及译稿;
5. 参考文献
1. 王静, 云振宇, 张瑶, et al. 五常大米鉴别方法及标准化研究[J]. 农产品加工, 2016(17):46-49.
2. 赵莹, 李亚东, 董德光. 用二维码追溯地理标志产品[J]. 条码与信息系统, 2016(6):36-38,共3页.
3. 陈玥洋, 高志山, 郁晓晖, et al. 基于区间组合移动窗口法筛选近红外光谱信息[J]. 应用光学, 2017(1)..
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。