20 世紀(jì)70 年代以來, 化學(xué)計(jì)量學(xué)方法與計(jì)算機(jī)技術(shù)的結(jié)合使得人們不僅可以根據(jù)紅外、近紅外、核磁等光譜信息進(jìn)行物質(zhì)結(jié)構(gòu)鑒定, 而且可以根據(jù)標(biāo)準(zhǔn)品的光譜和相關(guān)定量、定性信息建立數(shù)學(xué)模型、實(shí)現(xiàn)對未知樣品的定量與定性分析 。信號弱、沒有典型的吸收特征峰而被長期忽視的近紅外光譜也在各個(gè)領(lǐng)域的定量、定性分析中得到了廣泛應(yīng)用。在中藥、煙草等天然產(chǎn)物領(lǐng)域, 運(yùn)用紅外、近紅外光譜信息進(jìn)行樣品的產(chǎn)地、道地性的模式識別工作有很多 。但目前對于更為精細(xì)的植物部位( 如煙葉部位) 的識別研究尚很少見, 而在中藥材、煙葉的質(zhì)量管理中, 部位的劃分和識別是十分重要的。
文獻(xiàn)的研究表明對于傅里葉近紅外光譜, 采用一階導(dǎo)數(shù)光譜可以取得的產(chǎn)地識別結(jié)果, 故本文對2003 年和2005 年單一產(chǎn)地的煙葉樣本的紅外和近紅外譜圖經(jīng)過一階導(dǎo)數(shù)處理后, 均勻、輪流選取樣本集的四分之一作為檢驗(yàn)集, 令模型參數(shù), 取不同區(qū)間光譜進(jìn)行煙葉上中下部位預(yù)測。
本文利用紅外光譜和近紅外光譜信息進(jìn)行煙葉部位的識別, 以探索這類光譜信息是否能夠區(qū)分更為細(xì)微的植物部位差異, 并探討了模式識別模型中有關(guān)參數(shù)( 如光譜區(qū)間、光譜預(yù)處理方法等) 對判別結(jié)果的影響。本文采用文獻(xiàn)提出的基于光譜主成分分析( PCA) 與馬氏距離的判別分析模型進(jìn)行煙葉上、中、下部位的識別, 樣品光譜距哪個(gè)部位的類中心距離zui小就屬于哪個(gè)部位。由于主成分個(gè)數(shù)的選擇無法事先確定, 主成分取得過多會引入不必要的噪聲并造成過擬合( 即建模效果很好但預(yù)測效果很差) , 而取得過少會丟失重要的信息。