动物营养学报    2020, Vol. 32 Issue (3): 1353-1361    PDF    
基于近红外光谱技术评估高粱中粗蛋白质、水分含量的研究
王勇生1,2 , 李洁1,2 , 王博1,2 , 张宇婷2 , 耿俊林3     
1. 北京市畜产品质量安全源头控制工程技术研究中心, 北京 102209;
2. 中粮营养健康研究院有限公司, 北京 102209;
3. 中粮生物科技(北京)有限公司, 北京 102209
摘要: 本研究旨在探讨利用近红外光谱技术评估高粱中粗蛋白质、水分含量的可行性。以收集的110份高粱样品作为研究对象,采用GB/T 6432-1994、GB/T 6435-2014中方法分别对粗蛋白质、水分含量进行测定,利用傅里叶变换近红外光谱仪采集样品的近红外漫反射光谱,光谱扫描范围4 000~12 800 cm-1,分辨率16 cm-1,样品重复装样扫描4次,每次扫描64次获得平均光谱,取4次扫描光谱作为样本的原始光谱。分别选取矢量归一化、最小-最大归一化、一阶导数、二阶导数、多元散射校正、一阶导数+减去一条直线、一阶导数+矢量归一化、一阶导数+多元散射校正探索适用于高粱中粗蛋白质、水分含量的光谱预处理方法。利用定标集样品光谱数据,采用偏最小二乘方法结合全交互验证手段来防止过拟合现象,建立定标模型。在此基础上,利用定标决定系数、定标均分根误差、定标相对分析误差、交互验证决定系数、交互验证均方根误差、交互验证相对分析误差确定最优模型。结果显示:粗蛋白质含量扫描光谱采用一阶导数+多元散射校正光谱预处理,光谱范围为9 401.9~5 443.6 cm-1与4 603.0~4 243.9 cm-1。水分含量扫描光谱采用一阶导数+减去一条直线,光谱范围为7 500.3~6 096.5 cm-1与5 451.8~4 243.9 cm-1。高粱中粗蛋白质、水分含量的近红外光谱预测模型定标相对分析误差分别为8.41、12.20;交互验证相对分析误差分别为4.97、7.97;外部验证相对分析误差分别为3.32、5.36。由结果可知,本研究建立的高粱中粗蛋白质和水分含量的近红外光谱预测模型的相对分析误差均大于评估值,具有精确地评估高粱中粗蛋白质和水分含量的应用效果。
关键词: 近红外光谱    高粱    粗蛋白质    水分    品质测定    
Research on Evaluation of Crude Protein and Moisture Contents in Sorghum Grain Based on Near-Infrared Spectroscopy Technique
WANG Yongsheng1,2 , LI Jie1,2 , WANG Bo1,2 , ZHANG Yuting2 , GENG Junling3     
1. Beijing Engineering Research Center of Livestock Products Quality and Safety Source Control, Beijing 102209, China;
2. Nutrition & Health Research Institute of COFCO, Beijing 102209, China;
3. COFCO Bio-Tech(Beijing) Co., Ltd., Beijing 102209, China
Abstract: The objective of the present study was to explore the possibility of evaluation of crude protein and moisture contents in sorghum grain using by near-infrared spectroscopy technique. One hundred and ten sorghum grain samples were collected in the experiment. The contents of crude protein and moisture in sorghum grain samples were determined by GB/T 6432-2018 and GB/T 6435-2014, respectively. Near infrared diffuse reflectance spectra of samples were collected by four times transform near infrared spectrometer. Spectral scanning ranges was from 4 000 to 12 800 cm-1 with resolution of 16 cm-1. Each sample was scanned for 4 times repeatedly. The average spectra were obtained by scanned 64 times. Vector normalization, minimum-maximum normalization, first derivative, second derivative, multivariate scattering correction, first derivative+minus a straight line, first derivative+vector normalization and first derivative+multivariate scattering correction were selected to explore the spectral pretreatment method suitable for the contents of crude protein and moisture in sorghum grain. The calibration models were established using spectral data of samples in calibration set, and the combination of partial least squares combined with whole cross-validation method was use to prevent overfitting. On that basis, the optimal model was determined according to coefficient of determination for calibration, root mean square error of calibration, residual predictive deviation of calibration, coefficient of determination for cross-validation, root mean square error of cross-validation and residual predictive deviation of cross-validation. The results showed that first derivative+multivariate scattering correction as optimal spectral pretreatment was used for crude protein content in sorghum grain, and the spectral ranges were 9 401.9 to 5 443.6 cm-1 and 4 603.0 to 4 243.9 cm-1. First derivative+minus a straight line as optimal spectral pretreatment was fit for moisture content in sorghum grain, and the spectral ranges were 7 500.3 to 6 096.5 cm-1 and 5 451.8 to 4 243.9 cm-1. The residual predictive deviations of calibration of near-infrared spectroscopy prediction model for the contents of crude protein and moisture in sorghum grain were 8.41 and 12.20, respectively. The residual predictive deviations of cross-validation of near-infrared spectroscopy prediction model for the contents of crude protein and moisture in sorghum grain were 4.97 and 7.97, respectively. The residual predictive deviations of external validation of near-infrared spectroscopy prediction model for the contents of crude protein and moisture in sorghum grain were 3.32 and 5.36, respectively. The results indicate that the residual predictive deviations of the near-infrared spectroscopy prediction models for crude protein and moisture contents in sorghum grain which established in this study are bigger than assessed values, therefore they have application effect to accurately evaluate the contents of crude protein and moisture in sorghum grain.
Key words: near-infrared spectroscopy    sorghum grain    crude protein    moisture    quality measurement    

饲料分析是饲料生产中饲料原料和成品质量鉴定的重要依据,也是评定饲料质量好坏的重要依据。因此,饲料分析是饲料生产中不可缺少的环节,也是关系畜禽饲养成败的重要因素。在饲料常规检测中水分和粗蛋白质含量是最常见且最重要的检测项目。GB/T 6432—1994中测定饲料中粗蛋白质含量采用凯氏定氮法,是将样品消化成铵盐蒸馏,用标准液吸收,标准酸滴定,由样品中含氮量计算出饲料中粗蛋白质含量。该方法需要大量使用硫酸、硫酸铜、硼酸、氢氧化钠及盐酸等,试剂的购买成本较大,且强酸碱的使用也存在安全的隐患。GB/T 6435—2014中测定饲料中水分含量采用直接干燥法,该方法中称量瓶干燥需要(30±1) min,样品干燥需要(4.0±0.1) h,随后再次干燥(30±1) min,消耗时间较长。

近红外光谱(near-infrared spectroscopy,NIRS)分析技术具有无损、快速等优点,已被广泛应用于不同的科学研究领域[1-4],成为了不可或缺的快速准确的测定方法。玉米[5]、小麦[5]、豆粕[6]、棉籽粕[7]等饲料原料营养成分含量的近红外检测方法已有报道,而高粱的主要营养成分如粗蛋白质、水分含量的近红外检测方法还未见报道。高粱是饲料原料中替代玉米的优质原料[8-9]。2016年我国高粱产量接近300万t,进口量670万t[10]。面对如此巨大的生产量和进口量,采用国标方法进行营养成分的批次测量需要消耗大量的人力、物力和财力。为使饲料企业在使用高粱的过程中降低对其营养成分测定的成本,节能降耗,降本增效,缩短检测时间,本研究将探索利用近红外光谱技术对高粱中粗蛋白质、水分含量进行快速检测的可行性,以便实现饲料加工企业在高粱采购和加工应用过程中对其粗蛋白质、水分含量的快速评估,更好地服务于饲料加工企业。

1 材料与方法 1.1 样品采集与处理

高粱样品来自于国内不同地区及美国、巴西等国,共110份。将高粱样品使用旋风磨(Retsch ZM200型,德国)粉碎,过1.0 mm标准筛。粉碎后每个样品采用四分法分为2个重复,装入自封袋中,干燥避光处存放,并尽快对样品进行近红外光谱扫描,同时采用化学分析法测定粗蛋白质、水分含量。

1.2 化学分析法测定粗蛋白质与水分含量

采用GB/T 6432—1994、GB/T 6435—2014中方法测定高粱样品中粗蛋白质与水分含量。

1.3 近红外光谱扫描

利用本试验室设备Bruker Tang-R型近红外光谱仪(德国)采集样品的近红外漫反射光谱。为了尽可能在宽的谱区来扫描收集样品的近红外漫反射光谱,本试验光谱扫描范围设置为4 000~12 800 cm-1,分辨率16 cm-1。扫描64次获得平均光谱。样品重复装样扫描4次,取4次扫描光谱作为样本的原始光谱。

1.4 近红外光谱预测模型的建立与验证

定标集和验证集样品划分:将样品按7 : 3的比例随机分为定标集和验证集,其中验证集样品化学分析值均在定标集样品化学分析值的范围内。

定标模型构建方法:选择矢量归一化、最小-最大归一化、一阶导数、二阶导数、多元散射校正、一阶导数+减去一条直线、一阶导数+矢量归一化、一阶导数+多元散射校正等,探索适用于高粱中粗蛋白质、水分含量的光谱预处理方法。同时,为防止过拟合现象,采用偏最小二乘方法结合全交互验证,建立定标模型。在此基础上,根据定标决定系数(coefficient of determination for calibration,RCAL2)、定标均分根误差(root mean square error of calibration,RMSECAL)、定标相对分析误差(residual predictive deviation of calibration,RPDCAL)、交互验证决定系数(coefficient of determination for cross-validation,RCV2)、交互验证均方根误差(root mean square error of cross-validation,RMSECV)、交互验证相对分析误差(residual predictive deviation of cross-validation,RPDCV)确定最优模型。相关数据处理采用OPUS7.5进行分析。

定标模型的验证:采用验证集样品对最优模型进行外部验证,根据外部验证决定系数(coefficient of determination for external validation,REV2)、外部验证均方根误差(root mean square error of external validation,RMSEEV)、外部验证相对分析误差(residual predictive deviation of external validation,RPDEV)评价其外部预测能力。

定标模型评价指标:根据相对分析误差(ratio of performance to deviation,RPD)对模型进行评价。如果RPD≥3.0,说明定标效果良好,建立的定标模型可以用于实际检测;如果2.5≤RPD < 3.0,说明利用近红外光谱扫描对该成分进行定量分析是可行的;如果RPD < 2.5,则说明该成分不适合进行近红外光谱定量分析[11-13]

2 结果与分析 2.1 高粱中粗蛋白质、水分含量的测定

在测定高粱中粗蛋白质、水分含量过程中为了降低化学分析法的测定误差,同时也为了保证近红外分析的准确性,110份样品的粗蛋白质、水分含量分别由同一实验员进行操作,并保证检测时实验室环境温度的稳定性和仪器设备校准方法的一致性。试验测定的粗蛋白质和水分含量平均值分别为11.299 1%和10.002 0%(表 1)。

表 1 高粱中粗蛋白质、水分含量的测定结果 Table 1 Measured results of crude protein and moisture contents of sorghum grain  
2.2 高粱样品的近红外光谱及光谱预处理

高粱样品原始近红外光谱见图 1。样品扫描时光谱范围设定为4 000~12 800 cm-1。采用矢量归一化、最小-最大归一化、一阶导数、二阶导数、多元散射校正、减去一条直线、一阶导数+减去一条直线、一阶导数+矢量归一化、一阶导数+多元散射校正进行光谱优化预处理。粗蛋白质、水分含量的光谱优化预处理结果见表 2。优化的预处理方法按照RMSECV的大小排序,RMSECV越小越好,选择RMSECV最小值的模型作为最优的预处理模型。优化后结果表明,粗蛋白质含量检测预处理模型为一阶导数+多元散射校正(图 2),水分含量检测预处理模型为一阶导数+减去一条直线(图 3)。

图 1 高粱样品原始近红外光谱图 Fig. 1 Original near-infrared spectroscopy of samples from sorghum grain
图 2 粗蛋白质含量光谱预处理模型:一阶导数+多元散射校正 Fig. 2 Spectral pretreatment model of crude protein content: first derivative+multivariate scattering correction
图 3 水分含量光谱预处理模型一阶导数+减去一条直线 Fig. 3 Spectral pretreatment model of moisture content: first derivative+minus a straight line
表 2 高粱中粗蛋白质、水分含量的光谱优化预处理结果 Table 2 Optimized spectral pretreatment results of crude protein, moisture contents of sorghum grain
2.3 近红外光谱模型的确立和验证

经过OPUS定量方法建立了高粱中粗蛋白质、水分含量的近红外光谱检测定标模型,定标及验证结果见表 3。高粱中粗蛋白质含量预测模型定标、交叉验证和外部验证中预测值与化学分析值的验证结果分别见图 4图 5图 6。粗蛋白质含量预测模型RPDCV为4.97,大于评估值3.0;RPDVAL为3.32,大于评估值2.5,说明所建立的模型精确性较高,可用于日常检测应用。高粱中水分含量预测模型校正、交叉验证和外部验证中预测值与化学分析值验证结果分别见图 7图 8图 9。水分含量预测模型RPDCV为7.97,大于评估值3.0;RPDVAL为5.36,大于评估值2.5,说明模型的精确性很高,具有较好的应用效果。

表 3 高粱中粗蛋白质、水分含量近红外光谱模型的定标及验证效果 Table 3 Calibration and validation results of near-infrared spectroscopy models of crude protein and moisture contents of sorghum grain
图 4 粗蛋白质含量预测模型的定标:拟合值vs.化学分析值 Fig. 4 Calibration of predicted model of crude protein content: fitting value vs. chemical analyzed value
图 5 粗蛋白质含量预测模型的交叉验证:预测值vs.化学分析值 Fig. 5 Cross-validation of predicted model of crude protein content: predicted value vs. chemical analyzed value
图 6 粗蛋白质含量预测模型的外部验证:预测值vs.化学分析值 Fig. 6 External validation of predicted model of crude protein content: predicted value vs. chemical analyzed value
图 7 水分含量预测模型的定标:拟合值vs.化学分析值 Fig. 7 Calibration of predicted model of moisture content: fitting value vs. chemical analyzed value
图 8 水分含量预测模型的交叉验证:预测值vs.化学分析值 Fig. 8 Cross-validation of predicted model of moisture content: predicted value vs. chemical analyzed value
图 9 水分含量预测模型的外部验证:预测值vs.化学分析值 Fig. 9 External validation of predicted model of moisture content: predicted value vs. chemical analyzed value
3 讨论

随着饲料工业的发展以及社会劳动成本的增加,饲料样品的分析检测技术与方法也在不断改进,趋向于更加方便、快捷、准确而低成本。而近红外光谱技术的发展正好迎合了饲料检测技术的需求,其在饲料原料鉴别和营养成分分析的应用上愈加成熟。刘红梅等[14]通过不同波长和不同预处理方式建立了稻米直链淀粉含量的近红外光谱预测模型,结果表明采用多元散射校正法对全谱图进行预处理的效果较好,优化后的模型相关系数、预测标准差、校准标准差分别为0.981 9、0.100 9、0.683 1,RPD为3.6;将稻米直链淀粉含量的预测值与化学分析值进行配对t检验,得出P=0.356>0.05(置信区间为95%),表明近红外光谱法与化学分析法得到的检测结果无显著差异,即应用近红外光谱法快速检测稻米直链淀粉含量是可行的。熊利华[15]研究了近红外光谱法快速检测茶叶中粗纤维、水分和粗灰分含量的可行性,结果表明粗纤维校正集、验证集相关系数分别为0.954 3、0.962 3,RPD分别为3.49、3.56;粗灰分校正集、验证集相关系数分别为0.981 5、0.983 8,RPD分别为3.49、3.17;RPD均大于3.0,模型预测精度较高。李路等[16]采用近红外光谱技术对大米蛋白质、脂肪、总糖、水分含量进行了检测。他们运用经典Kennard-Stone法选取校正集及验证集样本,运用分段小波消噪对光谱进行预处理,通过竞争性自适应重加权采样筛选出与样本性质相关的特征波长,比较偏最小二乘法和反向传播(back-propagation,BP)神经网络法所建立的大米蛋白质、脂肪、总糖、水分含量的预测模型。对于大米蛋白质、总糖和水分含量的检测,2种方法所建立模型的决定系数均大于0.9,相对标准差均小于2.6%,具有良好的精度和稳定性;对于大米脂肪含量的检测,偏最小二乘模型的性能相对稍好,其决定系数为0.949 5,相对标准差为13.69%。李玉鹏等[7]采用改进最小二乘法回归搭配不同光谱预处理建立棉籽粕常规营养成分含量定标模型,水分、粗蛋白质、粗脂肪、粗纤维、粗灰分含量和总能的RCAL2为0.923 5~0.975 8,RCV2为0.824 7~0.930 3,取得了良好的定标效果。

影响近红外光谱分析结果准确性的因素主要包括仪器和样品2个方面。测定仪器的稳定性会引起测定的误差,如仪器的噪声、基线的飘逸、标准物质校正的准确性、波长的准确性等。样品方面主要有定标样品的选择及化学分析值的准确性和范围。定标集样品应该在区域较广的范围选择,一定要有代表性。采用化学方法进行测时误差要尽可能的小,且样品化学分析值的数值范围要宽。本试验在研究过程中仪器方面严格按照操作流程进行操作,样品测试前进行准确的校正,并保证实验室内温度的恒定。在样品光谱扫描前的粉碎和扫描过程中,以及化学指标的测定过程中均由同一人进行操作,尽最大可能减少误差的产生。

关于近红外光谱扫描技术在饲料中应用检测模型的判断方面,Williams等[12]指出当RPD≥3.0时,模型可用于农产品的质量分析。Chen等[13]研究指出,当RPD≥3.0时,定标模型能精确预测相关成分含量;当2.5≤RPD < 3.0时,定标模型的预测效果可用于大量样品的筛选工作;当RPD < 2.5时,定标模型的预测效果不理想。本试验建立的高粱中粗蛋白质含量预测模型采用一阶导数+多元散射校正光谱预处理,光谱范围为9 401.9~5 443.6 cm-1与4 603.0~4 243.9 cm-1;模型RPDCV为4.97,大于评估值3.0;RPDEV为3.32,大于评估值2.5,说明所建立的模型精确性较高,可用于日常检测。本试验建立的高粱中水分含量预测模型预处理采用一阶导数+减去一条直线,光谱范围为7 500.3~6 096.5 cm-1与5 451.8~4 244.9 cm-1,RPDCV和RPDEV分别为7.97、5.36,分别大于各自的评估值3.0和2.5,也说明模型的精确性高,具有较好的应用效果。

4 结论

① 高粱中粗蛋白质含量的近红外光谱预测模型采用一阶导数+多元散射校正光谱预处理,光谱范围为9 401.9~5 443.6 cm-1与4 603.0~4 243.9 cm-1;模型RPDCV为4.97,RPDEV为3.32,所建立的模型精确性较高,可用于日常检测。

② 高粱中水分含量的近红外光谱预测模型采用一阶导数+减去一条直线光谱预处理,光谱范围为7 500.3~6 096.5 cm-1与5 451.8~4 244.9 cm-1,模型RPDCV为7.97,RPDEV为5.36,所建立的模型精确性高,具有较好的应用效果。

参考文献
[1]
OMAR J, SLOWIKOWSKI B, BOIX A. Chemometric approach for discriminating tobacco trademarks by near infrared spectroscopy[J]. Forensic Science International, 2019, 294: 15-20.
[2]
CHEN H, TAN C, LIN Z, et al. Quantifying several adulterants of notoginseng powder by near-infrared spectroscopy and multivariate calibration[J]. Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy, 2019, 211: 280-286.
[3]
SIRISOMBOON P, POSOM J. On-line measurement of activation energy of ground bamboo using near infrared spectroscopy[J]. Renewable Energy, 2019, 133: 480-488.
[4]
陈雪萍, 刘世尧, 尹能文, 等. 甘蓝型油菜茎秆纤维组分含量和木质素单体G/S近红外模型构建[J]. 中国农业科学, 2018, 51(4): 688-696.
[5]
李军涛.近红外反射光谱快速评定玉米和小麦营养价值的研究[D].博士学位论文.北京: 中国农业大学, 2014.
[6]
王乐, 史永革, 李勇, 等. 在线近红外过程分析技术在豆粕工业生产上的应用[J]. 中国油脂, 2015, 40(1): 91-94.
[7]
李玉鹏, 李爱科, 王丽, 等.近红外反射光谱技术快速测定棉籽粕氨基酸含量[C].侯永清.中国畜牧兽医学会动物营养学分会第十二次动物营养学术研讨会论文集.北京: 中国农业大学出版社, 2016: 691.
[8]
李思思, 朱晓彤, 黎育颖, 等. 不同高粱水平低粗蛋白质饲粮对生长猪生长性能、肉品质和血清氨基酸浓度的影响[J]. 动物营养学报, 2018, 30(8): 2969-2978.
[9]
赵建飞, 胡贵丽, 唐千甯, 等. 高粱型饲粮中添加复合酶和益生菌对良凤花肉鸡生长性能、血清抗氧化指标及肠道结构的影响[J]. 动物营养学报, 2018, 30(6): 2318-2327.
[10]
桂松, 牛静, 胡建. 中国高粱产业发展现状分析[J]. 农业与技术, 2019, 39(1): 18-20.
[11]
CHEN G L, ZHANG B, WU J G, et al. Nondestructive assessment of amino acid composition in rapeseed meal based on intact seeds by near-infrared reflectance spectroscopy[J]. Animal Feed Science and Technology, 2011, 165(1/2): 111-119.
[12]
WILLIAMS P C.Implementation of near-infrared technology[M]//WILLIAMS P C, NORRIS K.Near-infrared technology in the agricultural and food industries.2nd ed.Saint, Paul: American Association of Cereal Chemists, 2001: 145-169.
[13]
CHEN L J, YANG Z L, HAN L J. A review on the use of near-infrared spectroscopy for analyzing feed protein materials[J]. Applied Spectroscopy Reviews, 2013, 48(7): 509-522.
[14]
刘红梅, 肖正午, 申涛, 等. 稻米直链淀粉含量近红外检测模型的建立[J]. 湖南农业大学学报(自然科学版), 2019, 45(2): 189-193.
[15]
熊利华.近红外光谱法快速检测茶叶中粗纤维、水分和灰分的研究[D].硕士学位论文.南昌: 东华理工大学, 2018.
[16]
李路, 黄汉英, 赵思明, 等. 大米蛋白质、脂肪、总糖、水分近红外检测模型研究[J]. 中国粮油学报, 2017, 32(7): 121-126.