动物营养学报  2013, Vol. 25 Issue (10): 2325-2336   PDF (2079 KB)    
基于CPM-Dairy的几种我国常用奶牛饲料原料聚类分析
刘婵娟1, 赵向辉1,2, 徐明1,3, 曹阳春1, 杨婷1, 姚军虎1     
1. 西北农林科技大学动物科技学院, 杨凌 712100;
2. 江西农业大学动物科技学院, 南昌 330045;
3. 内蒙古农业大学动物科学学院, 呼和浩特 010018
摘要:本试验依据康奈尔大学净碳水化合物净蛋白质体系(CNCPS)和CPM-Dairy配方软件的技术思想,对几种我国常用奶牛饲料原料进行聚类分析。采用近红外分析和实验室分析对4大类[苜蓿干草、干酒糟及其可溶物(DDGS)、玉米粉和玉米青贮],共1 169个我国常用奶牛饲料样品的16类指标进行测定,用聚类分析的方法对样品科学分类。结果表明,用聚类分析的方法,根据不同饲料的特点,分别将苜蓿干草分为12类、DDGS分为10类、玉米粉分为5类、玉米青贮分为6类。综合得出,聚类分析的方法得出结果符合CPM-Dairy饲料数据库要求,且可信度高。
关键词CPM-Dairy     数据库     聚类分析     CNCPS    
Clustering Analysis of Several Regular Raw Materials of Chinese Dairy Feed Based on CPM-Dairy
LIU Chanjuan1, ZHAO Xianghui1,2, XU Ming1,3, CAO Yangchun1, YANG Ting1, YAO Junhu1     
1. College of Animal Science and Technology, Northwest A & F University, Yangling 712100, China;
2. College of Animal Science and Technology, Jiangxi Agricultural University, Nanchang 330045, China;
3. College of Animal Science, Inner Mongolia Agricultural University, Hohhot 010018, China
Abstract: Based on the technique theories of Cornell Net Carbohydrate and Protein System (CNCPS) and CPM-Dairy formula software, this study was conducted to do clustering analysis for several regular raw materials of Chinese dairy feed. By the methods of near infrared analysis and laboratory analysis, sixteen types of parameters for 4 classifications (dry alfalfa hay, distiller's dried grains with solubles produced from DDGS, corn meal and corn silage), totally 1 169 regular feed samples for Chinese dairy were determined, and the samples separated into different categories by clustering analysis. The results showed that dry alfalfa hay, DDGS, corn meal and corn silage were separated into 12, 10, 5 and 6 categories, respectively. In conclusion, the results determined by clustering analysis are corresponded to the requirement of raw material database of CPM-Dairy, and are quite reliable. [Chinese Journal of Animal Nutrition, 2013, 25(10):2325-2336]
Key words: CPM-Dairy     database     clustering analysis     CNCPS    

CPM-Dairy是基于康奈尔净碳水化合-蛋白质体系(CNCPS)研究开发的目前世界上最先进的奶牛配方软件[1]。它在饲粮配方设计中,考虑了动物、环境与管理、饲料在瘤胃内的消化与流通速率等因素,充分反映了动物类型、生产水平、环境、饲粮组成及管理间的交互作用,体现了软件的动态性和精准性。聚类分析是根据研究对象的特征对其进行分类的多元技术的总称,是应用最广泛的分类技术[2]。聚类分析在生物领域的应用主要集中在对动植物和基因进行分类,获取对种群固有结构的认识[3]。此方法可用来对变量进行分类,称为R型聚类,也可用以对案例进行分类,称为Q型聚类。多种分类聚类法中,应用最广泛的是层次聚类和迭代聚类[2]。聚类分析要求所选择变量之间不可高度相关,否则相当于对这些变量进行了加权。分析结果中,同一类个体应具有高度同质性,不同类之间应具有高度异质性。

CPM-Dairy配方软件通过对大量饲料及试验数据的回归分析,集奶牛饲粮配方的预测、评价和优化功能于一体[4]。研究表明,CNCPS体系对90%以上变量的预测结果与实际生产的偏差只有1.3%[5]。Tedeschi等[6]使用CPM-Dairy 3.0对228头泌乳奶牛的实测与模型预测产奶量进行线性回归,结果表明,该模型对79.8%的变量做出了正确预测,整合相关系数高达0.997[7, 8],预测的均方根误差为5.14 kg/d,且87.3%的均方根误差源于随机误差[9],说明对高产奶牛的产奶量预测中,系统误差很小。在美国,利用该体系使奶牛平均单产在10年间(1989—1998年)提高了20%,目前,CPM-Dairy配方软件在全世界42个国家得到了广泛的应用。通过不同样品的信息特征比较,聚类分析结果可表明样品间的一致程度,进而确定样品的归属关系[10, 11]

由于生长环境、收割期、加工方法及贮存时间不同,即便同一种饲料原料其营养成分差异也较大[12, 13, 14]。因此,需要利用聚类分析方法对饲料进行科学有效的分类和汇总。目前,我国奶牛应用的饲料种类与品质上与美国存在较大差异,已有的饲料成分表及营养价值表也存在一定的局限性,主要表现在奶牛常用饲料营养成分信息过时、不完善、分类不准确等,给应用CPM-Dairy配方软件配制奶牛高效饲粮造成了不便。本研究旨在依据CNCPS和CPM-Dairy配方软件的技术思想,收集、测定部分我国常用奶牛饲料原料的营养成分,并用聚类分析法对饲粮样品进行科学分类,为建立奶牛精准营养管理软件奠定基础。

1 材料与方法
1.1 饲料样品收集

对我国现有各大型牛场常用原料进行调查研究,并与原CPM-Dairy饲料数据库信息进行对比分析,寻找并收集在原数据库中没有体现及国内外成分差异较大的饲料品种,分别为苜蓿干草(442个)、干酒糟及其可溶物(DDGS,143个)、玉米粉(263个)、玉米青贮(321个)(表1)。原料收集后尽快于65 ℃烘干后装袋保存,在测定前统一粉碎直径为0.5 mm微粒。

表1 苜蓿干草聚类结果

Table 1 The clustering results of dry alfalfa hay


1.2 指标测定及方法

CPM-Dairy配方软件从预测到优化均以饲料各指标的表观数据为基础,因此,需测定样品中干物质(DM)、有机物(OM)、粗蛋白质(CP)、粗脂肪(EE)、中性洗涤纤维(NDF)、酸性洗涤纤维(ADF)、酸性洗涤木质素(ADL)、粗灰分(ash)、非纤维性碳水化合物(NFC)、酸性洗涤不溶性蛋白质(ADIP)、中性洗涤不溶性蛋白质(NDIP)、可溶性蛋白质(SP)、非蛋白氮(NPN)、淀粉、脂肪酸、微量元素(铁、锌、铜、锰、硒、钴、碘)和常量元素(钙、磷、镁、钾、钠、氯)的含量。

测定方法:苜蓿干草、玉米粉和玉米青贮饲料样品送至华夏牧业有限公司进行近红外扫描[15],DDGS在西北农林科技大学动物科技学院实验室分析。其中,DM、OM、EE、CP、NDF、ADF、ADL、NFC、ash含量的测定参考AOAC[16],ADIP、NDIP、SP、NPN含量的测定参考Fortina等[17]、Krishnamoorthy等[18]和Licita等[19]的方法,淀粉含量采用试剂盒(爱尔兰Megazyme)测定,脂肪酸含量的测定参考Qi等[20]的方法,常量元素、微量元素含量采用原子吸收法测定[21]

1.3 聚类分析

本研究严格遵循变量与聚类分析的研究目标密切相关,不同研究对象上的值有明显差异,变量间不可高度相关的原则,采用R型聚类对变量进行筛选,并根据生产实践和软件需要对变量进行最后确定。选定聚类变量后,通过Q型聚类对研究对象进行分类。层次聚类是多种Q型聚类分析中应用最广泛的聚类方法,其聚类过程可用一个树状图表示出来,根据树状结构图进行不同的分类处理。

1.3.1 数据整理

以苜蓿干草(442个样品)为例,简述在SPSS 17.0中进行聚类分析的操作方法。将苜蓿干草各营养成分的数值输入软件中(图1)。


图1 部分苜蓿干草营养水平数据在SPSS 17.0中的输入 Fig.1 Input of partial data of nutrient levels of dry alfalfa hay in SPSS 17.0

1.3.2 聚类类型及方法的选择

激活“分析(analysis)”菜单选“分类(classify)”中的“层次聚类(hierarchical cluster)”项,从弹出对话框左侧的变量列表中选ash、ADL、EE、CP、ADF、NDF、NFC(根据经验选用常量指标),点击按钮使之进入“变量(variables)”框;在“聚类(cluster)”处选择聚类类型,其中“个案(cases)”表示观察对象聚类,variables表示变量聚类。本例是对变量聚类,因此,选择variables(图2)。

图2 指标聚类(R)选择项 Fig.2 Clustering (R) indices options

点击“图表(plots)”钮,选择“树形图(dendrogram)”项(图3-a),要求系统输出聚类结果的树状关系图,点击“继续(continue)”钮返回。点击“统计(statistics)”钮,弹出“层次聚类分析(hierarchical cluster analysis)”,选择“相似矩阵(proximity matrix)”(图3-b),要求结果中显示距离矩阵,点击continue钮返回hierarchical cluster analysis对话框。


图3 聚类结果显示项选择 Fig.3 Clustering results display options

在对变量的R型聚类中,以“皮尔逊相关关系(Pearson correlation)”作为聚类方法。为确保聚类结果的可信性,需选用不同的聚类方法反复聚类,取共同部分来去除随机因素的影响[2]。在本例中,分别选用组间聚类和质心聚类(centroid clustering),如图4所示。点击continue钮返回hierarchical cluster analysis对话框,点击“确定(OK)”钮即完成分析。

图4 聚类方法和距离的选择 Fig.4 Clustering method and distance options

2 结 果
2.1 饲料样品指标聚类结果

苜蓿干草主要指标聚类树状图见图5。从2种聚类方法得到的树状图可以看出,聚类方法可信。由于确定分类数的问题迄今尚无统一定论,实际操作中,需根据经验而定,本例在与原数据库比较的基础上,选择了CP和NDF作为分类主要指标。

图5 苜蓿干草主要指标聚类树状图 Fig.5 Dendrogram of main indices of dry alfalfa hay

2.2 饲料样品聚类结果

在对样品的聚类中,本例中选用centroid clustering方法和平方欧几里德距离(squared Euclidean distance),先根据样品的CP聚类,将样品分为6大类,将归到每1类的样品CP值求平均。之后对每个蛋白质类的样品根据NDF指标再重新聚类,对树状图(略)结果进行整理,苜蓿干草的442个样品共分为12类,将每类中的样品指标整合后结果见表1。

同理,DDGS样品聚类分析的结果是将CP和NDF作为主要指标,在此基础上,最终样品分成了10大类,结果见表2。玉米粉的聚类结果是将淀粉作为主要指标,样品最后分为了5大类,结果见表3。根据聚类分析结果,玉米青贮的主要聚类指标选定为NDF,样品被分成了6大类,结果见表4。

表2 干酒糟及其可溶物聚类结果

Table 2 The clustering results of DDGS


表3 玉米粉聚类结果

Table 3 The clustering results of corn meal


表4 玉米青贮聚类结果

Table 4 The clustering results of corn silage


表5为试验饲料所有样品的各个指标的平均值。

表5 试验饲料所有样品的各个指标的平均值

Table 5 Means of various indices of all experimental feed samples


3 讨 论

聚类分析是数据挖掘中的一个重要研究领域[22, 23, 24, 25],在生物领域的应用主要集中在对动植物种群固有结构的认识,受到广泛关注。聚类分析中,并不是加入的变量越多,得到的结果越客观。有时,加入一两个不合适的变量就会使得分类结果大相径庭。而且,不加鉴别地使用高度相关的变量相当于给这些变量进行了加权[2]。因此,聚类分析应该只根据在研究对象上有显著差别的变量进行分类,而研究者需要对聚类结果不断进行检验,剔除在不同类之间没有显著差别的变量。此外,为使数据库的界面更加友好,使用更便捷,CPM-Dairy配方软件要求先对每1种饲料原料选出1个或几个最具代表性的指标,再根据选定指标对样品进一步分类。本研究对饲料原料分类指标的确定是由聚类分析的结果及饲料本身特性共同决定。

本研究在CNCPS的理论指导下,收集、分析了全国范围内部分我国常用奶牛饲料原料的营养成分,使用聚类分析的方法,按照CPM-Dairy的要求对样品科学分类,符合饲料分类的基本方法。聚类分析法只对差异较大且没有高度相关的研究对象分类才有意义[2]。苜蓿干草的聚类中,首先选用R型(横向)聚类对指标进行分类并选择。苜蓿干草CP和NDF含量相关性较低(图5);而苜蓿干草的CP含量在14.87%~24.14%之间,NDF含量在29.82%~50.63%范围内变化,同一指标同种样品间差异较大。而且,Minson[26]和Sheaffer等[27]的研究结果表明,CP和NDF含量是最能反映粗饲料特征的指标。因此,将CP和NDF含量作为苜蓿干草的主要分类指标,这与Fox等[4]的分类依据相同。在对饲料样本进行Q型(纵向)聚类时,采用层次聚类的思想,将样品共分成了12类。Fox等[4]建立的CNCPS 5.0/CPM-Dairy 3.0饲料数据库中,苜蓿干草的CP变化范围为17.00%~25.00%(分别为17%、20%和25%),NDF范围为32.00%~46.00%(分别为32%、35%、37%、40%、43%和46%)。本研究中,苜蓿干草不同分类间CP含量相差约1个百分点,NDF含量相差2~4个百分点,符合CPM-Dairy数据库的要求。

DDGS、玉米粉和玉米青贮的聚类思想及方法同苜蓿干草。Kim等[28]研究表明,DDGS是玉米提取酒精后的副产物,主要成分为粗纤维、CP和油脂。国内DDGS样品的CP含量变化范围为21.8%~35.7%,NDF含量为32.2%~55.7%,样品间差异较大。所以本研究将CP和NDF含量作为DDGS的主要分类指标,这与Singh等[29]评价DDGS的依据为CP和NDF含量为主要指标相同。玉米粉和玉米青贮分别以淀粉和NDF含量为分类指标,是因为对玉米粉品质影响最大的成分是淀粉[30],且本研究中玉米粉样品的淀粉变化范围较大(51.93%~74.91%);玉米青贮NDF含量的变化范围较大(37.2%~70.3%),而CP含量的变化变化差异不明显(8.3%~9.6%)。对样品分类后,同种原料类与类之间的差值均符合CPM-Dairy原料数据库要求。苜蓿干草的CP和NDF含量,DDGS的CP和NDF含量,玉米粉的淀粉以及玉米青贮的NDF含量变异均相对较大,说明本研究中分类的依据合理。

由表6可知,各类饲料的SP均变异很大,可能是由于饲料中SP大部分是NPN,这与靳玲品等[31]的研究结果一致。

比较本研究结果和CPM-Dairy原料数据库数据发现,我国常用奶牛饲料原料与该数据库数据存在很大差异。以玉米青贮为例,国外的玉米青贮NDF含量变化范围是在40%~50%,国内玉米青贮NDF的变化范围是在40%~70%之间。因此,不断完善并建立我国常用奶牛饲料数据库,对建立奶牛精准营养管理软件及其应用至关重要。

4 结 论

用聚类分析的方法,根据不同饲料的特点,分别将苜蓿干草分为12类、DDGS分为10类、玉米粉分为5类和玉米青贮分为6类,其结果符合CPM-Dairy原料数据库要求。

参考文献
[1]HOLUB G.The use of CPM dairy as a nutrition management tool with a mid-south twist[C]//Mid-South Ruminant Nutrition Conference.Arlington:[s.n.],2007:15-21. (1)
[2]张文彤.SPSS统计分析高级教程[M]. 北京:高等教育出版社,2004:118-144. (5)
[3]车丽美,肖洋,王甦易,等.Kmeans聚类分析在形音字表音度中的应用[J]. 计算机技术与发展,2011,21(2):223-225,233. (1)
[4]FOX D G,TYLUTKI T P,TEDEDESCHI L O,et al.The net carbohydrate and protein system for evaluating herd nutrition and nutrient excretion[M]. New York:Cornell University,2003. (3)
[5]FOX D G,TEDESCHI L O,TYLUTKI T P,et al.The cornell net carbohydrate and protein system model for evaluating herd nutrition and nutrient excretion[J]. Animal Feed Science and Technology,2004,112(1/2/3/4):29-78. (1)
[6]TEDESCHI L O,CHALUPA W,JANCZEWSKI E,et al.Evaluation and application of the CPM dairy nutrition model[J]. Journal of Agricultural Science,2008,146:171-182. (1)
[7]LIN L I K.A concordance correlation coefficient to evaluate reproducibility[J]. Biometrics,1989,45(1):255-268. (1)
[8]LIAO J J Z.An improved concordance correlation coefficient[J]. Pharmaceutical Statistics,2003,2(4):253-261. (1)
[9]BIBBY J,TOUTENBURG H.Prediction and improved estimation in linear models[M]. Chichester:John Wiley & Sons,1977:188. (1)
[10]张萍,闫继红,朱志华,等.近红外光谱技术在食品品质鉴别中的应用研究[J]. 现代科学仪器,2006(1):60-62. (1)
[11]MEHROTRA M,WILD C.Analyzing knowledge-based systems with multiviewpoint clustering analysis[J]. Journal of Systems and Software,1995,29(3):235-249. (1)
[12]王婷婷,辛杭书,于濛,等.不同产地豆粕和DDGS营养成分、瘤胃降解率及小肠消化率的分析测定[J]. 饲料工业,2012,33(9):25-29. (1)
[13]刘景喜,韩静,潘振亮,等.几种不同来源苜蓿干草营养价值分析[J]. 黑龙江畜牧兽医,2012,9:84-85. (1)
[14]崔秀梅,杨在宾,杨维仁,等.作物秸秆剪切力与其饲料营养特性的关系[J]. 中国农业科学,2012,45(15):3137-3146. (1)
[15]李宏.应用近红外光谱法(NIRS)预测绵羊日粮的营养状况[D]. 硕士学位论文.北京:中国农业大学,2004:2-6. (1)
[16]AOAC.Official methods of analysis[S]. 17th ed.Gaithersburg:AOAC International,2000. (1)
[17]FORTINA R,MALFATTOV,MIMOSI A,et al.The establishment of a database of Italian feeds for the Cornell net carbohydrate and protein system[J]. Italian Journal of Animal Science,2003,2(3):171-179. (1)
[18]KRISHNAMOORTHY U,MUSCATO T V,SNIFFEN C J,et al.Nitrogen fractions in selected feedstuffs[J]. Journal of Dairy Science,1982,65(2):217-255. (1)
[19]LICITA G,HERNANDEZ T M,VAN SOEST P J.Standardization of procedures for nitrogen fractionation of ruminant feeds[J]. Animal Feed Science and Technology,1996,57(4):347-358. (1)
[20]QI K K,CHEN J L,ZHAO G P,et al.Effect of dietary ω6/ω3 on growth performance,carcass traits,meat quality and fatty acid profiles of Beijing-You chicken[J]. Journal of Animal Physiology and Animal Nutrition,2010,94(4):474-485. (1)
[21]TASI J.Macroelement,microelement and heavy metal content of grass species and dicotyledons[C]//Proceedings of the 20th general meeting of the European grassland federation.Luzern:[s.n.]2004:1002-1004. (1)
[22]DUNHAM D P,DUNN A,DUNTON T L,et al.Storage area network methods and apparatus for display and management of a hierarchical file system extension policy:USA,6,854,035 B2[P]. 2005-02-08. (1)
[23]XU R,WUNSCH D.Survey of clustering algorithms[J]. IEEE Transactions on Neural Networks,2005,16(3):645-678. (1)
[24]FRED A L N,JAIN A K.Data clustering using evidence accumulation[C]//Proceedings of the 16th international conference on pattern recognition.LosAlamitos:IEEE Computer Society Press,2002. (1)
[25]DUBES R C,JAIN A K.Algorithms for clustering data[M]. Upper Saddle River:Prentice Hall,1988. (1)
[26]MINSON D J.Forage in ruminant nutrition[M]. San Diego:Academic Press,1990. (1)
[27]SHEAFFER C C,MARTIN N P,LAMB J F S,et al.Leaf and stem properties of alfalfa entries[J]. Agronomy Journal,2000,92(4):733-739. (1)
[28]KIM Y,MOSIER N S,HENDRICKSON R,et al.Composition of corn dry-grind ethanol by-products:DDGS,wet cake,and thin stillage[J]. Bioresource Technology,2008,99(12):5165-5176. (1)
[29]SINGH V,JOHNSTON D B,NAIDU K,et al.Comparison of modified dry-grind corn processes for fermentation characteristics and DDGS composition[J]. American Association of Cereal Chemists,2005,82(2):187-190. (1)
[30]SINGH N,CHAWLA D,SINGH J.Influence of acetic anhydride on physicochemical,morphological and thermal properties of corn and potato starch[J]. Food Chemistry,2004,86(4):601-608. (1)
[31]靳玲品,李艳玲,屠焰,等.应用康奈尔净碳水化合物-蛋白质体系评定我国北方奶牛常用粗饲料的营养价值[J]. 动物营养学报,2013,25(3):512-526. (1)