高级检索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

麻疯树种子含油量近红外光谱定标模型的建立

惠文凯 王益 陈晓阳

惠文凯, 王益, 陈晓阳. 麻疯树种子含油量近红外光谱定标模型的建立[J]. 北京林业大学学报, 2018, 40(1): 1-7. doi: 10.13332/j.1000-1522.20170388
引用本文: 惠文凯, 王益, 陈晓阳. 麻疯树种子含油量近红外光谱定标模型的建立[J]. 北京林业大学学报, 2018, 40(1): 1-7. doi: 10.13332/j.1000-1522.20170388
Hui Wen-kai, Wang Yi, Chen Xiao-yang. Calibration model building for investigating seed oil content of Jatropha curcas using near infrared spectroscopy[J]. Journal of Beijing Forestry University, 2018, 40(1): 1-7. doi: 10.13332/j.1000-1522.20170388
Citation: Hui Wen-kai, Wang Yi, Chen Xiao-yang. Calibration model building for investigating seed oil content of Jatropha curcas using near infrared spectroscopy[J]. Journal of Beijing Forestry University, 2018, 40(1): 1-7. doi: 10.13332/j.1000-1522.20170388

麻疯树种子含油量近红外光谱定标模型的建立

doi: 10.13332/j.1000-1522.20170388
基金项目: 

国家自然科学基金项目 30972388

广东省自然科学基金团队项目 9351064201000002

详细信息
    作者简介:

    惠文凯,博士生。主要研究方向:林木遗传育种。Email: xwk168@126.com 地址:510642广东省广州市天河区五山路483号华南农业大学林学与风景园林学院

    通讯作者:

    陈晓阳,博士,教授。主要研究方向:林木遗传育种。Email:xychen@scau.edu.cn 地址:同上

  • 中图分类号: S758.015

Calibration model building for investigating seed oil content of Jatropha curcas using near infrared spectroscopy

  • 摘要: 目的本研究旨在建立麻疯树种子含油量的近红外光谱定标模型, 为近红外光谱技术应用于麻疯树种子含油量的测定提供依据。方法利用瑞典波通DA7200型近红外光谱成分分析仪采集了125份麻疯树种子样品的光谱数据, 通过样品化学值测定、光谱数据预处理以及回归统计方法建立了麻疯树含油量的近红外光谱定标模型, 并利用10份未知含油量的种子样品对模型的准确性进行了检验。结果本研究建模所选125份样品的含油量范围为25.23%~39.73%, 平均值为33.91%±2.64%, 中位数为34.31%, 基本覆盖了当前麻疯树的主要品种, 在种子油含量上具有一定的代表性。二阶导数联合标准正态变量转换法为建立麻疯树种子含油量近红外光谱定标模型的最佳预处理方法, 偏最小二乘法为最佳的回归方法。模型验证结果显示, 样品的化学测定值与近红外光谱定标模型预测值极显著相关, 且相关系数达0.9556, 预测标准偏差为0.6536。结论检验结果说明该模型具有较高的可靠性, 可应用于后期麻疯树种子油分含量的大批量快速测定。
  • 图  1  125份建模样品的近红外吸收光谱图

    Figure  1.  NIRS of 125 modeling samples

    图  2  经二阶导数+SNV处理后的光谱图

    Figure  2.  Line plot of NIRS after 2nd-derivative + SNV pre-treatment

    图  3  NIRS定标模型线性回归图

    Y1是近红外模型内部验证集合的拟合结果;Y2是校正集合的拟合结果。

    Figure  3.  Linear regression plot of the NIRS calibration model

    Y1 was the fitting results of inner revised set of the calibration model using near infrared spectroscopy, Y2 was the fitting results of validation set.

    表  1  125份建模样品种子含油量化学值描述性统计表

    Table  1.   Descriptive statistics of investigated value of seed oil content among 125 samples

    分析项目
    Analysis item
    平均值±标准差
    Mean±SD/%
    最大值
    Max./%
    最小值
    Min./%
    中位数
    Median/%
    变异系数
    Variable coefficient/%
    方差
    Variance
    化学测定值Chemical determination value 33.91±2.64 39.73 25.23 34.31 7.79 6.97
    下载: 导出CSV

    表  2  不同光谱预处理方法的模型参数

    Table  2.   Model parameters of each pre-treatment method

    模型
    Model
    预处理方法
    Pre-treatment method
    删除点数
    Outlier number
    RC RMSEC RCV RMSECV
    1 SNV 7 0.718 1.392 0.632 1.612
    2 MSC 7 0.733 1.353 0.679 1.501
    3 标准化Normalization 9 0.749 1.325 0.688 1.505
    4 一阶导数1st-derivative 8 0.851 1.013 0.771 1.254
    5 二阶导数2nd-derivative 3 0.857 0.980 0.750 1.310
    6 1st-derivative +SNV 4 0.813 1.139 0.760 1.303
    7 1st-derivative +MSC 7 0.824 1.108 0.769 1.280
    8 1st-derivative +normalization 11 0.783 1.195 0.709 1.404
    9 2nd-derivative +SNV 9 0.910 0.784 0.833 1.076
    10 2nd-derivative +MSC 10 0.904 0.799 0.824 1.086
    11 2nd-derivative +normalization 7 0.818 1.075 0.729 1.328
    12 SNV+1st-derivative 9 0.782 1.237 0.726 1.404
    13 MSC+1st-derivative 9 0.784 1.184 0.730 1.341
    14 Normalization+1st-derivative 9 0.808 1.150 0.729 1.376
    15 SNV+2nd-derivative 9 0.859 0.919 0.767 1.201
    16 MSC+2nd-derivative 10 0.837 0.968 0.740 1.249
    17 Normalization+2nd-derivative 10 0.885 0.860 0.774 1.211
    注:RC为校正模型相关系数;RMSEC为校正模型标准偏差;RCV为交互验证相关系数;RMSECV为交互验证标准偏差;SNV为标准正态变量转换法;MSC为乘积分散校正法。下同。
    Notes: RC, calibration model correlation coefficient; RMSEC, calibration model standard deviation; RCV, cross-validation correlation coefficient; RMSECV, cross-validation standard deviation; SNV, standard normal variable; MSC, multiplicative scatter correction. The same below.
    下载: 导出CSV

    表  3  不同回归方法处理后的模型参数

    Table  3.   Model parameters with varied regression methods

    预处理方法
    Pre-treatment method
    回归方法
    Regression method
    删除点数
    Outlier number
    RC RMSEC RCV RMSECV
    2nd-derivative +SNV PLS 9 0.910 0.784 0.833 1.076
    2nd-derivative +SNV PCR 9 0.677 1.358 0.612 1.495
    2nd-derivative +MSC PLS 10 0.904 0.799 0.824 1.086
    2nd-derivative +MSC PCR 10 0.624 1.410 0.542 1.553
    下载: 导出CSV

    表  4  检验样品的化学测定值、模型预测值及相关参数

    Table  4.   Chemical determination values, model predictive values and their relative parameters of test samples

    检测值类型
    Detection value item
    平均值
    Mean/%
    最大值
    Max./%
    最小值
    Min./%
    相关系数
    Correlation coefficient
    预测标准偏差
    Predictive standard deviation
    化学测定值Chemical determination value 35.22 38.25 30.57 0.9556** 0.6536
    预测值Predicted value 35.51 37.56 31.04
    注:**表示相关性极显著,P<0.01。Notes: ** means the very significant level, P<0.01.
    下载: 导出CSV
  • [1] 惠文凯, 杨舒贻, 陈涵斌, 等.赤霉素诱导麻疯树雌雄花分化的研究[J].南京林业大学学报(自然科学版), 2016, 40(6): 174-180. http://d.old.wanfangdata.com.cn/Periodical/njlydxxb201606027

    Hui W K, Yang S Y, Chen H B, et al. Female and male flower bud differentiation of Jatropha curcas L. induced by gibberellins[J]. Journal of Nanjing Forestry University(Natural Science Edition), 2016, 40(6): 174-180. http://d.old.wanfangdata.com.cn/Periodical/njlydxxb201606027
    [2] Koh M Y, Ghazi T I M. A review of biodiesel production from Jatropha curcas L. oil[J]. Renewable and Sustainable Energy Reviews, 2011, 15(5): 2240-2251. doi:  10.1016/j.rser.2011.02.013
    [3] Baldini M, Bulfoni E, Ferfuia C. Seed processing and oil quality of Jatropha curcas L. on farm scale: a comparison with other energy crops[J]. Energy for Sustainable Development, 2014, 19: 7-14. doi:  10.1016/j.esd.2013.12.005
    [4] 惠文凯, 陈晓阳, 刘明骞, 等.麻风树种源间种实性状变异研究[J].北京林业大学学报, 2014, 36(3): 110-114. doi:  10.13332/j.cnki.jbfu.2014.03.012

    Hui W K, Chen X Y, Liu M Q, et al. Variations of fruit and seed traits of Jatropha curcas L. among provenances[J]. Journal of Beijing Forestry University, 2014, 36(3): 110-114. doi:  10.13332/j.cnki.jbfu.2014.03.012
    [5] 李维莉, 杨辉, 林南英, 等.可再生能源麻疯树种子油化学成分研究[J].云南大学学报(自然科学版), 2000, 22(5): 324. doi:  10.3321/j.issn:0258-7971.2000.05.022

    Li W L, Yang H, Lin N Y, et al. Study on the chemical composition of seed oil of Jatropha as renewable energy[J]. Journal of Yunnan University (Natural Sciences Edition), 2000, 22(5): 324. doi:  10.3321/j.issn:0258-7971.2000.05.022
    [6] 佘珠花, 刘大川, 刘金波, 等.麻疯树籽油理化特性和脂肪酸组成分析[J].中国油脂, 2005, 30(5): 30-31. doi:  10.3321/j.issn:1003-7969.2005.05.008

    She Z H, Liu D C, Liu J B, et al. Physicochemical properties and fatty acid composition of Jatropha curcas L. seed oil[J]. China Oils and Fats, 2005, 30(5): 30-31. doi:  10.3321/j.issn:1003-7969.2005.05.008
    [7] Kaushik N, Kumar K, Kumar S, et al. Genetic variability and divergence studies in seed traits and oil content of Jatropha (Jatropha curcas L.) accessions[J]. Biomass and Bioenergy, 2007, 31(7): 497-502. doi:  10.1016/j.biombioe.2007.01.021
    [8] Roggo Y, Chalus P, Maurer L, et al. A review of near infrared spectroscopy and chemometrics in pharmaceutical technologies[J]. Journal of Pharmaceutical and Biomedical Analysis, 2007, 44(3): 683-700. doi:  10.1016/j.jpba.2007.03.023
    [9] 方彦, 王汉宁.利用近红外光谱法测定玉米籽粒含油量的研究[J].西北农业学报, 2007, 16(1): 111-113. doi:  10.3969/j.issn.1004-1389.2007.01.026

    Fang Y, Wang H N. Studies on the determining of oil contents for maize kernels using near infrared spectroscopy[J]. Acta Agriculturae Boreali-Occidentalis Sinica, 2007, 16(1): 111-113. doi:  10.3969/j.issn.1004-1389.2007.01.026
    [10] 原姣姣, 王成章, 陈虹霞.近红外光谱技术及其在植物油品质分析中的应用[J].生物质化学工程, 2010, 44(6): 59-65. doi:  10.3969/j.issn.1673-5854.2010.06.013

    Yuan J J, Wang C Z, Chen H X. Near infrared spectroscopy technology and analysis in quality traits of vegetable oil[J]. Biomass Chemical Engineering, 2010, 44(6): 59-65. doi:  10.3969/j.issn.1673-5854.2010.06.013
    [11] 杨翠玲, 陈文杰, 赵兴忠, 等.近红外光谱法同时分析油菜9种品质参数的研究[J].西北农林科技大学学报(自然科学版), 2006, 34(3): 61-67. doi:  10.3321/j.issn:1671-9387.2006.03.013

    Yang C L, Chen W J, Zhao X Z, et al. Determination of quality factors in intact rapeseed by near infrared reflectance spectroscopy(NIRS)[J]. Journal of Northwest Sci-Tech University of Agricultural and Forestry(Natural Science Edition), 2006, 34(3): 61-67. doi:  10.3321/j.issn:1671-9387.2006.03.013
    [12] Jiang H Y, Zhu Y J, Wei L M, et al. Analysis of protein, starch and oil content of single intact kernels by near infrared reflectance spectroscopy (NIRS) in maize (Zea mays L.)[J]. Plant Breeding, 2007, 126(5): 492-497. doi:  10.1111/pbr.2007.126.issue-5
    [13] 杨小红, 郭玉秋, 傅旸, 等.利用近红外光谱法分析玉米籽粒脂肪酸含量的研究[J].光谱学与光谱分析, 2009, 29(1): 106-109. doi:  10.3964/j.issn.1000-0593(2009)01-0106-04

    Yang X H, Guo Y Q, Fu Y, et al. Measuring fatty acid concentration in maize grain by near-infrared reflectance spectroscopy[J]. Spectroscopy and Spectral Analysis, 2009, 29(1): 106-109. doi:  10.3964/j.issn.1000-0593(2009)01-0106-04
    [14] 刘波, 张丽娟, 苗保河, 等.近红外光谱法与国标法测定大豆蛋白质和脂肪的比较[J].山东农业科学, 2007 (1): 109-111. doi:  10.3969/j.issn.1001-4942.2007.01.037

    Liu B, Zhang L J, Miao B H, et al. Comparison between near infrared spectroscopy and GB method used to determine protein and fat in soybean[J]. Shandong Agricultural Sciences, 2007 (1): 109-111. doi:  10.3969/j.issn.1001-4942.2007.01.037
    [15] 朱文秀, 赵继献, 张品, 等.近红外光谱分析与化学方法检测油菜种子品质参数的比较[J].安徽农学通报, 2010, 16(17): 182-183, 185. doi:  10.3969/j.issn.1007-7731.2010.17.091

    Zhu W X, Zhao J X, Zhang P, et al. The comparison study of NIR and chemical method for determining quality parameters in Rapeseed[J]. Anhui Agricultural Science Bulletin, 2010, 16(17): 182-183, 185. doi:  10.3969/j.issn.1007-7731.2010.17.091
    [16] Posom J, Sirisomboon P. Evaluation of the moisture content of Jatropha curcas kernels and the heating value of the oil-extracted residue using near-infrared spectroscopy[J]. Biosystems Engineering, 2015, 130: 52-59. doi:  10.1016/j.biosystemseng.2014.12.003
    [17] Vaknin Y, Ghanim M, Samra S, et al. Predicting Jatropha curcas seed-oil content, oil composition and protein content using near-infrared spectroscopy: a quick and non-destructive method[J]. Industrial Crops and Products, 2011, 34(1): 1029-1034. doi:  10.1016/j.indcrop.2011.03.011
    [18] Luque De Castro M D, Priego-capote F. Soxhlet extraction: past and present panacea[J]. Journal of chromatography A, 2010, 1217(16): 2383-2389. doi:  10.1016/j.chroma.2009.11.027
    [19] 中华人民共和国国家质量监督检验检疫总局, 中国国家标准化管理委员会.粮油检验粮食中粗脂肪含量测定: GB/T5512—2008[S].北京: 中国标准出版社, 2008.

    General Administration of Quality Supervision, Inspection and Quarantine of the People's Republic of China, Standardization Administration of the People's Republic of China. Inspect of grain and oilseeds: determination of crude fat content in grain: GB/T5512—2008[S]. Beijing: Standards Press of China, 2008.
    [20] 吴建国.作物种子品质研究中近红外光谱分析模型的创建和应用[D].杭州: 浙江大学, 2004.

    Wu J G. NIR spectroscopy model construction and application in the research of crop seed qualities[D]. Hangzhou: Zhejiang University, 2004.
    [21] 奚如春, 钟燕梅, 邓小梅, 等.基于近红外光谱的油茶种子含油量定标模型构建[J].林业科学, 2013, 49(4): 1-6. doi:  10.3969/j.issn.1672-8246.2013.04.001

    Xi R C, Zhong Y M, Deng X M, et al. Models for determining oil contents in Camellia oleifera seeds by using near infrared spectroscopy[J]. Scientia Silvae Sinicae, 2013, 49(4): 1-6. doi:  10.3969/j.issn.1672-8246.2013.04.001
    [22] 李勇, 魏益民, 王锋.影响近红外光谱分析结果准确性的因素[J].核农学报, 2005, 19(3): 236-240. doi:  10.3969/j.issn.1000-8551.2005.03.017

    Li Y, Wei Y M, Wang F. Affecting factors on the accuracy of near-infrared spectroscopy analysis[J]. Acta Agriculturae Nucleatae Sinica, 2005, 19(3): 236-240. doi:  10.3969/j.issn.1000-8551.2005.03.017
    [23] Shabanimofrad M, Rafii M Y, Wahab P E M, et al. Phenotypic, genotypic and genetic divergence found in 48 newly collected Malaysian accessions of Jatropha curcas L.[J]. Industrial Crops and Products, 2013, 42: 543-551. doi:  10.1016/j.indcrop.2012.06.023
    [24] 祝诗平, 王一鸣, 张小超.农产品近红外光谱品质检测软件系统的设计与实现[J].农业工程学报, 2003, 19(4): 175-179. doi:  10.3321/j.issn:1002-6819.2003.04.043

    Zhu S P, Wang Y M, Zhang X C. Design and implementation of near infrared spectroscopy analysis software system for agricultural product quality detection[J]. Transactions of the Chinese Society of Agricultural Engineering, 2003, 19(4): 175-179. doi:  10.3321/j.issn:1002-6819.2003.04.043
    [25] 王毅.近红外光谱分析技术在食用植物油品质检测中的应用[D].镇江: 江苏大学, 2010.

    Wang Y. Application of near-infrared spectroscopy analysis in quality detection of edible vegetable oil[D]. Zhenjiang: Jiangsu University, 2010.
    [26] 陈锋, 何中虎, 崔党群.利用近红外透射光谱技术测定小麦籽粒硬度的研究[J].作物学报, 2004, 30(5): 455-459. doi:  10.3321/j.issn:0496-3490.2004.05.009

    Chen F, He Z H, Cui D Q. Measurement of wheat hardness by near infrared transmittance spectroscopy[J]. Acta Agronomica Sinica, 2004, 30(5): 455-459. doi:  10.3321/j.issn:0496-3490.2004.05.009
    [27] 王刚.花椒挥发油含量近红外光谱无损检测研究[D].重庆: 西南大学, 2008.

    Wang G. Nondestructive detection of volatile oil content in Zanthoxylum bungeagum Maxim. by near infrared spectroscopy[D]. Chongqing: Southwest University, 2008.
    [28] 韩智彪.棉籽油份含量近红外测定技术研究[D].武汉: 华中农业大学, 2012.

    Han Z B. Studies on the determination of cotton seed oil by near infrared reflectance spectroscopy[D]. Wuhan: Huazhong Agricultural University, 2012.
    [29] 高建芹, 张洁夫, 浦惠明, 等.近红外光谱法在测定油菜籽含油量及脂肪酸组成中的应用[J].江苏农业学报, 2007, 23(3): 189-195. doi:  10.3969/j.issn.1000-4440.2007.03.006

    Gao J Q, Zhang J F, Pu H M, et al. Analysis of oil, oleic acid and erucic acid contents in rapeseed by near infrared reflectance spectroscopy(NIRS)[J]. Jiangsu Journal of Agricultural Sciences, 2007, 23(3): 189-195. doi:  10.3969/j.issn.1000-4440.2007.03.006
    [30] 李君霞, 张洪亮, 严衍禄, 等.水稻蛋白质近红外定量模型的创建及在育种中的应用[J].中国农业科学, 2006, 39(4): 836-841. doi:  10.3321/j.issn:0578-1752.2006.04.029

    Li J X, Zhang H L, Yan Y L, et al. Establishment of math models of NIRS analysis for protein contents in seed and its application in rice breeding[J]. Scientia Agricultura Sinica, 2006, 39(4): 836-841. doi:  10.3321/j.issn:0578-1752.2006.04.029
    [31] 张学锋, 周新奇, 陈智锋, 等.新型国产近红外分析仪的菜籽菜粕快速检测技术研究[J].计算机与应用化学, 2010, 27(12): 1625-1628. doi:  10.3969/j.issn.1001-4160.2010.12.008

    Zhang X F, Zhou X Q, Chen Z F, et al. The research of rapid analysis for rapeseed and rapeseed meal based on a new type domestic near infrared analyzer[J]. Computers and Applied Chemistry, 2010, 27(12): 1625-1628. doi:  10.3969/j.issn.1001-4160.2010.12.008
  • [1] 曹梦, 潘萍, 欧阳勋志, 臧颢, 吴自荣, 杨阳, 占常燕.  基于哑变量的闽楠天然次生林单木胸径和树高生长模型研究 . 北京林业大学学报, 2019, 41(5): 88-96. doi: 10.13332/j.1000-1522.20190026
    [2] 陈珠琳, 王雪峰, 孙汉中.  基于可见光-近红外图像的幼龄檀香全磷含量诊断 . 北京林业大学学报, 2019, 41(2): 88-96. doi: 10.13332/j.1000-1522.20180214
    [3] 李梁, 张建军, 陈宝强, 冯换成.  晋西黄土区封禁小流域植被群落特征变化 . 北京林业大学学报, 2017, 39(10): 78-89. doi: 10.13332/j.1000-1522.20170185
    [4] 袁虎威, 王晓飞, 杜清平, 钮世辉, 李悦, 李伟.  基于BWB的油松初级种子园混合子代优树选择与配置设计 . 北京林业大学学报, 2017, 39(11): 28-34. doi: 10.13332/j.1000-1522.20160330
    [5] 娄明华, 张会儒, 雷相东, 卢军.  天然云冷杉针阔混交林单木胸径树高空间自回归模型研究 . 北京林业大学学报, 2016, 38(8): 1-9. doi: 10.13332/j.1000-1522.20150491
    [6] 董晨, 吴保国, 张瀚.  基于冠幅的杉木人工林胸径和树高参数化预估模型 . 北京林业大学学报, 2016, 38(3): 55-63. doi: 10.13332/j.1000-1522.20150129
    [7] 王红艳, 张志强, 查同刚, 朱聿申, 张建军, 朱金兆.  径流曲线数(SCS-CN)模型估算黄土高原小流域场降雨径流的改进 . 北京林业大学学报, 2016, 38(8): 71-79. doi: 10.13332/j.1000-1522.20150508
    [8] 程士超, 李丹, 张求慧, 黄安民.  5种花梨木的红外光谱比较分析 . 北京林业大学学报, 2016, 38(1): 118-124. doi: 10.13332/j.1000--1522.20150181
    [9] 张怡卓, 苏耀文, 李超, 门洪生.  蒙古栎木材MOR与MOE的近红外光谱预测模型分析 . 北京林业大学学报, 2016, 38(8): 99-105. doi: 10.13332/j.1000-1522.20150505
    [10] 李耀翔, 李颖, 姜立春.  基于小波压缩的木材密度近红外光谱的预处理研究 . 北京林业大学学报, 2016, 38(3): 89-94. doi: 10.13332/j.1000-1522.20150299
    [11] 卢军, 张会儒, 雷相东, 杨英军, 王全军.  长白山云冷杉针阔混交林幼树树高--胸径模型 . 北京林业大学学报, 2015, 37(11): 10-25. doi: 10.13332/j.1000-1522.20140429
    [12] 周淑梅, 雷廷武, 雷启祥, 张满良.  黄土高原小流域出口断面水力几何模型 . 北京林业大学学报, 2015, 37(9): 45-52. doi: 10.13332/j.1000-1522.20150043
    [13] 刘镇波, 薛占川, 刘一星, 王鹏, 沈晓燕, 孔文杨, 王向明, .  基于近红外光谱法预测杨木的综纤维素含量 . 北京林业大学学报, 2013, 35(5): 110-116.
    [14] 唐辉, 孔德鑫, 梁惠凌, 王满莲, 史艳财, 韦记青.  不同产地地枫皮的红外光谱和化学计量学快速评价 . 北京林业大学学报, 2012, 34(3): 137-141.
    [15] 宋艳冬, 金爱武, 金晓春, 张启良, 陈焕伟.  毛竹叶片光合色素的光谱估算模型 . 北京林业大学学报, 2010, 32(1): 31-34.
    [16] 张建军, 纳磊, 张波, .  HEC--HMS分布式水文模型在黄土高原小流域的可应用性 . 北京林业大学学报, 2009, 31(3): 52-57.
    [17] 张正海, 康向阳, 刘明虎, 段乌拉, .  小胡杨小孢子发生及微管骨架变化 . 北京林业大学学报, 2008, 30(6): 36-40.
    [18] 尹增芳, 李云开, 张玉兰, 梁善庆, 崔丽娟, 林勇明, 李昌晓, 李春义, 周繇, 刘杏娥, 任云卯, 王春梅, 闫德千, 张运春, 谭健晖, 张颖, 王蕾, 周海宾, 金莹杉, 林娅, 赵铁珍, 王戈, 张仁军, 张秀新, 孙阁, 吴淑芳, 王超, 陈圆, 邢韶华, 刘青林, 高岚, 黄华国, 杨培岭, 刘艳红, 刘国经, 张志强, 樊汝汶, 张明, 江泽慧, 张桥英, 江泽慧, 王以红, 翟明普, 洪滔, 马履一, 马钦彦, 王莲英, 钟章成, 温亚利, 张曼胤, 于俊林, 赵勃, 罗建举, 杨远芬, 徐秋芳, 余养伦, 吴普特, 周荣伍, 邵彬, 汪晓峰, 杨海军, 田英杰, 陈学政, 王玉涛, 吴承祯, 殷际松, 冯浩, 于文吉, 何春光, 张本刚, 王希群, 刘俊昌, 安玉涛, 崔国发, 费本华, 罗鹏, 张晓丽, 王小青, 周国模, 周国逸, 柯水发, 任树梅, 蔡玲, 马润国, 洪伟, 徐昕, 邬奇峰, 费本华, 何松云, 徐克学, 王九中, 康峰峰, 魏晓华, 李敏, 温亚利, 刘爱青, 高贤明, 赵景刚, 骆有庆, 胡喜生, 赵弟行, 任海青, 赵焕勋, 吴家森, 安树杰, 朱高浦, 郑万建, 田平, 吴宁, 林斌, 宋萍, 卢俊峰, 李永祥, 范海兰.  强烈侵蚀产沙区小流域土壤侵蚀强度的支持向量机预报模型研究 . 北京林业大学学报, 2007, 29(3): 93-98.
    [19] 余雁, 江泽慧, 王戈, 覃道春, 许忠允.  采谱方式对竹材气干密度近红外预测模型精度的影响 . 北京林业大学学报, 2007, 29(4): 80-83.
    [20] 黄荣凤, 胡胜华, 高黎, 毛俊娟, 张莉俊, 秦爱光, 李瑞, 王费新, 郑小贤, 张璧光, 魏潇潇, 颜绍馗, 周永学, 袁怀文, 何亚平, 邓小文, 刘杏娥, 胡万良, 杨平, 王芳, 白岗栓, 殷亚方, 吴彩燕, 张洪江, 王兆印, 张岩, 赵天忠, 杜社妮, 王小青, 汪思龙, 崔赛华, 孙向阳, 王正, 常旭, 乔建平, 李猛, 戴思兰, 费世民, NagaoHirofumi, 王晓欢, 王胜华, 张克斌, 罗晓芳, 樊军锋, 刘燕, 谭学仁, , 李华, 徐嘉, 张双保, 张占雄, 江玉林, 陈放, 王海燕, 张旭, KatoHideo, 江泽慧, 韩士杰, 高荣孚, 李昀, 龚月桦, 刘云芳, 孔祥文, 范冰, IdoHirofumi, 刘秀英, , 陈秀明, 常亮, 李媛良, 李晓峰, 丁磊, 杨培华, 郭树花, 侯喜录, 任海青, 陈宗伟, 薛岩, , 张桂兰, 蒋俊明, 李考学, , 张代贵, 高建社, 费本华, 徐庆祥, 陈学平, 李雪峰, 刘永红, , 王晓东, 续九如, 涂代伦, 金鑫, , 张红丽, 丁国权, .  不同温度和铝浓度对麻疯树生理指标的影响及外源钙的作用 . 北京林业大学学报, 2007, 29(6): 201-205.
  • 加载中
图(3) / 表 (4)
计量
  • 文章访问数:  976
  • HTML全文浏览量:  99
  • PDF下载量:  82
  • 被引次数: 0
出版历程
  • 收稿日期:  2017-10-27
  • 修回日期:  2017-11-13
  • 刊出日期:  2018-01-01

麻疯树种子含油量近红外光谱定标模型的建立

doi: 10.13332/j.1000-1522.20170388
    基金项目:

    国家自然科学基金项目 30972388

    广东省自然科学基金团队项目 9351064201000002

    作者简介:

    惠文凯,博士生。主要研究方向:林木遗传育种。Email: xwk168@126.com 地址:510642广东省广州市天河区五山路483号华南农业大学林学与风景园林学院

    通讯作者: 陈晓阳,博士,教授。主要研究方向:林木遗传育种。Email:xychen@scau.edu.cn 地址:同上
  • 中图分类号: S758.015

摘要: 目的本研究旨在建立麻疯树种子含油量的近红外光谱定标模型, 为近红外光谱技术应用于麻疯树种子含油量的测定提供依据。方法利用瑞典波通DA7200型近红外光谱成分分析仪采集了125份麻疯树种子样品的光谱数据, 通过样品化学值测定、光谱数据预处理以及回归统计方法建立了麻疯树含油量的近红外光谱定标模型, 并利用10份未知含油量的种子样品对模型的准确性进行了检验。结果本研究建模所选125份样品的含油量范围为25.23%~39.73%, 平均值为33.91%±2.64%, 中位数为34.31%, 基本覆盖了当前麻疯树的主要品种, 在种子油含量上具有一定的代表性。二阶导数联合标准正态变量转换法为建立麻疯树种子含油量近红外光谱定标模型的最佳预处理方法, 偏最小二乘法为最佳的回归方法。模型验证结果显示, 样品的化学测定值与近红外光谱定标模型预测值极显著相关, 且相关系数达0.9556, 预测标准偏差为0.6536。结论检验结果说明该模型具有较高的可靠性, 可应用于后期麻疯树种子油分含量的大批量快速测定。

English Abstract

惠文凯, 王益, 陈晓阳. 麻疯树种子含油量近红外光谱定标模型的建立[J]. 北京林业大学学报, 2018, 40(1): 1-7. doi: 10.13332/j.1000-1522.20170388
引用本文: 惠文凯, 王益, 陈晓阳. 麻疯树种子含油量近红外光谱定标模型的建立[J]. 北京林业大学学报, 2018, 40(1): 1-7. doi: 10.13332/j.1000-1522.20170388
Hui Wen-kai, Wang Yi, Chen Xiao-yang. Calibration model building for investigating seed oil content of Jatropha curcas using near infrared spectroscopy[J]. Journal of Beijing Forestry University, 2018, 40(1): 1-7. doi: 10.13332/j.1000-1522.20170388
Citation: Hui Wen-kai, Wang Yi, Chen Xiao-yang. Calibration model building for investigating seed oil content of Jatropha curcas using near infrared spectroscopy[J]. Journal of Beijing Forestry University, 2018, 40(1): 1-7. doi: 10.13332/j.1000-1522.20170388
  • 麻疯树(Jatropha curcas),又名小桐子,属大戟科(Euphorbiaceae)麻疯树属落叶灌木或小乔木[1]。我国云贵高原以及华南地区均有栽培。麻疯树喜光,耐贫瘠,可生活在条件恶劣的砾石,沙质和盐渍土壤地区[2]。21世纪初,麻疯树作为一种新的生物燃料作物,已受到很大的关注[3]。麻疯树种子中提炼出的生物柴油在凝固点、硫含量、一氧化碳排放量等方面均优于国内零号柴油,是一种高效能、低污染、安全可靠的能源。麻疯树种子的含油量高(26%~40%)[3],种仁含油率高达60%[4],超过油菜(Brassica napus)和大豆(Glycine max)等常见油料作物,且麻疯树籽油的碘值较低,属半干性油,适合作工业用油[5-6]

    目前,麻疯树油脂的品质分析主要是通过感官检验和一些常规的理化方法如索氏提取法等进行检测[7]。这些方法在测定过程中需要破坏样品种籽,影响了后续的育种工作,尤其是比较珍贵的遗传材料无法在检测后保存备用;并且分析过程复杂,耗时较长。另外,现有方法常使用乙醚等易制毒有机溶剂药品,对周围环境以及实验人员身心健康造成较大危害。诸如上述原因,限制了现有方法在麻疯树选育过程中对种子含油量进行大批量鉴定的工作效率。

    近红外反射光谱检测方法(near infrared reflectance spectroscopy, NIRS)是20世纪80年代后期兴起的一种物理测试技术,其具有相对简单、快速、有效等特点[8-10],被国际农业分析界誉为“具有解决全球农业分析潜力”的检测技术[11]。目前,该技术已广泛应用于玉米(Zea mays)、油菜、大豆等多种农作物的品质分析中[12-15]。Posom等使用NIRS测定了麻疯树种子的水分含量和油提取残渣的热值[16]。Vaknin等使用NIRS预测了麻疯树种仁的蛋白质含量[17]。但国内外关于建立麻疯树种子含油量的近红外光谱定标模型未见报道。

    本研究以新采集的麻疯树种子为材料,利用DA7200二极管阵列近红外光谱成分分析仪,旨在建立麻疯树种子含油量的近红外光谱定标模型,为NIRS技术应用于麻疯树种子含油量的测定提供依据。

    • 供试材料为2014年9月和12月采集来自云南、广西、贵州、四川、海南以及广东省的麻疯树家系种子共计135份,每份样品种子不少于350粒。所有样品随机分为两组,其中125份作为建模样品集,10份作为验证样品集。

    • (1) 植物粉碎机:型号FW135,天津市泰斯特仪器有限公司;(2)索氏提取仪:型号SXT-06,上海洪纪仪器有限公司;(3)二极管阵列近红外光谱成分分析仪:型号DA7200,瑞典波通公司;(4)近红外模型分析软件:The Unscrambler V9.8,瑞典波通公司。

    • 使用DA7200型近红外光谱仪,选取中号样品盘,将样品自然倒入盘内,用直尺刮平表面(约100粒)。为消除样品的不均匀性、减小误差,设定每份样品3次重复,每次重复旋转测定3次,收集125份建模样品的近红外光谱数据。

    • 125份建模样品的近红外光谱数据收集完毕后,用索氏提取法进行含油量化学值的测定[18]。具体方法可参照《GB/T5512—2008粮油检验粮食中粗脂肪含量测定》标准[19]。每份样品重复3次,取算术平均值。将该化学值与对应的近红外光谱数据合并后进行回归分析。

    • 本研究分别采用标准化处理法(normalization)、乘积分散校正法(multiplicative scatter correction,MSC)、标准正态变量转换法(standard normal variable,SNV)、一阶导数(1st-derivative)、二阶导数(2nd-derivative)和平滑处理(savitzky-golay filter)等预处理方法对原光谱数据进行优化,并根据定标模型的预测效果选择出最合适的光谱预处理方法。

    • 首先,根据马氏距离、主因素分析图、光谱残差图及浓度残差图等分析结果剔除特异样品,保留优化后的光谱数据。随后,分别采用偏最小二乘法(partial least squares,PLS)和主成分回归分析法(principal component regression,PCR)对优化后的光谱数据进行分析,建立定标模型。其中,以RC(校正模型相关系数)、RMSEC(校正模型标准偏差)、RCV(交互验证相关系数)、RMSECV(交互验证标准偏差)为衡量模型预测效果优劣的主要参数。相关系数越大,标准偏差越小,表明模型的预测效果越好[10]

    • 选取10份未知含油量的种子样品,分别用索氏提取法和已建立的近红外定标模型测定其种子含油量,进行比较验证。估算两种方法测定值的相关系数和标准偏差,对模型可靠性进行检验。

    • 表 1可知,供试麻疯树样品的含油量范围为25.23%~39.73%,平均值为33.91%±2.64%。125份建模样品种子含油量的中位数为34.31%,变异系数为7.79%,方差为6.97。表明样品的种子含油量基本涵盖了目前麻疯树的主要品种,可满足本研究中近红外光谱分析的要求。

      表 1  125份建模样品种子含油量化学值描述性统计表

      Table 1.  Descriptive statistics of investigated value of seed oil content among 125 samples

      分析项目
      Analysis item
      平均值±标准差
      Mean±SD/%
      最大值
      Max./%
      最小值
      Min./%
      中位数
      Median/%
      变异系数
      Variable coefficient/%
      方差
      Variance
      化学测定值Chemical determination value 33.91±2.64 39.73 25.23 34.31 7.79 6.97
    • 本研究中125份建模样品的近红外吸收光谱如图 1所示,各样品扫描光谱曲线的趋势平滑,无异常光谱。麻疯树种子油脂中的C—H、O—H等含氢基团,在近红外900~1700nm处有较强的吸收峰,恰好涵盖了最具有穿透力的短波近红外区以及信号丰富的长波近红外区的主要部分,因此具有较强的穿透力和丰富的样品信息,可以准确的分析样品含油量,故取该部分波长的光谱作为后续分析的基础数据。

      图  1  125份建模样品的近红外吸收光谱图

      Figure 1.  NIRS of 125 modeling samples

      不同预处理方法的光谱模型参数统计情况见表 2。由表 2可以看出,不采用导数处理的模型1~3,相对于经导数处理的模型4~11,RCRCV值都较低,因此,导数处理为必要步骤。两两比较模型4/5、6/9、7/10、8/11、12/15、13/16、14/17可以看出,一阶导数的RCRCV均较低,因此,二阶导数处理优于一阶导数处理。通过模型6/7/8、9/10/11、12/13/14、15/16/17可知,SNV、MSC、Normalization 3种预处理方法与不同的导数处理结合时,RCRCV差异均较大,因此不同预处理方法与导数处理的联合有助于模型的优化。由模型6/12、7/13、8/14、9/15、10/16、11/17可知,导数处理与SNV、MSC、Normalization结合的先后顺序也会影响模型优化效果,应先进行导数处理后再进行SNV或MSC处理,但Normalization处理应在导数处理之前。

      表 2  不同光谱预处理方法的模型参数

      Table 2.  Model parameters of each pre-treatment method

      模型
      Model
      预处理方法
      Pre-treatment method
      删除点数
      Outlier number
      RC RMSEC RCV RMSECV
      1 SNV 7 0.718 1.392 0.632 1.612
      2 MSC 7 0.733 1.353 0.679 1.501
      3 标准化Normalization 9 0.749 1.325 0.688 1.505
      4 一阶导数1st-derivative 8 0.851 1.013 0.771 1.254
      5 二阶导数2nd-derivative 3 0.857 0.980 0.750 1.310
      6 1st-derivative +SNV 4 0.813 1.139 0.760 1.303
      7 1st-derivative +MSC 7 0.824 1.108 0.769 1.280
      8 1st-derivative +normalization 11 0.783 1.195 0.709 1.404
      9 2nd-derivative +SNV 9 0.910 0.784 0.833 1.076
      10 2nd-derivative +MSC 10 0.904 0.799 0.824 1.086
      11 2nd-derivative +normalization 7 0.818 1.075 0.729 1.328
      12 SNV+1st-derivative 9 0.782 1.237 0.726 1.404
      13 MSC+1st-derivative 9 0.784 1.184 0.730 1.341
      14 Normalization+1st-derivative 9 0.808 1.150 0.729 1.376
      15 SNV+2nd-derivative 9 0.859 0.919 0.767 1.201
      16 MSC+2nd-derivative 10 0.837 0.968 0.740 1.249
      17 Normalization+2nd-derivative 10 0.885 0.860 0.774 1.211
      注:RC为校正模型相关系数;RMSEC为校正模型标准偏差;RCV为交互验证相关系数;RMSECV为交互验证标准偏差;SNV为标准正态变量转换法;MSC为乘积分散校正法。下同。
      Notes: RC, calibration model correlation coefficient; RMSEC, calibration model standard deviation; RCV, cross-validation correlation coefficient; RMSECV, cross-validation standard deviation; SNV, standard normal variable; MSC, multiplicative scatter correction. The same below.

      综合比较,虽然模型5删除的异常点最少(3个),但RCRCV均较低;模型9和模型10的RC值均大于0.90,RCV值均大于0.82,两模型的回归效果都较好,而模型9删除点数少于模型10,因此模型9的预处理方法(二阶导数+SNV)为建立麻疯树种子含油量近红外光谱定标模型的最佳预处理方法,其预处理后的光谱如图 2所示。

      图  2  经二阶导数+SNV处理后的光谱图

      Figure 2.  Line plot of NIRS after 2nd-derivative + SNV pre-treatment

    • 为了更加准确的获得麻疯树种子含油量的近红外定标模型,选择上述预处理方法中模型9(二阶导数+SNV)和模型10(二阶导数+MSC)对光谱进行预处理。所有预处理之前,均采用Savitzky-Golay对光谱进行平滑处理,平滑系数取5,然后分别采用偏最小二乘法(PLS)和主成分分析法(PCR)两种回归方法处理定标模型,比较分析不同的回归方法对于模型的影响。利用RCRMSECRCVRMSECV等4个指标评价模型,选出最佳的回归方法。由表 3可以看出,模型9和模型10中PLS分析的RCRMSECRCVRMSECV均优于PCR。因此,选择PLS方法作为建立麻疯树种子含油量近红外定标模型的最佳回归方法。

      表 3  不同回归方法处理后的模型参数

      Table 3.  Model parameters with varied regression methods

      预处理方法
      Pre-treatment method
      回归方法
      Regression method
      删除点数
      Outlier number
      RC RMSEC RCV RMSECV
      2nd-derivative +SNV PLS 9 0.910 0.784 0.833 1.076
      2nd-derivative +SNV PCR 9 0.677 1.358 0.612 1.495
      2nd-derivative +MSC PLS 10 0.904 0.799 0.824 1.086
      2nd-derivative +MSC PCR 10 0.624 1.410 0.542 1.553
    • 根据上述选定的近红外光谱最佳预处理和回归方法处理光谱数据集后,建立麻疯树种子含油量的近红外光谱定标模型。由图 3可以看出,定标模型含油量范围基本涵盖了麻疯树种子含油量的范围(26%~40%)[3],且具有较高的相关系数,RC达到0.91,定标集交互验证标准误差RMSECV值较小(0.83),可见模型的预测效果比较稳定。

      图  3  NIRS定标模型线性回归图

      Figure 3.  Linear regression plot of the NIRS calibration model

    • 为了验证定标模型的准确性,本研究随机选取10份未知含油量的麻疯树种子样品分别用常规方法和建立的模型测定其含油量值,检验模型的预测能力,结果见表 4。由表 4可知,10份验证样品的近红外光谱定标模型预测值与常规化学测定值极显著相关,且相关系数达0.9556,预测标准偏差为0.6536,说明使用该模型对麻疯树种子样品进行含油量检测的方法是可行的,基本可替代常规化学测定方法。

      表 4  检验样品的化学测定值、模型预测值及相关参数

      Table 4.  Chemical determination values, model predictive values and their relative parameters of test samples

      检测值类型
      Detection value item
      平均值
      Mean/%
      最大值
      Max./%
      最小值
      Min./%
      相关系数
      Correlation coefficient
      预测标准偏差
      Predictive standard deviation
      化学测定值Chemical determination value 35.22 38.25 30.57 0.9556** 0.6536
      预测值Predicted value 35.51 37.56 31.04
      注:**表示相关性极显著,P<0.01。Notes: ** means the very significant level, P<0.01.
    • 在近红外光谱(NIRS)模型初建时,标准样品集(校正集)的选择及其数量会直接影响到预测的准确度。因此利用NIRS进行定量建模时,首先要考虑样品集代表性的问题[20]。一般情况,建立NIRS定标模型的样品量越大,待测样品的群体分布规律越完整,所建模型则越稳定[21],然而,样品数量过多则容易造成样品信息的重叠,引入较多的干扰因素,且增加了分析筛选的工作量[22]。本研究共选取125份麻疯树种子作为标准样品集,样品的种子含油量化学值覆盖了当前麻疯树的主要品种[23],基本满足近红外光谱分析的要求。但是,由于本研究中样品含油量呈现“正态”分布,因此本研究所得近红外定标模型对于过低(高)含油量样品的预测,具有一定的局限性。为了进一步提高近红外定标模型检测结果的可靠性,后期仍然需要进一步扩大标准样品集。

      光谱预处理是提高校正模型稳定性和适应性的必要措施[24]。利用NIRS对样品进行分析时,样品物理性质的差异将导致近红外光谱基线和斜率的偏移,光的分散度同时取决于颗粒度和波长[25]。因此为减小不同波长下光谱分散度对检测结果的影响,解决光谱吸光度与样品性状间的吸收非线性问题[26],本研究分别采用不同的光谱预处理方法对光谱数据进行优化。其中,标准化处理法和乘积分散校正法可用于消除多重光谱偏差;标准正态变量转换法可以有效降低无关光谱以利于分析信号的解析;一阶导数和二阶导数可以最大程度地降低光谱峰的偏移和漂移[27]。本研究中模型9的光谱经平滑处理后,再经过二阶导数处理降低光谱峰的偏移和漂移,提高光谱的精细度,最后利用SNV法消除散射影响后得到的预处理效果最佳。随后,选择出最佳的回归方法为PLS(偏最小二乘法),从而建立较为精确的麻疯树种子含油量近红外光谱定标模型。

      近红外光谱模型对于品质育种工作中性状的大批量鉴定以及工业化应用具有非常重要的价值,定标模型的相关系数和标准偏差是评价其优劣的重要指标[28]。高建芹等利用近红外技术测定油菜籽的油酸、芥酸和含油量时,外部检验结果的近红外测定值与化学测定值之间的相关系数分别为0.99、0.99和0.97,认为该定标模型的预测效果较好,可在实际中运用[29]。李君霞等运用近红外光谱分析法建立水稻蛋白质定标模型时,近红外测定值和化学测定值之间相关系数达0.9886,相对标准偏差为0.0210,认为该模型预测的结果具有较高的可靠性[30]。张学锋等运用新型国产化分析仪SupNIR-2700对菜籽和菜粕进行监测分析,发现菜籽和菜粕的近红外校正模型相关系数在0.90以上,检测结果与国际参考方法相关性好,准确度高,可满足油脂企业对菜籽和菜粕产品的质量控制要求[31]。本研究中,定标模型相关系数达到0.91,定标集交互验证标准误差RMSECV值较小(0.83)。用10份验证样品对所建模型进行检验,其预测值与常规化学测定值之间的相关系数为0.9556,预测标准偏差为0.6536,说明使用该模型可以实现对麻疯树种子含油量的检测,基本可替代常规化学测定方法。

      本研究利用瑞典波通DA7200型近红外光谱成分分析仪采集了125份麻疯树种子样品的光谱数据,通过样品化学值测定、光谱数据预处理以及回归统计方法建立了麻疯树含油量的近红外光谱模型,并利用10份未知含油量的种子样品对模型的准确性进行了检验,最终确立了与常规化学测定值的相关系数达0.9556,预测标准偏差为0.6536的麻疯树种子含油量定标模型。该方法克服了以往常规化学方法测定含油量速度慢、耗时长等问题,为NIRS技术广泛应用于麻疯树种子含油量的测定提供依据,并为选育高含油量的麻疯树优良材料提供快速鉴定的技术参考。

参考文献 (31)

目录

    /

    返回文章
    返回