网站首页 > 论文范文> 文章内容

符利勇:林业统计领域的后起之秀

※发布时间:2018-2-6 18:52:57   ※发布作者:habao   ※出自何处: 

  33岁的符利勇是中科院院士唐守正手把手带出来的博士生,也是目前和唐先生一样耐得住寂寞、受得了清贫的一名。他身上闪耀的,除了师出名门的,还有令人敬佩的科研素养。

  符利勇自幼聪明好学,尤喜数学。他本科就读于山西农业大学林学专业,当年同学们最头疼的高等数学,他学起来却很轻松。2007年,符利勇以全专业数学最高分的考研成绩被南京林业大学理学院原副院长刘应安教授纳入门下。3年的硕士课程他只用了两年就毕业了。2009年,符利勇考上中国林科院森林经理学科的博士,正式成为唐守正先生的。

  唐先生就是数学博士,他用数学方决了一个个林业难题,极大地推动了中国森林经理学科和林业统计学科发展。唐先生工作极其严谨,选人用人也毫不马虎。成为他的学生不易,做好他的学生更不易。但回顾这些年的历练,符利勇满满的都是感激。

  符利勇至今记得,8年前,他第一次战战兢兢地去找导师唐先生的情景。“我去问导师自己的研究方向是什么。唐老师说,那你就做非线性混合效应模型吧。其实我不知道什么线性混合模型。第一次见院士,很紧张,他说什么我就点头。回去之后,我在百度上一搜,网上压根就没有这几个字。”后来,唐先生给符利勇推荐了几本英文教材和英文文献,里面全是公式,基本都是关于线性效应模型的内容。

  符利勇后来得知,林业上的很多问题需要用线性混合效应模型或非线性混合效应模型来解决。大约10年前,唐院士曾让女博士李永慈(现为林业大学理学院副教授)做过线性混合效应模型。李永慈为此熬了3年,所幸后来还是做出来了。李永慈博士毕业后,唐老师始终没能觅到合适的人做非线年符利勇的出现。

  领到任务的符利勇如泰山压顶。当时,中国林科院下载SCI文献还没有现在这么便捷,几乎每个周末,符利勇都要去国家图书馆下载文献。“当时一看,哇,感觉我的博士论文要做纯数学理论了。后来,我的博士论文的确跟林业没一点关系。”

  据符利勇介绍,当时全世界只有两个主流统计软件解决了非线性混合效应模型,一个是SAS,一个是S-Plus,但这两个软件的核心算法都不对外公布,所以他只能自己一步步推导。

  “推导的过程实在太痛苦了。我查阅了很多书,补习了很多统计方面的理论知识和运筹学知识。我专门跑到中科院请教优化算法专家,南京林业大学的硕导团队也全力支持我。在这里,特别值得感谢的,就是李永慈老师。有事没事,我就去北林找她。对我全力支持,跟我一起读文献,一起探讨。”符利勇说,每一次推导完优化算法,都要用程序来实现,动不动就几万行代码,敲键盘敲到手指头长茧。

  点击“确定”的那一刻,是符利勇心情最紧张的时刻。同样的例子,同样的模型,用SAS算一遍,用S-plus算一遍,再用自己编程的算法算一遍,结果必须完全一致才算成功。如果算出来的结果跟SAS和S-plus不一样,就很失望,但是这种失望符利勇经历了无数次,以至于后来都了。

  “后来一篇文献彻底改变了我。哈佛大学一个非常厉害的统计学家,发表了一篇线性混合效应模型参数估计方法的文章,文章讨论部分说,他的方法很可能也适用于非线性混合效应模型。我一字不落地把这篇文章吃透,把他的算法一步一步推导出来。然后,根据他的思,我把非线性混合效应模型通过一阶泰勒展开,近似于线性混合效应模型处理。结果果然跟SAS的一样。那时真是太兴奋了。我当天就请全办公室的人吃饭。积压十年的难题终于解决了,唐老师比我更兴奋。”符利勇清楚地记得当时的情景。

  算法虽然解决了,但应用研究才是终极目标,一堆林业难题等着这把“钥匙”去解开呢,而且,要把这一方法推广应用,还需要精益求精,并用程序来实现。

  师徒二人像“打了鸡血”一般。那一年,腊月二十九,符利勇才坐上回家的火车。年三十晚上,俩人还在电线月,符利勇博士毕业后顺利地留在了唐先生课题组工作,师徒二人继续并肩作战。

  “我读博士期间一直在搞算法,开发软件。工作第一年,我的工作就是进一步围绕非线性混合效应模型做深入研究和总结。毕业后,我在《计算统计数据分析》上发表了一篇文章,提出了EM算法,解决了SAS和S-Plus计算嵌套非线性混合效应模型慢且不太的问题。这篇文章当月的下载关注量,包括现在的下载关注量,在期刊排名中都是很靠前的。”

  据符利勇介绍,他们提出的这个非线性混合效应模型表达式不仅包含了已有单水平和嵌套多水平非线性混合效应模型,还包含了考虑交互作用在内的其他多种非线性混合效应模型类型。迄今为止,该模型是林业统计乃至整个生物统计领域最为完善的非线性混合效应模型表达式。在参数估计方面,他提出了线次规划算法。该算法已在ForStat 2.2(ForStat 软件是以唐守正院士为首的科研团队,经过10多年时间,研究和开发的具有国际水平和林业专业特色的通用统计和数据分析软件,符利勇为该软件的核心负责人)正式版本上创建了“非线性混合模型”模块。

  迄今为止,这一研究仍然处于国际领先地位。该程序被推广到国内80多所高等院校和科研院所使用,该极大地带动了国内外的林业统计应用,越来越多的研究者开始用非线性混合效应模型做研究。与此同时,符利勇界林业统计领域小有名气。国内外大多学术期刊接收的非线性混合效应模型文章,都请师徒二人审稿。

  工作后的符利勇仍像学生时代一样刻苦,很多时候,他都工作到深夜才离开办公室。能做唐先生的,符利勇深感幸运。他说:“这些年跟着唐老师,真是学到了实实在在的本领。他知道把林业问题为哪些数学问题,然后指导我们用哪些优化算法,去解决林业问题。”

  做林业统计研究,免不了出外业采集数据。符利勇说:“没有数据根本就没办法做模型,所以我把数据看得很重,而且只有亲自参与调查的数据才敢用起来。尤其做林业的,天天坐在办公室里搞模型,不知道林子里的情况,肯定是不行的。野外调查时,我们也可能会发现新的问题。”

  有一年夏天,符利勇等人到延边的汪清林业局做调查。晚上个人睡一个炕,一星期不能洗澡,等调查结束时,符利勇才发现,两个豆大的蜱虫已经“长”在身上了,皮肤发炎红肿了,后来不得不到医院做手术拿掉。近期,他带着学生去山西五台山进行外业调查,晚上8点,十几个人才打着手电筒离开采样点,等回到驻地已经10点多了。

  成长是对最好的回馈。2012年工作当年,符利勇申请到了一个国家自然基金的青年项目。2014年9月,他凭优异的成绩当选第四届“中国林科院杰出青年”,11月破格评上副研究员。2015年,符利勇又申请到一个国家自然基金的面上项目。2016年,符利勇入选中国科协的“青年人才托举工程”。2017年11月,符利勇获第十四届中国林业青年科技。迄今为止,围绕林业统计模型方向,符利勇表学术论文50余篇,其中以第一/通讯作者发表SCI收录论文20篇,EI论文1篇,单篇最高影响因子8.4,获中国梁希青年论文一等1次、二等2次。

  尽管未来将会有更多的科研重任和繁琐的工作压在他的肩膀上,但符利勇仍然用平静的心去面对。“干科研一定不能心急,必须耐得寂寞、脚踏实地、一步一个脚印地追求真理,并且需要有奉献和团队协作。”符利勇说。