刘征又看着下面的题目,不禁说道:“医学、通信,团队没有相关专业的不好做,另外一道表面上是气象预测题,实质上也是大数据,还有就是最后一道,应该就是纯大数据题。”
“你们觉得这两道大数据题哪个好一些?”
程旭直接说道:“这两题的优缺点都很明显。大数据题:好处是好着手做,肯定能做出结果来,坏处是做的人多。最后结果也表明,选这题的人是最多的。气象题好处是有一定专业门槛,能让很多人望而却步,但门槛又没那么高,如果我们能克服表面的专业知识,回归本质,会比大数据题更容易出彩。坏处是,我们不一定能克服这个门槛。”
林书同意程旭的看法,在他看来也觉得气象题目会更容易出彩。
气象题目E题如下:
探索大雾演化规律,预测大雾变化趋势
为了估计不同大雾情况下对应的能见度以及预测大雾的消散,请回答以下问题:
一、众所周知,雾与近地面的气象因素有关。建立模型描述能见度与地面气象观测(温度、湿度和风速等)之间的关系,并针对题目所提供的数据(机场AMOS观测.zip)导出具体的关系式……
“要不就选气象题目?”
林书不禁说道:“这个的确是很容易出彩。”
虽然说柿子要挑软的捏,但是在数学建模竞赛里面,太简单的题目选择的学生也多,也不容易出彩。
如果说是战斗,那自然是要根据自己的实力来挑强者,这样完成任务打败强者获得的经验值可能也会很多,当然也不能没有脑子地挑选强者,不然很可能就是自寻死路。
“那它第一问,你们怎么看?”
林书直接回答道:“第一问从技术方面来说打破了传统的建模思维:将具体表达式展示出来。传统的机器学习和神经网络之类的算法,是一个黑盒子,只能得出笔记之间的联系,却无法显示变量作用效果的大小,这也是不好理解机器学习所得出的结果的原因。我觉得第一问解决方法分为基础和高级两种方法。基础的方法:多项式回归、岭回归、逐步回归;高级方法:可解释的机器学习方法中的“RuleFit”,我记得《可解释的机器学习》中的4.6节有提到这一个方法,这样的高级方法绝对在评委中眼前一亮……”
没有人说话。
林书还准备说什么,没有听见身旁刘征和程旭的声正疑惑,一转头就看见刘征和程旭都睁大了眼睛望着林书,那眼神中带着一丝惊讶。
《可解释的机器学习》中的4.6节?
刘征和程旭相视一眼,两人脑子里的问题应该是一样的问号。
林书眉头微皱,觉得刘征和程旭的眼神有些奇怪,目光又转向气象题目的第二问,说道:“而且,第二问的目的是让我们根据视频能够分析出能见度的大小,那么我们便可以通过提取视频中的特征信息图像识别,我研一第一学期的论文有涉及到图像识别这一方面,图片中雾的变化对应于RGB的变化,通过图像识别之后,变会成为对应色调上的RGB值,我们应该可以参照《Python数据分析与挖掘实战》这本书的第九章内容……”
程旭望着林书,有些不确定问道:“你怎么记得这么清楚?”
林书眉头一挑,觉得这个问题有些奇怪。
“就记得啊!”
“……”
简单随意的一句话,让刘征和程旭哑口无言。
团战开始,刘征和程旭瞬间明白自己身旁立着一只巨大的腿。