0x00 preface
比赛前临时学了一点东西,是时候在比赛的时候展示自学能力了。
0x01 day1
不知道为什么数模协会实验室开放的时间是下午的一点。由于是早上八点公布试题,于是妥妥的上午得自己找地方讨论问题。经过一番周折,终于借到了图书馆的研讨室(仿佛开启了学校的又一项新功能)。拿到题目,分别是如下的内容:
- A.全球气候与飓风的问题
- B.邮件的特征识别问题
- C.全球人口贩卖问题,包括识别潜在人群,推测可能发生的地点,以及切断贩卖的网络。
一开始就把B题剔除了,因为就是一个赤裸裸的是机器学习的算法,有训练的样本。然而机器学习真的是一窍不通啊,更不用谈算法的设计了。
于是目标选题范围确定A,C.一开始个人更倾向于选择C题,因为第一问分类出潜在的可能被贩卖的人群,这是有数据的,感觉可以使用分类的方法来完成。然后第三问就是一个图论的模型,我们只要切断关键的节点就可以了。虽然没有数据,但是我们可以进行不同人群的分类,构建社会的关系网络,从而得出相应的结论。然而第二问的数据收集并且进行地点判断,简直无从思考。虽然网上已经有一些交易场所的统计了,比如性交易之类的地点等等,但是好像就是没有原始的数据分析。
于是,稳妥起见,就选择了A题。上午初步选定题目之后,于是下午就到数模实验室收集相应的数据,准备进行定量的分析。
晚上也是在不断的收集相关的论文,试图建立初步的分析的模型。进展可能有一点慢?
0x02 day2
这一天主要完成了问题一的求解。因为看了一篇文章BP神经网络完成样本的训练,并且进行相应的训练。训练的本质就是调节参数使方差最小,于是我就和队友们讨论了一下我的思路,建立相应的方差模型,从而进行相应的最佳周期的求解。晚上我又试了一下《数学建模算法》里面另外的一个方差模型,效果不是很好,组间的差异较大。
0x03 day3
本来是应该应该进行第二问的求解。但是论文小姐姐跟我讲了一个时间序列的模型,于是学习了一波理论,感觉不是很懂,能进行基本的时间序列的预测。
这一天建模小姐姐完成了第二问的模型的建立(主成分分析法)和第三问的定性模型的建立,而我则是全程划水的状态。。。晚上的时候研究Matlab工具性的时候无意发现了一个衡量拟合程度的参数,妥妥的将其作为定量化分析的模型。然而曲线有三种不同的趋势状态,完全没有规律可言。。。于是就要发挥我们强大的分析能力来找一波规律了。嗯就是这么简单粗暴。(逃
晚上回去的时候,我无意间发现了模型二的一个漏洞,需要将乘法的衡量标准改为加法的衡量标准,(虽然没有什么依据qaq)
0x04 day4
早上和队友们讨论了一下我发现的问题,感觉有点破坏完成论文的节奏,乱了一点阵脚。我在下午两点的时候,才完成相关的画图的修改和模型的求解。两位队友都很体贴,让我闲着,然后我就真的闲了两个小时左右,之后帮着翻译了一点文章。
然后学校通知十点左右锁实验室,这是最坑的。
十点到了,我们队还是没有完成论文。由于没有我和建模小姐姐的事,于是论文小姐姐决定回寝室肝一波~
本来想着做数模竟然不用熬夜简直美滋滋,等待论文小姐姐的终稿,最后一起来审一遍稿。然而,由于熄灯制论文小姐姐的电脑后期没电了,没电了…
自告奋勇,于是强行肝起了论文的排版工作。
由于英文翻译已经完成了,最终要使排版美观。不得不承认,手动生成目录简直是累趴,因为排版页面是在不断的变化的。
最后肝到凌晨四点左右交了论文。
交完论文我就直接飞到床上了,睡到了早上的八点。
0x05 day5
好心的室友八点见我还没有起床,就来叫我起床,还给了我三个肉松饼做早餐,简直感动。昨晚这么迟睡觉一定打扰到他们了吧,惭愧无比。
于是匆匆的就起床了,去上课。虽然四天的高强度的思考和只睡了四个小时左右,但是上课的时候仅仅感觉身体有一点虚弱,头有一点晕,但是并不困什么的。
下午就一直睡觉睡到晚上,接着就去上选修了。
0x06 Conclusion
感觉这一次做题的节奏有一点缓慢,导致最后一天论文排版没有进行精细的布置。
做完比赛,感觉还是应该总结一下自己的不足:
- 数据的收集的能力不足,感觉要提高一下数据的收集能力什么的,比如运用网络爬虫进行高效的数据收集。
- 数学建模的理论知识不足,感觉有的问题的求解是在生搬硬套。
- 学习更多的绘图技巧。
最后
相对于ACM的精确化的过程来讲,数模更多的是在论文的求解和完成情况,考察一个队伍的短期的学习能力,虽然学习的东西不一定正确,而想看懂高端的理论知识就需要平时的各种知识的积累了。感谢两位小姐姐和我一起完成了这样的一篇论文,不论结果,收获永远是潜移默化的。
2017年12月4日23:56:37