2018年中国研究生数学建模竞赛C题 二等奖 赛题论文
2018年中国研究生数学建模竞赛C题 二等奖 赛题论文
2018年中国研究生数学建模竞赛C题
对恐怖袭击事件记录数据的量化分析
恐怖袭击是指极端分子或组织人为制造的、针对但不仅限于平民及民用设施的、不符合国际道义的攻击行为,它不仅具有极大的杀伤性与破坏力,能直接造成巨大的人员伤亡和财产损失,而且还给人们带来巨大的心理压力,造成社会一定程度的动荡不安,妨碍正常的工作与生活秩序,进而极大地阻碍经济的发展。
恐怖主义是人类的共同威胁,打击恐怖主义是每个国家应该承担的责任。对恐怖袭击事件相关数据的深入分析有助于加深人们对恐怖主义的认识,为反恐防恐提供有价值的信息支持。
附件1选取了某组织搜集整理的全球恐怖主义数据库(GTD)中1998-2017年世界上发生的恐怖袭击事件的记录(附件2是有关变量的说明,节译自数据库说明文档,原文可以在http://www.start.umd.edu/gtd/中下载,由于该文档较长,附件3提供了一个内容摘要),需要完成的任务如下:
任务1 依据危害性对恐怖袭击事件分级
对灾难性事件比如地震、交通事故、气象灾害等等进行分级是社会管理中的重要工作。通常的分级一般采用主观方法,由权威组织或部门选择若干个主要指标,强制规定分级标准,如我国《道路交通事故处理办法》第六条规定的交通事故等级划分标准,主要按照人员伤亡和经济损失程度划分。
但恐怖袭击事件的危害性不仅取决于人员伤亡和经济损失这两个方面,还与发生的时机、地域、针对的对象等等诸多因素有关,因而采用上述分级方法难以形成统一标准。请你们依据附件1以及其它有关信息,结合现代信息处理技术,借助数学建模方法建立基于数据分析的量化分级模型,将附件1给出的事件按危害程度从高到低分为一至五级,列出近二十年来危害程度最高的十大恐怖袭击事件,并给出表1中事件的分级。
表1 典型事件危害级别
事件编号 |
危害级别 |
200108110012 |
|
200511180002 |
|
200901170021 |
|
201402110015 |
|
201405010071 |
|
201411070002 |
|
201412160041 |
|
201508010015 |
|
201705080012 |
|
任务2 依据事件特征发现恐怖袭击事件制造者
附件1中有多起恐怖袭击事件尚未确定作案者。如果将可能是同一个恐怖组织或个人在不同时间、不同地点多次作案的若干案件串联起来统一组织侦査,有助于提高破案效率,有利于尽早发现新生或者隐藏的恐怖分子。请你们针对在2015、2016年度发生的、尚未有组织或个人宣称负责的恐怖袭击事件,运用数学建模方法寻找上述可能性,即将可能是同一个恐怖组织或个人在不同时间、不同地点多次作案的若干案件归为一类,对应的未知作案组织或个人标记不同的代号,并按该组织或个人的危害性从大到小选出其中的前5个,记为1号-5号。再对表2列出的恐袭事件,按嫌疑程度对5个嫌疑人排序,并将结果填入下表(表中样例的意思是:对事件编号为XX的事件,3号的嫌疑最大,其次是4号,最后是5号),如果认为某嫌疑人关系不大,也可以保留空格。
表2 恐怖分子关于典型事件的嫌疑度
|
1号嫌疑人 |
2号嫌疑人 |
3号嫌疑人 |
4号嫌疑人 |
5号嫌疑人 |
样例XX |
4 |
3 |
1 |
2 |
5 |
201701090031 |
|
|
|
|
|
201702210037 |
|
|
|
|
|
201703120023 |
|
|
|
|
|
201705050009 |
|
|
|
|
|
201705050010 |
|
|
|
|
|
201707010028 |
|
|
|
|
|
201707020006 |
|
|
|
|
|
201708110018 |
|
|
|
|
|
201711010006 |
|
|
|
|
|
201712010003 |
|
|
|
|
|
任务3 对未来反恐态势的分析
对未来反恐态势的分析评估有助于提高反恐斗争的针对性和效率。请你们依据附件1并结合因特网上的有关信息,建立适当的数学模型,研究近三年来恐怖袭击事件发生的主要原因、时空特性、蔓延特性、级别分布等规律,进而分析研判下一年全球或某些重点地区的反恐态势,用图/表给出你们的研究结果,提出你们对反恐斗争的见解和建议。
任务4 数据的进一步利用
你们认为通过数学建模还可以发挥附件1数据的哪些作用?给出你们的模型和方法。
特别提醒:本题作为数学建模竞赛题,特别强调数学的应用和建模过程的严谨性、创新性,结论应有充分、可靠的数据支撑。请参赛者务必正确理解题目需求,不要写成议论文。
解题思路
第一问采用层次分析法(比较low 当时是最后做的第一问 时间有些紧 只好硬着头皮做了)
第二问采用聚类思想,选取对事件影响大的因素,用于聚类,具体基于K均值聚类算法提出多层次深度聚类(参考文献:基于和声搜索算法优化支持向量机的突发暴恐事件分级研究 )
注:当时是查阅参考文献来选取的因素,比赛结束后,跟别人讨论深受启发,其实可以根据信息增益来选取影响因素的top-m,这样更有说服力,而且效果可能更好
第三问是本论文的最大创新之处,基于历史数据,构造事件的时间序列,最后根据时间序列挖掘中的ARIMA模型来预测未来事件发生情况 参考:https://www.cnblogs.com/xinglichao/p/9620490.html
影响因素采用针对特定事件进行具体特定分析,时间有点久了,有些具体的不太记得啦(^ _ ^)
第四问属于开放性试题,当时我想到的模型是采用图模型,构建事件图结构,基于度等因素来挖掘信息(绘制图结构:https://www.cnblogs.com/xinglichao/p/9695510.html)
论文以及处理过程的数据还有代码都在我的git上:https://github.com/xinglicha0/Mathematical-Modeling