欢迎访问北单实体店微信:200833335

足球赛事

您现在的位置是: 主页 > 北单体育资讯 > 篮球资讯

篮球资讯

泰迪杯数据挖掘竞赛一等奖获奖经验分享与未来专栏更新计划

发布时间:2025-03-25 23:01 篮球资讯 作者:
文章浏览阅读562次。博主分享了参加泰迪杯数据挖掘竞赛的经历,获得了一等奖。他们团队对驾驶行为数据进行了深入分析,包括数据预处理、地图匹配、车道分割、数据离散化等步骤...

我已经更新了(*^^*)。在过去的两个月中,我一直在寻找书籍,并参加了211个夏令营,所以我没有更新专栏。我内心感到内gui(╥﹏╥)o,但我最近找到了书,所以我可以放心地更新专栏(^_-)

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

泰迪杯数据挖掘比赛的结果于6月发布。我很幸运能赢得第一堂课并赢得公司命名奖(6,000个奖金)。尽管它不如国际AI顶级比赛好,但仍然值得参加这一奖金:

与数字模型不同的是,数据挖掘竞赛(例如泰迪杯)通常持续更长的时间(3.16-4.26),时间较短(3天)。让我们首先谈谈我们团队的安排:

当我们的团队仅宣布了一些C问题和数据时,我们的团队基本上使用业余时间 +周末的问题来做。发布所有数据后,我们的团队基本上每天从8.00到10.30 PM一起进行问题。当然,我们必须上课。尤其是在上周,我每天晚上11点以后就离开了。我真的很累,但是我们从大学借了一家咖啡馆。测试的整体气氛相当不错。图片如下:

拍手的手被碎了,实际上真的很好。

转到主题:

问题C是一个数据分析问题,它也有一些数学建模思想:

由于有足够的时间,我们在早期阶段检查了很多信息,并阅读了大量有关道路交通驾驶的文件,包括:

这些是主要参考,基于这些参考,我们基本上了解如何使用驾驶行为数据进行驾驶行为分析。

数据挖掘的第一步肯定是数据预处理,我们的数据预处理分为5个步骤:

1。漂移轨迹降解

比较图表:

2。匹配算法的地图

使用基于几何关系的地图匹配算法,该组使用的地图数据库是基金会(OSMF)授权的开源图项目。 ©贡献者

一辆汽车有5场比赛:

3。划分双向车道

标记并划分车辆的双向驾驶:

高速公路上的两个方向都在驾驶汽车

,但似乎以后阶段使用双向车道并不是特别有意义。

4。离散的道路数据:

特定的道路数据被离散并分为特定级别。例如,天气数据分为四个级别:0、1、2和3。不同的级别代表天气的苛刻性。

2018年8月11日的气象学位图

5。划分微型旅行

以汽车为例,本文根据上述定义将其分为12个微型旅行。下图显示了汽车微型旅行的初始和最后时间。

问题1:

提取和分析相关参数。这很简单。找到问题中提到的不良驾驶行为标准,并通过原始数据直接提取它们。值得一提的是如何细分线。我们团队采用的方法是根据时间间隔和距离间隔对其进行分配。如果相应的阈值超过相应的阈值,则将其视为不同的段:

我不会介绍如何做,让我们展示运输路线的结果。我们在此处使用91位地图助手作为地图可视化工具。当然,您还可以使用其他实际上相似的其他元来,例如BDP, Maps等。这只是一个易于使用的问题:

行程线示例

问题2:

大学生数据挖掘比赛_大学生数据挖掘比赛都有哪些_全国大学生数据挖掘挑战赛

我们首先执行了驾驶安全评估模型指数提取:

驾驶安全评估模型的指标确定为6个不良驾驶行为的第一级指标,在下面是相应的累积时间和总数。评估和评分累计持续时间和次数。在这里,我们以紧急加速为例:

不良驾驶行为挖掘算法:

根据东方师范大学等学者的研究,以紧急加速/紧急减速识别算法为例,本文将紧急加速和紧急减速状况定义为:

此外,当两个单个急性加速或急性减速行为之间的时间间隔小于连续的急性加速行为合并时间阈值或连续的急性减速行为合并时间阈值时,合成被视为紧急加速或紧急降速行为,以及连续紧急加速行为或紧急速度加速或紧急加速行为的数量。

以某种汽车为例,可以看出,其快速减速的累积时间是随机分布的,并且快速减速时间大于快速加速时间。这可能是由于避开其他车辆的车辆造成的,这与实际情况更一致。

对于驾驶安全评估模型,本文提出了一个评估模型,该模型结合了主成分分析和层次分析方法:

以车辆的每次微型行程为例,使用上述模型结合了两种评估方法,获得了最终的评估结果,并最终获得了索引重量雷达图,如下图所示:

基于上述评估模型,获得了与每辆车辆的每次微旅行相对应的评估结果:

驾驶安全评估结果

基于上述评估模型,获得了与450辆汽车相对应的评估结果:

问题3:

我们已经建立了一个用于不良驾驶的全面评估指数系统:

当然,我们还必须考虑诸如道路环境之类的因素,以重新定义相应的不良驾驶行为的采矿算法阈值。并介绍新的指标,在​​这里我们将详细说明侧面滑动的说明:一个例子:

侧面滑梯

最后,我们建议基于改进的K-均值聚类和神经网络的驾驶行为分级评估模型

具体方法如下(很难在Zhihu中编写公式):

改进的K-均值聚类是过滤典型的样本:

其中,黑色是离群值,我们被我们滤除了。

最后,使用一个简单的BP神经网络将样本结果正常化为训练样本,训练BP网络,并使用训练有素的BP神经网络对驾驶行为评估进行分类:

当然,如果我们这样做,我们实际上将完成,但是我们绝对不会获得奖金。因此,我们增加了一些添加的内容,并基于驾驶行为构建了数据分析平台:

总体平台框架路线:

基于大数据分析的驾驶行为识别和评估平台是基于B/S模式的数据分析平台。该系统采用技术,主要采用MVC前端和后端分离想法,后端开发语言是C#,该语言分别构建了演示层,业务逻辑层和数据访问层,以减少系统耦合并实现“高凝聚力和低耦合”的想法。前端开发主要使用HTML,CSS和其他技术,而前端框架主要采用Easy-UI。该平台中使用的开发工具是版本,使用的数据库是SQL 2008。

这是平台的一些屏幕截图:

结束,衷心感谢我的队友和教练,爱你!呢呢

广告位