你好 👋

我是朔夜观星(wzy),一个略懂Network Engineering和Artificial Intelligence的一名在校大学生。
欢迎来到我的个人博客

project1基于深度学习的交通碰撞异常预测

深度学习替换为具体模型名称如:自适应lstm/注意力lstm/后处理lstm 背景与任务 任务背景: 多传感器技术广泛应用于医疗健康(HC)、人体活动识别(HAR)、工业控制系统(ICS) 等领域,产生大量多变量时间序列数据(即多个传感器同时采集的、随时间变化的连续数据,如医疗中的脑电信号、活动识别中的加速度计数据)。随着物联网(IoT)、可穿戴设备、工业物联网(IIoT)的发展,多传感器技术已成为采集物理世界数据的核心手段,广泛应用于三大关键领域,且每个领域都存在强烈的异常检测需求。 机动车碰撞是 15-29 岁人群的首要死因(WHO 统计),全球每年超 5000 万人因碰撞受伤,部分导致残疾。准确预测交通异常能提前预警,降低事故风险,提升道路安全。 背景要联想到: 1.做这个实验的基础条件(数据集、硬件)是否满足 2.做这个是实验的必要性,有什么作用/好处 任务目标: 在有监督场景(训练数据有标注),精准识别多传感器时间序列中的异常,在这里也就是提升交通碰撞预测的准确性(AUC-PR、AUC-ROC、F1 分数、准确率)。 有监督的即训练数据有标注 无监督的即训练数据没有标注,异常检测大部分为这种(因为有监督代价太大了,得做数据标记 ) 异常检测无监督的时候检测的是离群点和其他特征不太相符的点等 还有半监督,及一半数据是标注好的,让模型根据这一半去猜另一半 挑战 传统模型的不足之处: 仅关注静态特征(如 POI、历史流量),忽略事件间的动态演化交互; 未有效处理数据不平衡,难以捕捉稀有异常事件的内在模式;(最难的一点) 空间依赖建模单一,未考虑多视角(功能相似、碰撞历史、交通状况)的网格交互; 动态特征演化易出现「过平滑」,导致正常与异常事件的特征差异被掩盖。 不足之处得面向挑战来说——说一个模型不行,你为什么要用这个模型时: 1. 要说原来的模型相对于你的模型在设计上有什么不同; 2. 还要落实到他们真正的挑战上/处理的时候为什么不行。 任务的共性挑战: 数据不平衡:异常事件在时空上极度稀疏,模型易过度拟合正常事件,难以学习异常模式; 静态 - 动态特征的联合建模:静态特征(如 POI)是固定的,动态特征(如事件交互)是时变的,二者的依赖关系复杂,需设计灵活的融合机制; 多视角空间依赖捕捉:网格(也就是某个地区)间的影响不仅来自地理邻近,还来自功能相似、碰撞历史关联等,单一空间图无法全面覆盖;(另类的数据融合问题) 动态演化中的过平滑:动态特征随时间更新时,易因正常事件的累积导致异常与正常事件的特征趋同,降低模型区分度; 训练效率与时间依赖的平衡:动态演化具有强时间依赖,传统批处理(并行)会破坏时序关系,而单样本训练效率极低。 区分过平滑和过拟合 过平滑是什么? 过平滑(over-smoothing): 在 GNN 中,随着层数加深、反复邻居聚合(本质上像不断做平均),不同节点的表示会越来越相似,最终难以区分。 过拟合是什么? 过拟合: 模型在训练数据上学得过于贴合(把噪声和偶然性也当成规律),导致训练效果很好但对未见数据泛化能力差。 过平滑 vs 过拟合(最简对比) 过平滑: 表示被“抹平”了,节点之间区分度下降。 现象:训练集和测试集都可能表现差(因为表达能力丢了)。 过拟合: 模型把训练集噪声也记住了。 现象:训练好、测试差。 过平滑更多的还是指一些尖锐点因为学太多了,被模糊掉了。 层数过多,那就是过拟合了;趋于一致一般就是学太多学太泛了,没有目的性;这也是后来为啥这么喜欢用注意力机制,因为效果确实好。 所以过平滑更像“信息被平均掉,学不出差异,该学的没学到”;过拟合是“学了不该学的细节,不该学的也学了”。 模型解析 任务组成: ...

2026-02-07 · 3 min · wzy朔夜观星

欢迎来到我的博客空间

这是我用Hugo+PaperMod主题创作的的第一篇博客。

2026-01-27 · 1 min · wzy朔夜观星