大家读完觉得有帮助记得关注和点赞!!!
摘要
消费级物联网(Consumer IoT)设备的快速增长,在为生活带来便利的同时,也使得系统在面对 AI 赋能的网络威胁 时,对可信赖异常检测提出了前所未有的挑战——要求具备实时性、隐私保护与可扩展的防御机制。传统集中式策略存在关键瓶颈:通信开销大、单点故障风险高,且在处理分布式消费级数据时带来隐私泄露隐患。
本文提出 SwarmSense-DNN:一种新型去中心化神经框架,借助群体智能(swarm intelligence)在分布式 IoT 环境中实现安全、协作式异常检测。该框架将自主节点与深度神经网络(DNN)融合,形成一个自组织防御系统:可在无集中协调的情况下检测不断演化的异常;并采用层次化联邦学习 + 图神经网络(GNN)+ 注意力机制来同时刻画局部与全局异常行为,同时确保数据隐私。
广泛实验表明,SwarmSense-DNN 在五个基准数据集上取得 95.44% 平均检测准确率,同时将通信开销降低 67%;通过差分隐私保障获得对对抗性威胁的稳健韧性,并在节点失效与 AI 赋能攻击下展现出强容错能力。
I. 引言
智能家庭、消费级设备与工业物联网中互联系统的快速扩张[1–3],正在重塑分布式环境下的可信异常检测——而这些环境正越来越多地暴露于 AI 赋能的网络威胁之中[4–8]。集中式检测器在受控环境下尚可工作,但在消费级网络中面临根本限制:隐私、带宽与实时处理能力往往不可或缺[9–16]。这些限制在消费级与关键基础设施场景中尤为突出——异常可能意味着 AI 驱动入侵、设备故障或运行风险,需要即时响应[17,18]。边缘计算与泛在 IoT 的普及,因此推动防御从“云集中”向去中心化、设备端就近处理倾斜[19–22];然而许多分布式方法仍依赖过于简化的聚合策略,无法捕捉异构系统中复杂的时间动态与跨节点依赖[23–25]。数据源的多样性,加上严格隐私法规与带宽上限,呼唤在边缘约束下仍能保持高精度与高效率的可信赖框架[26–28]。
群体智能受蚁群、蜂群等生物集体行为启发,为分布式系统构建去中心化自适应防御机制提供了有前途的基础[29–36]:节点通过局部交互协作,在没有显式中央控制的情况下涌现出全局复杂行为——这与可信分布式异常检测的目标天然契合。
联邦学习(FL)已证明可在不共享原始数据的前提下训练模型[37–43],但不少面向异常检测的 FL 仍停留在“参数平均”层面,忽略了群体智能对鲁棒性、自适应性与检测精度的增益潜力[41–45]。将群体智能与深度神经网络结合,为动态、对抗性消费 IoT 环境量身打造可扩展、自适应、可信赖异常检测框架提供了机会[44,45]。
现代消费 IoT 面临的核心矛盾是:隐私约束 + 通信受限 + 可扩展性与可靠性需求上升;而集中式架构带来单点故障、带宽低效与隐私风险[46,47];传统带简单聚合的 FL 又抓不住异质网络中的时序与跨节点依赖。本工作的目标正是构建这样一个去中心化可信赖框架:在保证隐私、压低通信成本的同时,维持高检测精度,并能适应动态环境、抵御 AI 赋能对手、在资源受限条件下容忍节点失效[48,49]。
面向消费 IoT 安全
-
提出 SwarmSense-DNN:一个将群体智能与深度神经网络融合的可信赖去中心化框架,面向消费 IoT 的协作式、主动异常检测[31];自主节点不依赖中央协调即可集体学习/自适应。
-
设计层次化架构:把局部群体簇与轻量级协调机制结合,在精度、扩展性与通信效率间取得平衡;通过自适应聚类与选择性信息交换削减开销。
-
引入面向群体学习的差分隐私机制:在保护单节点数据敏感性的同时,保障分布式协作有效性。
-
实现自愈策略:自主检测并从节点失效或被攻陷中恢复,提高系统在对抗与动态条件下的可靠性、可信赖性与韧性。
II. 文献综述
II-A 分布式与联邦异常检测
联邦学习是隐私保护分布式机器学习的代表路线[26]。Mothukuri 等[4]验证了其在 IoT 安全中的可行性;但仅靠简单参数平均难以应付复杂、异构异常模式。Man 等[37]用自适应聚合削减延迟,但仍依赖集中协调;Li 等[41]推进去中心化 FL 以消除单点故障,但缺少面向演化威胁的自适应协调;Zhang 等[50]用空间感知 GNN 刻画拓扑却仍保留集中式设定;Syu 等[44]则明确了关键基础设施中“隐私—精度”权衡。
II-B 群体智能与协作系统
群体智能擅长分布式优化与协调[29]。Wardhana 等梳理了其概念与应用;Xu 等[51]提出带循环更新的协作群体学习以降低通信量;Pham 等[33]展示仿生方法对大规模动态网络的适应性;Blais 与 Akhloufi[35]在机器人领域论证去中心化决策价值——本文将其迁移到异常检测语境。Wardhana 等[52]在医疗场景验证隐私保护协作对本文“保密机制”设计有直接启发。
II-C 异常检测深度学习架构
Huang 等[53]与 Kumari 等[23]综述了神经架构演进;Nazir 等[54]用 CNN–LSTM 混合模型捕捉时空异常;Singh 等[55]用优化/集成进一步提升;Chen 等[56]把模糊聚类签名检测与深度学习结合。
II-D 图神经网络与注意力机制
Kim 等[57]综述 GNN 异常检测方法与挑战;Zhou 等[58]用分组 GNN 处理多变量时序跨传感器依赖;Tang 等[59]反思 GNN 架构设计;Dadhania 等[60]在 SDN 中实现高速 GNN 检测;Chen 等[56]用改进 Transformer 注意力捕捉长距离时序异常;Liu 等[61]用变量间注意力启发本文“注意力驱动的群体协调”;Kavadi 等[62]把时序图注意力与 Transformer 增强 RNN 结合。
II-E 边缘计算与 IoT 应用
Liu 等[19]给出资源受限工业 IoT 部署原则;Rezaee 等[63]强调边缘视频监控需要实时分布式管线;实践系统需在精度与资源间取舍[64],并要求支持动态节点增删与拓扑演化[65];矿下多传感器检测则体现“边缘为中心”的硬约束[66]。
II-F 集成学习与变分方法
Sarhan 等[67]用深度集成提升网络异常/攻击检测鲁棒性;Liu 等[68]用选择性并行集成优化多样性—精度平衡;VAE 体系在异常检测中持续走强[69];Wang 等[70]把 LSTM-AE 与注意力结合检测多维时序异常;Ji 等[71]证明 VAE 无监督模型在大规模储能系统中的可扩展性。
II-G 研究空白分析(Research Gap)
尽管分布式异常检测已有进展,一个关键空白仍在于:将群体智能与深度学习整合进自主协作系统。现有方法要么依赖简单 FL 聚合[4,37],要么退回到集中式神经模型[50,56],缺乏自适应协调、隐私、效率与韧性的统一兼顾[73];尚无工作真正把基于群体的协调[33,51]与强神经架构结合成“无需集中控制即可自组织”的可信异常检测系统。SwarmSense-DNN 正是为填补这一空白而提出。即便较新的 FADngs[26]、Popoola 等消费 IoT IDS[38]实现了分布式学习,仍保留集中协调;Xu 等[51]展示仿生协调但缺“基于信任的共识”;Zhang 等[50]用静态拓扑而非自适应聚类;Li 等[41]去中心化 FL 仍用简单参数平均而非仿生集体决策——因此在“真正自主分布式系统”层面仍存在根本性缺口。
III. 方法论
III-A 系统模型与假设
III-A1 系统模型
考虑由 N 个自主节点
N={n1,n2,…,nN}
组成的分布式网络,部署在异构环境中。网络拓扑建模为动态图
G(t)=(N,E(t),W(t))
其中 E(t)⊆N×N为时变通信链路,W(t)∈RN×N为加权邻接矩阵。节点 i,j在时刻 t的连接权重定义为:

其中 dij为节点距离,rc为通信半径,σc控制连通强度衰减。
每个节点 ni在长度 T的滑动时间窗内持续观测本地数据流
Xi(t)=[xi(t−T+1),…,xi(t)]∈Rdi×T
时刻 t的本地特征向量记为 xi(t)∈Rdi。数据分布假设为:

其中 λi∈[0,1]为该节点的异常率。

图 1:SwarmSense-DNN 系统模型
展示边缘–云部署用于实时、隐私保护异常检测:机器人传感器采集数据,边缘节点协作推断,云端单元同步但无中央控制。

图 2:信息素(Pheromone)机制流程图
信息素衰减率 ρ=0.1与信任平滑因子 β=0.8通过在 IoT-23 验证集上的网格搜索选定,以在信息持久性与系统自适应性之间取得平衡(基于群体智能原理[33])。
III-A2 假设
-
部分连通性:网络始终保持 ∣Ni(t)∣≥kmin,其中 Ni(t)={j:Wij(t)>0}。
-
有界拜占庭节点:∣B∣≤⌊N/3⌋(B为恶意/被攻陷节点集)。
-
局部可微性:局部损失 Li(θi)二阶连续可微且满足 Lipschitz 常数 L>0。
-
隐私预算可用:每节点拥有差分隐私预算 ϵi>0,∑i=1Nϵi=ϵtotal。
III-B 模型架构
III-B1 层次化架构总览
SwarmSense-DNN 采用三层层次化架构:
-
本地节点层:个体异常检测
-
群体簇层(Swarm Cluster):协调决策
-
全局协调层:簇间通信
簇协调者基于评分动态选举:
Si=w1⋅CPUi+w2⋅degreei+w3⋅Ri,avg
每 10 轮或发生失效时重选。

图 3:SwarmSense-DNN 层次化架构
节点自适应组织成群簇,每簇含本地协调者参与全局协调。
III-B2 本地节点神经网络架构
每个节点维护专用 DNN Fi,主要由五部分组成:
(1) 输入预处理/归一化

(ϵ=10−8避免除零;此 ϵ不同于差分隐私预算 ϵdp)
(2) 时序卷积特征提取器(1D Conv + 残差)

(3) 多头自注意力模块(节点级时序特征处理)

(4) 群体上下文融合层(来自邻居节点的加权聚合)

(5) 异常分类头(MLP + Dropout + Sigmoid)

III-B3 群体智能协调模块
(1) 信息素更新机制

与 FedAvg 的简单参数平均(θglobal=∑wiθi)不同,SwarmSense-DNN 采用信任加权共识:
Wiconsensus=j∈Ni∑Ri,j(t)×θj
>节点从∗∗可信邻居∗∗选择性吸纳知识,而非盲目对所有参数求均值——这在异构数据与对抗条件下提供更优鲁棒性。
III-B4 用于簇协调的图神经网络(信任与声誉系统 + GAT)
信任分数更新:

簇内使用 GAT(图注意力网络)进行协调决策:

III-B5 隐私保护机制
(1) 特征共享的差分隐私:分享前加入校准噪声

实验中设 ϵ=1.0,δ=10−5,Δ=1.0(由特征向量 L2 裁剪确定)。
(2) 多方安全计算(SMPC)/加法秘密分享用于簇级统计量聚合:


图 4:SwarmSense-DNN 模型架构
展示卷积特征提取 + 信任评估 + 自适应聚类,差分隐私与信息素协调共同实现安全、去中心化、韧性异常检测。
III-C SwarmSense-DNN 核心算法
算法 1:基于信息素启发的去中心化群体协调协议
-
输入:节点集 N、邻域半径 r、初始权重 W0、信息素衰减 ρ、最小阈值 τmin
-
输出:更新后的本地模型 {Wi}i=1k
-
for 每节点 ni∈N:
-
发现邻居:Ni←{nj∣dist(ni,nj)≤r}
-
初始化信息素:τij←1.0,∀nj∈Ni
-
计算本地异常分 Ai
-
按异常强度更新信息素:τij←τij+α⋅Ai
-
向邻居共享 Wi,τij;接收邻居 {Wj},{τji}
-
信息素加权聚合(群体共识):
Winew←∑j∈Niτji∑j∈NiτjiWj
-
更新本地模型:Wi←Winew
-
信息素蒸发:τij←(1−ρ)⋅τij
-
if τij<τmin:截断到 τmin(防止完全蒸发)
-
return {Wi}
算法 2:基于注意力引导的群体 GNN + 信息素协调的异常检测
-
输入:图 G=(V,E)、节点特征 X、注意力参数 α、权重 W、信息素矩阵 τ
-
输出:异常分 S、更新后 τ
-
初始化 GNN 层(含注意力头);τij←1.0,∀(i,j)∈E
-
for l=1..L:
-
for 每节点 vi∈V:
-
计算信息素调制注意力权重:
αij←τij⋅softmax(LeakyReLU(a⊤[WXi∥WXj]))
-
聚合: hi(l)←σ(∑j∈N(i)αijWXj)
-
for 每节点 vi:
-
Si←1−cos(hi(L),μ)(μ为期望行为嵌入)
-
沿异常路径沉积信息素:τij←τij+β⋅Si
-
信息素蒸发:τij←(1−ρ)τij,∀(i,j)∈E
-
return S={Si},τ
III-D 评估指标
(1) 检测性能指标
-
Accuracy、Precision、Recall、F1、AUC(公式略,标准定义)

(2) 通信效率指标
-
CommOverhead:单位时间内传输数据总量(式 30)

-
Convergence Time:性能稳定所需通信轮数(式 31)

(3) 隐私保护指标
-
Privacy Budget Utilization(式 32)

-
Information Leakage:共享数据与私有数据间的互信息(式 33)

(4) 韧性指标
-
Fault Tolerance = Accuracyfailed/ Accuracynormal(式 34)

-
Attack Resistance = 1−AccuracynormalAccuracynormal−Accuracyattack(式 35)

-
Recovery Time = 恢复到 ≥0.95×Accuracynormal的最小时步(式 36)

IV. 结果
IV-A 实验设置与总体检测精度
表 I:综合实验配置摘要
|
配置维度 |
规格 |
|---|---|
|
硬件 |
树莓派 4(8GB RAM, ARM Cortex-A72)×100 节点;SDN 网络基础设施;每节点 64GB microSD |
|
数据集 |
IoT-23 / NSL-KDD / CICIDS2017 / UNSW-NB15 / Industrial IoT;划分 70/15/15;异常率 5.2%–23.1% |
|
训练 |
PyTorch 1.12 + CUDA 11.6;AdamW(lr=0.001,wd=0.01);Batch=32;每轮 Epoch=50;收敛阈值 <0.1% 波动 |
|
隐私 |
ϵ∈{10,5,1,0.1};δ=10−5;高斯机制;Δ=1.0;每节点 ϵi=ϵ/N |
|
群体参数 |
ρ=0.1,β=0.8;8 头注意力;簇规模 10–15 节点 |
|
统计检验 |
n=5次独立运行;配对 t 检验;p<0.01;95% CI 以均值±标准误报告 |
表 II:跨数据集检测性能对比
|
方法 |
Acc. |
Prec. |
Rec. |
F1 |
AUC |
Avg. |
|---|---|---|---|---|---|---|
|
Centralized DL [53] |
88.46% |
87.23% |
89.12% |
88.16% |
0.914 |
88.51% |
|
FedAvg-AD [4] |
85.46% |
84.89% |
86.34% |
85.60% |
0.891 |
85.64% |
|
Distributed GNN [50] |
90.18% |
89.76% |
90.89% |
90.32% |
0.928 |
90.29% |
|
Edge-FL [37] |
87.38% |
86.92% |
88.15% |
87.53% |
0.905 |
87.51% |
|
Ensemble-Dist [67] |
89.28% |
88.94% |
89.85% |
89.39% |
0.921 |
89.33% |
|
SwarmSense-DNN |
95.44% |
94.87% |
96.12% |
95.49% |
0.967 |
95.52% |

图 5:SwarmSense-DNN 检测性能
IV-B 数据集级别性能分析
表 III:数据集级别检测性能
|
数据集 |
SwarmSense |
Dist.GNN |
Ensemble |
FedAvg |
领先幅度 |
|---|---|---|---|---|---|
|
IoT-23 |
94.7% |
89.1% |
88.4% |
84.6% |
+5.6% |
|
NSL-KDD |
96.2% |
91.2% |
90.6% |
86.8% |
+5.0% |
|
CICIDS2017 |
97.1% |
92.8% |
91.9% |
88.3% |
+4.3% |
|
UNSW-NB15 |
93.8% |
87.3% |
86.8% |
82.4% |
+6.5% |
|
Industrial IoT |
95.4% |
90.5% |
89.7% |
85.2% |
+4.9% |
|
Average |
95.44% |
90.18% |
89.48% |
85.46% |
+5.26% |

图 6:数据集级性能分析(含统计验证)
IV-C 通信开销分析
表 IV:通信效率指标对比
|
方法 |
开销(MB/h) |
收敛轮数 |
BW 降幅 |
效率得分 |
|---|---|---|---|---|
|
FedAvg-AD [4] |
2160 |
125 |
– |
0.396 |
|
Distributed GNN [50] |
1630 |
98 |
24.5% |
0.553 |
|
Edge-FL [37] |
1775 |
112 |
17.8% |
0.492 |
|
Ensemble-Dist [67] |
1920 |
118 |
11.1% |
0.441 |
|
SwarmSense-DNN |
585 |
32 |
72.9% |
0.973 |

图 7:SwarmSense-DNN 通信效率分析
(注:文中所有带宽数据为每节点均值,在全网范围内计算以保证可复现性。)
IV-D 隐私—精度权衡分析
表 V:不同隐私预算下的隐私保护表现
|
ϵ |
Acc. |
Prec. |
Rec. |
泄露量 |
Priv.Util. |
抗攻击力 |
|---|---|---|---|---|---|---|
|
无隐私 |
96.2% |
95.8% |
96.6% |
0.847 |
0% |
32.1% |
|
ϵ=10 |
95.7% |
95.2% |
96.2% |
0.234 |
18.3% |
78.4% |
|
ϵ=5 |
94.9% |
94.3% |
95.5% |
0.156 |
31.7% |
85.2% |
|
ϵ=1 |
93.2% |
92.5% |
93.9% |
0.089 |
68.9% |
94.3% |
|
ϵ=0.1 |
89.8% |
88.9% |
90.7% |
0.023 |
94.4% |
97.8% |

图 8:隐私保护分析(ϵ=1仍保持 93.2% 精度,泄露从 0.847 压到 0.089)
IV-E 容错与恢复分析
表 VI:各类压力条件下的系统韧性指标
|
压力条件 |
留存率 |
恢复(轮) |
攻击率 |
自愈率 |
韧性得分 |
|---|---|---|---|---|---|
|
10% 节点失效 |
97.1% |
2.3 |
– |
98.7% |
0.954 |
|
25% 节点失效 |
92.8% |
4.1 |
– |
94.2% |
0.891 |
|
40% 节点失效 |
87.9% |
6.8 |
– |
89.3% |
0.823 |
|
数据投毒(10%) |
93.8% |
4.2 |
12.3% |
96.1% |
0.876 |
|
模型反演攻击 |
95.1% |
2.8 |
8.7% |
97.4% |
0.912 |
|
拜占庭攻击(20%合谋) |
91.4% |
6.1 |
15.6% |
92.8% |
0.847 |
|
网络分区 |
89.6% |
8.9 |
– |
88.1% |
0.794 |

图 9:系统韧性评估(40% 失效仍保持 87.9% 精度,最快 2.3 轮恢复)
IV-F 大规模性能评估
表 VII:不同网络规模的扩展性表现
|
规模 |
Acc. |
收敛轮数 |
内存(MB) |
CPU(%) |
时延(ms) |
扩展指数 |
|---|---|---|---|---|---|---|
|
100 节点 |
95.4% |
32 |
148 |
23.7% |
12.3 |
1.000 |
|
250 节点 |
95.1% |
41 |
167 |
28.9% |
18.7 |
0.943 |
|
500 节点 |
94.8% |
52 |
189 |
34.2% |
26.4 |
0.887 |
|
750 节点 |
94.5% |
61 |
203 |
38.1% |
31.8 |
0.841 |
|
1000 节点 |
94.2% |
68 |
215 |
41.6% |
36.2 |
0.798 |
收敛时间呈亚线性增长 O(N0.67);内存增幅温和(148→215 MB);扩展指数仍 >0.79(1000 节点)。
文中给出一项粗略成本对照:相比被动响应式基线,30 天评估期通过避免 3 次紧急故障节约约 USD 47,000(扣除部署成本 USD 5,000)。

图 10:可扩展性分析
IV-G 工业 IoT 实地部署结果
表 VIII:真实工业 IoT 部署指标
|
指标 |
SwarmSense |
此前系统 |
变化 |
影响 |
|---|---|---|---|---|
|
异常检出率 |
23/25 (92%) |
18/25 (72%) |
+20% |
早期故障预防 |
|
误报率 |
3.2% |
12.8% |
−75% |
更少无效维护 |
|
检测时延 |
4.7 min |
2.1 h |
−96% |
更快响应 |
|
系统在线率 |
99.7% |
97.3% |
+2.4% |
更高可用性 |
|
维护节省 |
– |
– |
~USD 47,000 |
避免故障损失 |
|
能效提升 |
+18% less |
基线 |
+18% |
更低运行成本 |

图 11:工业 IoT 实地部署结果
IV-H 消融实验
表 IX:消融研究结果
|
配置(去掉/变体) |
Acc.(%) |
开销(MB/h) |
轮数 |
隐私(%) |
贡献等级 |
|---|---|---|---|---|---|
|
完整 SwarmSense-DNN |
96.2 |
585 |
32 |
93.2 |
基线 |
|
– 群体智能 |
91.8 |
1240 |
78 |
89.7 |
Critical |
|
– 层次聚类 |
93.4 |
925 |
45 |
91.8 |
High |
|
– 注意力机制 |
94.1 |
612 |
38 |
92.6 |
Moderate |
|
– 隐私机制 |
96.5 |
568 |
30 |
45.3 |
隐私权衡 |
|
– 自愈 |
94.7 |
597 |
35 |
92.1 |
Moderate |
|
…(其余子组件与架构对照) |
|
|
|
|
|
|
集中式架构 |
92.3 |
2100 |
68 |
78.5 |
Reference |
|
标准联邦 |
89.7 |
1580 |
89 |
85.2 |
Reference |
|
无群体+无聚类 |
88.5 |
1650 |
95 |
84.1 |
Worst Case |

图 12:消融结果量化
图 13:群体协调对收敛性能的影响(快 2.4×,通信少 53%)

图 14:IoT-23 上学得特征的 t-SNE(注意力使类内方差降 34%,类间距增 28%)
IV-I 对比分析总结
表 X:SwarmSense-DNN vs. 现有方法
|
方法 |
Acc. |
通信效率 |
隐私 |
容错 |
扩展 |
仿生 |
|---|---|---|---|---|---|---|
|
FedAvg-AD [4] |
85.46% |
Low |
Medium |
Low |
Medium |
No |
|
Distributed GNN [50] |
90.18% |
Medium |
Low |
Medium |
Low |
No |
|
Edge-FL [37] |
87.38% |
Medium |
Medium |
Low |
High |
No |
|
Ensemble-Dist [67] |
89.28% |
Low |
Low |
Medium |
Medium |
No |
|
Swarm Learning [52] |
88.90% |
High |
High |
Medium |
Medium |
Yes |
|
Coop. Learning [51] |
87.65% |
High |
Medium |
Low |
High |
Yes |
|
SwarmSense-DNN |
95.44% |
High |
High |
High |
High |
Yes |
V. 结论
本文介绍了SwarmSense-DNN,一个去中心化神经框架,集成了群体智能与联邦学习,实现可信的物联网异常检测。五个基准测试的评估显示,检测准确率达到95.44%,通信开销降低72.9%,同时保持了强有力的隐私保障和节点故障后的韧性。尽管取得了令人满意的成果,该框架仍面临局限性,包括超参数灵敏度、网络分区时性能下降(准确率89.6%)以及不适合需要亚秒响应的超低延迟应用。未来工作将通过SHAP分析和注意力可视化提升解释性,以支持对算法透明至关重要的安全关键部署。
105

被折叠的 条评论
为什么被折叠?



