摘要:当 Curity CTO Jacob Ideskog 警告行业正“梦游般”陷入 AI 安全危机时,他揭示了一个核心困境:我们缺乏系统性的方法来分析和应对 AI 智能体(Agent)带来的全新“行为驱动”威胁。本文将创新性地引入经典 STRIDE 威胁建模框架,将其作为解剖 AI 智能体安全风险的手术刀,系统地将提示注入、数据泄露等新风险归类到我们熟悉的威胁模型中,并为构建可落地的缓解措施提供清晰的路线图。
引言:为何需要用旧地图探索新世界?
传统的应用安全威胁建模,侧重于分析数据流和代码逻辑中的漏洞。然而,AI 智能体的核心风险源于其与人类语言的交互及其行为的不可预测性。这是否意味着我们过去的经验和框架都已失效?
答案是否定的。经典框架如 STRIDE(由微软提出,包含六大威胁类别)的强大之处在于其高度的抽象性和普适性。我们需要的不是抛弃它,而是学会如何将这些新出现的、看似模糊的威胁,“翻译”成 STRIDE 框架能够理解和描述的语言。
本次实践,我们将以一个典型的 AI 智能体系统为蓝本,走完一次完整的威胁建模流程。
系统蓝图:用户 -> 应用层 -> [AI Agent核心 (包含系统提示)] -> LLM API -> [内部工具/API/数据库]
第一步:将 AI 新威胁映射到 STRIDE 框架
1. S - 仿冒 (Spoofing) - “我是谁?”
-
AI 时代的体现:在传统意义上,仿冒指用户或进程伪装成他人。在 AI 场景下,它表现为攻击者通过操纵智能体,使其仿冒成一个可信的内部服务调用者。当一个被注入恶意提示的智能体去调用内部的用户管理 API 时,该 API 看到的是一个来自“受信任的内部 AI 助手”的合法请求,从而执行了恶意操作。攻击者借用了智能体的“身份”。

299

被折叠的 条评论
为什么被折叠?



