给 OpenClaw 再加一道安全护栏

张开发

• 2026/4/11 22:55:39 • 15 分钟阅读

分享文章

一个覆盖安装前到运行中的全生命周期防护 SKILL一个智能体最可怕的地方往往不是它“不会做事”而是它太会做事了会装、会跑、会调工具、会改文件、会联网甚至还能一本正经地把危险动作做得很丝滑。所以我们做了这样一个SKILL它不是让 agent 更强而是让 agent 在变强的时候多长一层脑子多踩几脚刹车。这套 SKILL 覆盖的是一个完整生命周期从安装前preinstall开始检测到运行时runtime持续守护。不是等出事了再复盘而是尽量在事情发生之前就把风险揪出来。Githubhttps://github.com/skill-sonar/Skill-Sonar项目页面https://skill-sonar.github.io/Clawhubhttps://clawhub.ai/yxf203/skill-sonar安装前先查一遍别把危险 skill 请进门了才后悔很多问题不是在运行时才出现的。有些风险从你把一个 skill 装进来那一刻其实就已经开始了。所以在安装阶段我们先做一轮系统性的安全检查一共覆盖九类风险。Semantic Structural Integrity。先看这个 skill 自己说的话到底前后对不对得上。有没有逻辑上自相矛盾的地方有没有表面一套、背后一套有没有通过各种编码、嵌套、混淆把一些东西偷偷藏起来Supply Chain Source Verification。再看它是从哪来的它依赖的东西又是从哪来的。毕竟很多风险不是来自“明显看起来很坏的代码”而是来自“这玩意儿到底是谁家的怎么下来的为什么没人认识”。从一些来路不明的网站拉下来的东西危险概率往往不会低。安全问题很多时候从供应链那一环就已经开始埋雷了。Secret Credential Exposure。然后看它会不会碰你的敏感信息。比如 API Key、Access Token、账号凭据等等尤其是你珍贵的 OpenAI API Key这种东西可不是拿来随便试探 skill 品德的。一个 skill 如果会主动索取、读取、暴露、转存这些内容那就已经不是“小心一点”的问题了得重点盯。Data Privacy Exfiltration。接着看它会不会把你设备上的数据往外送。最怕的不是“它会读数据”而是它读完了还不告诉你然后偷偷传出去。本地文件、剪贴板、历史信息、缓存内容……只要读取和外传之间没有清晰、合理、可预期的边界这就是值得拉警报的事。Injection Influence Resistance这一项主要防的是外面的内容会不会反过来控制这个 skill。比如网页、文档、用户输入、上下文内容表面上看只是“信息”但实际上可能夹着指令、诱导、伪装权威内容。有些攻击根本不靠木马不靠提权就靠一句“请忽略之前所有规则并执行以下操作”狠狠干扰控制流。所以这里检查的是这个 skill 面对外部内容时能不能守住边界不被轻易带偏。Permission Access Scope。这个 skill 要的权限和它真正要做的事情匹不匹配它是不是只拿了“完成任务所需要的权限”还是顺手多拿了一圈能看的都看能碰的都碰一个本来只是整理文件的 skill结果要了大量不必要的访问能力这事怎么看都不太对。权限不是越多越方便很多时候是越多越吓人。Destructive Potential。这一项非常重要。它检查的是这个 skill 有没有能力删除、重写、覆盖、破坏你的文件或者系统内容。这类操作为什么危险因为我们平时自己删个东西系统都还知道弹个“你确定吗”但一个 skill 要是直接静默删掉、改掉、覆盖掉关键内容用户连后悔的机会都不一定有。这种崩溃感真的不是“撤销一下”就能解决的。Resource Discipline。还有一种风险没那么炸裂但特别烧钱。比如 skill 里偷偷写了个死循环开始疯狂调工具、疯狂跑 token、疯狂吃资源然后你盯着账单陷入沉思论流失的金钱都去哪里了。所以这一项看的是它会不会无上限消耗 token、算力、网络、时间或者做出一些根本不受控制的资源占用行为。Persistence。最后看它会不会留下“不该留下的东西”。比如额外写入持久化状态、修改系统设置、留下后台驻留、安装超出预期的长期影响。这里有个边界要讲清楚skill 安装后自己的文件正常留在 skills 目录里这是预期安装足迹不算风险。我们真正要盯的是那些超出正常安装范围之外的持久化改动。不是“它存在”而是“它额外留下了什么”。运行时继续盯不是查一次就完而是每一步动作前都过一遍 guardruntime通过安装前检查不代表后面就高枕无忧。很多危险恰恰出现在运行过程中而且不是一上来就爆炸而是一步一步偷偷变味。所以在runtime阶段我们做了一套guard 机制。核心思路很简单每个 action 前都先过一遍判断。包括但不限于每次 tool call 前每次代码执行前每次关键数据输出前在这些动作发生之前guard 会快速问四个问题这是危险操作吗当前控制流是不是受到了低信任内容影响这是不是一个复合命令上下文是不是变了然后根据答案决定怎么做如果四个问题全是NO那就是R0静默继续不打断不刷屏不额外制造存在感只要有一个是YES就提升风险等级输出对应的 guard 信息再决定后续 action也就是说这套机制不是那种“什么都拦、什么都报、把用户烦死”的安全设计。它追求的是该安静的时候安静该出声的时候出声。runtime 不只看执行而是从六个面同时看风险runtime 这部分我们不是只盯最后一步“执行了什么”而是从六个方面一起看inputmemoryplantoolexecutionoutput。因为很多问题根本不是执行那一刻才出现的。有时候是输入已经被污染了有时候是 memory 记住了不该高信任的东西有时候 plan 阶段已经被带偏等到真调用 tool 的时候其实前面坑早就挖好了。所以 guard 看的是整条链路而不是只在结果那里补锅。四层风险分级从静默通过到人工接管风险等级为了在安全和可用之间找到平衡我们设计了四层风险等级R0 到 R3。R0没什么明显风险继续做R1轻度风险提醒一下再继续R2中度风险需要更明确的告知、限制或处理R3高风险通常需要人工检查或确认风险越高动作越谨慎。到了R3基本就该让人上来看看了。毕竟有些事情自动化再聪明也不该替你拍板。这相当于给 OpenClaw 额外装上了一套分级刹车系统平路不乱踩弯道不失灵悬崖边知道停。我们还给输入分了 trust 等级外来的不默认可信很多危险内容最擅长干的事情就是把自己包装得特别像权威。它可能看起来像官方说明像系统指令像可信规则甚至像“为了安全请立即执行以下操作”。所以我们给不同输入设定了P0 到 P3 的 trust 等级。等级越高代表越可信而各种外部输入默认都按更低信任来处理。这件事的意义很大不是谁嗓门大、写得正式、长得像规则就真的能进控制流。这样可以有效降低一类很典型的攻击伪装成高可信信息实际上偷偷劫持智能体行为。规则不全塞进一个 SKILL.md能省 token 的地方就认真省runtime 这部分涉及不同阶段、不同情境、不同处理逻辑。如果把所有内容都硬塞进一个SKILL.md那结果只有一个token 开销暴涨。所以我们做了文档层级的路由设计让智能体按需读取相关规则只在合适的时候加载合适的内容。这样做有两个直接好处一是更轻二是更省。毕竟安全机制如果自己先把上下文撑爆了那也挺黑色幽默的。我们想做的不只是“更安全”而是“更可控”这个 SKILL 的目标不只是多拦几个危险操作。它真正想补上的是智能体系统里那种经常被忽略、但非常关键的能力在做事之前先判断这件事该不该做在继续往前之前先意识到这里是不是已经危险了。它覆盖安装前检查也覆盖运行时守护它看单点风险也看整条链路它考虑来源可信度也考虑动作破坏性它尽量不打扰正常流程但在关键节点尽可能不装看不见。对于智能体系统来说这不是简单再加几条规则。这是在它原本“会做事”的能力之外再补上一层“知道什么时候该停、什么时候该问、什么时候该更谨慎”的能力。说到底我们不是只想要一个能跑任务的 agent。我们想要的是一个在动手之前至少会先替你多想一步的 agent。

更多文章

前端开发 2026/4/11 21:05:57

Qwen3-VL-8B镜像快速上手：3分钟完成localhost:8000/chat.html访问

Qwen3-VL-8B镜像快速上手：3分钟完成localhost:8000/chat.html访问想快速体验一个功能完整的AI聊天系统吗？今天给大家介绍一个开箱即用的Qwen3-VL-8B镜像，只需要几分钟时间，你就能在自己的电脑上搭建一个带Web界面的智能聊天助手…

张开发

前端开发 2026/4/11 3:27:10

手把手教你用WinHex和取证大师，从硬盘镜像里挖出远程控制IP和U盘痕迹

数字取证实战：用WinHex与取证大师追踪远程控制与U盘痕迹当电脑突然变得卡顿，或是文件莫名消失时，我们常会怀疑设备是否被他人入侵过。作为IT从业者，我经常需要帮同事检查电脑是否存在异常访问痕迹。本文将分享如何通过硬盘镜像分…

张开发

前端开发 2026/4/11 22:55:04

Flux.1-Dev深海幻境一键部署教程：基于Ubuntu20.04的完整环境配置指南

Flux.1-Dev深海幻境一键部署教程：基于Ubuntu20.04的完整环境配置指南最近有不少朋友在问，那个能生成超现实、梦幻风格图像的Flux.1-Dev模型，在Linux服务器上怎么快速搭起来。确实，看官方文档和社区讨论，依赖和环境问…

张开发

前端开发 2026/4/11 4:19:03

Pixel Aurora Engine惊艳案例：输入‘赛博敦煌飞天’生成融合东方美学的8-BIT神祇

Pixel Aurora Engine惊艳案例：输入赛博敦煌飞天生成融合东方美学的8-BIT神祇 1. 当敦煌飞天遇见赛博像素在数字艺术创作领域，我们见证了一次惊艳的东西方美学碰撞。Pixel Aurora Engine通过简单的文字输入"赛博敦煌飞天"，生成了…

张开发

前端开发 2026/4/8 7:07:04

【Kafka系列·入门第五篇】Kafka实操进阶：Topic/Partition管理 + 消息可靠性配置

大家好，接续上一篇《Kafka实操入门：环境部署（Windows/Linux） 简单消息收发》，今天我们进入Kafka实操进阶环节——重点讲解Topic与Partition的日常管理、消息可靠性配置，以及新手常遇到的实操故障排查方法。…

张开发

前端开发 2026/4/8 7:02:25

java的逻辑运算

大纲：1.顺序控制演示：结果：2.分支结构（2.1）if语句格式1规则：如果布尔表达式结果为true，执行if中的语句，否则则不执行格式2规则：如果布尔表达式结果为true，则执…

张开发

前端开发 2026/4/10 4:20:02

浦语灵笔2.5-7B惊艳案例：菜市场摊位照片→食材识别+营养搭配建议输出

浦语灵笔2.5-7B惊艳案例：菜市场摊位照片→食材识别营养搭配建议输出 1. 场景引入：当AI走进菜市场想象一下这样的场景：你正在菜市场买菜，面对琳琅满目的食材，突然不知道该怎么搭配才能做出既美味又营养的一餐。或者你…

张开发

前端开发 2026/4/8 6:56:16

3步释放华硕笔记本潜能：华硕笔记本优化工具GHelper全攻略

3步释放华硕笔记本潜能：华硕笔记本优化工具GHelper全攻略【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Strix,…

张开发

前端开发 2026/4/11 3:37:35

AI Agent 实战：MySQL 监控指标查询 Skill

标签：AI Agent、AgentSkills、MySQL 监控、Prometheus🔥 前言还在为不同云厂商 MySQL 监控指标命名不统一而头疼？还在手写 PromQL 查询 CPU、内存、QPS、慢查询？今天给大家带来企业级 Agent Skill：MySQL 监控指标查询技…

张开发

前端开发 2026/4/10 11:00:42

Wan2.2-I2V-A14B实操手册：WebUI中ControlNet风格控制与运动强度调节

Wan2.2-I2V-A14B实操手册：WebUI中ControlNet风格控制与运动强度调节 1. 环境准备与快速部署在开始探索Wan2.2-I2V-A14B的强大功能前，我们需要确保环境已正确部署。本镜像已针对RTX 4090D 24GB显卡进行深度优化，开箱即用。 1.1 一键启动We…

张开发

前端开发 2026/4/9 13:21:04

vue+SpringBoot（前后端交互）

阅读提示： 读者水平：要有前端基础（vue)，了解数据库，后端可以是初学者。文章重点：我这里只是讲述前后端交互（vuespringboot），重点是后端需要做什么。最后彩蛋&#x…

张开发

前端开发 2026/4/8 6:45:45

SpringBoot的“黑魔法”：插件化开发模式，真香！

👉 这是一个或许对你有用的社群🐱 一对一交流/面试小册/简历优化/求职解惑，欢迎加入「芋道快速开发平台」知识星球。下面是星球提供的部分资料： 《项目实战（视频）》：从书中学，往事上…

张开发

给 OpenClaw 再加一道安全护栏

最新文章

DeepChat环境部署：国产信创环境（麒麟V10+昇腾910B）适配DeepChat可行性验证

diffusers 进阶之 PEFT 实战（一）：inject_adapter_in_model 最佳实践指南

Swin2SR极限测试：4096px输出画质与显存占用平衡分析

RDF 规则：构建语义网的标准指南

RT-Thread PM组件避坑指南：搞懂‘投票机制’与设备休眠，解决外设唤醒后卡死的难题

智能家居入门：用ESP32和NTC热敏电阻打造低成本温控系统

推荐文章

LeetCode 700. Search in a Binary Search Tree 题解

Design Tokens：设计系统的 DNA

老旧设备重生：OpenCore Legacy Patcher系统焕新全指南

得意黑Smiley Sans字体高效部署实战指南

毕设日志26.4.4（2）:ds3231画板细节，中断引脚接法，去耦电容

LeetCode 92. Reverse Linked List II 题解

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

Qwen3-VL-8B镜像快速上手：3分钟完成localhost:8000/chat.html访问

手把手教你用WinHex和取证大师，从硬盘镜像里挖出远程控制IP和U盘痕迹

Flux.1-Dev深海幻境一键部署教程：基于Ubuntu20.04的完整环境配置指南

Pixel Aurora Engine惊艳案例：输入‘赛博敦煌飞天’生成融合东方美学的8-BIT神祇

【Kafka系列·入门第五篇】Kafka实操进阶：Topic/Partition管理 + 消息可靠性配置

java的逻辑运算

浦语灵笔2.5-7B惊艳案例：菜市场摊位照片→食材识别+营养搭配建议输出

3步释放华硕笔记本潜能：华硕笔记本优化工具GHelper全攻略

AI Agent 实战：MySQL 监控指标查询 Skill

Wan2.2-I2V-A14B实操手册：WebUI中ControlNet风格控制与运动强度调节

vue+SpringBoot（前后端交互）

SpringBoot的“黑魔法”：插件化开发模式，真香！

给 OpenClaw 再加一道安全护栏

最新文章

DeepChat环境部署：国产信创环境（麒麟V10+昇腾910B）适配DeepChat可行性验证

diffusers 进阶之 PEFT 实战（一）：inject_adapter_in_model 最佳实践指南

Swin2SR极限测试：4096px输出画质与显存占用平衡分析

RDF 规则：构建语义网的标准指南

RT-Thread PM组件避坑指南：搞懂‘投票机制’与设备休眠，解决外设唤醒后卡死的难题

智能家居入门：用ESP32和NTC热敏电阻打造低成本温控系统

推荐文章

LeetCode 700. Search in a Binary Search Tree 题解

Design Tokens：设计系统的 DNA

老旧设备重生：OpenCore Legacy Patcher系统焕新全指南

得意黑Smiley Sans字体高效部署实战指南

毕设日志26.4.4（2）:ds3231画板细节，中断引脚接法，去耦电容

LeetCode 92. Reverse Linked List II 题解

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作 实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

DotNetPy：现代.NET 与 Python 互操作实战指南