关闭

百易AI博客

当前位置: 首页 > AI大模型

OpenClaw让AI自动操作Excel和电脑 不用手动也能干活

作者:AI-小易 时间:2026-04-26 11:07:34 浏览:

摘要:OpenClaw:让AI从“动口”到“动手”ChatGPT 和 Claude 擅长写文案、解题、编逻辑——但它们不会点鼠标、不会切窗口、不会打开 Excel 并标红某几行。OpenClaw 会。它不生成建议,它直接执行。你让它“把销售表里 Q3 超过 80 万的客户名加粗并导出 PDF”,它就真去干:启动 Excel、定位 Sheet、筛选数据、加粗、导出、发邮件给你。OpenClaw 是什...

封面

OpenClaw:让AI从“动口”到“动手”

ChatGPT 和 Claude 擅长写文案、解题、编逻辑——但它们不会点鼠标、不会切窗口、不会打开 Excel 并标红某几行。OpenClaw 会。

它不生成建议,它直接执行。你让它“把销售表里 Q3 超过 80 万的客户名加粗并导出 PDF”,它就真去干:启动 Excel、定位 Sheet、筛选数据、加粗、导出、发邮件给你。

OpenClaw 是什么

OpenClaw 是一个运行在本地的操作代理(operation agent)。它不是聊天界面背后的黑盒,而是一个能感知屏幕、操控输入、调用 API、读写文件的终端进程。核心不是“更聪明的语言模型”,而是把语言理解、动作规划、系统控制三者焊死在一起。

它怎么干活

OpenClaw 的操作引擎不依赖预设脚本或录制回放。它靠两件事落地:

举几个真实能跑的例子:

典型工作流日常办公提效

“整理上周五所有会议的 Zoom 录像链接,按时间排序,生成带标题的 Notion 页面”

→ OpenClaw 自动翻 Outlook 日历、查 Zoom 邮件、提取链接、调 Notion API 创建页面。RPA 场景免编码

传统 RPA 要拖拽组件、写 XPath、处理弹窗异常。OpenClaw 接收自然语言后,自己做元素定位、容错重试、状态判断。比如:“登录 SAP GUI,进事务码 VA03,输订单号 123456,截图‘抬头’和‘行项目’两个标签页”。它真能完成。客服后台辅助

用户在工单系统里写:“客户说收不到发票,查他邮箱是否在黑名单”。OpenClaw 直接连内部邮件网关 API 查记录,再查 CRM 里的客户邮箱字段,比对后返回结论。数据分析闭环

“拉出上月 AWS 账单里 EC2 成本最高的 5 个区域,画柱状图,贴进周报 PPT 第 3 页”

→ 调 AWS Cost Explorer API → pandas 处理 → matplotlib 画图 → python-pptx 插入幻灯片。当前状态(2026)技术栈拆解

OpenClaw 架构分四层,全部开源(Apache 2.0):

NLU 层:微调的 TinyBERT + 指令模板匹配器,输出结构化动作意图({action: "find_in_excel", file: "~/data.xlsx", column: "status", value: "pending", style: "highlight_yellow"})Planner 层:基于 LLM 的轻量推理器(本地运行 Phi-3),把意图转为动作序列,并插入必要检查点(如“确认 Excel 已打开”、“等待单元格加载完成”)Executor 层:纯 Rust 编写,调系统 API、模拟输入、驱动浏览器(Playwright)、调用 CLI 工具。失败时自动降级(如 GUI 失败则切 CLI 模式)Feedback 层:操作完成后,截图关键帧、记录动作日志、生成自然语言摘要(“已标红 12 行,保存至 /tmp/highlighted.xlsx”),支持 CLI 输出或 Webhook 推送它改变了什么现在就能做什么

国产 Claws 项目也值得盯:AutoClaw 的 Home Assistant 插件已支持语音触发设备联动,NanoClaw 的 Android 测试框架正在被大厂用于 UI 自动化回归。它们和 OpenClaw 共享底层动作协议,未来一个指令能跨 PC、手机、家电执行。