作者 | 黄昱

互联网大厂将齐聚在又一个火热的新战场——桌面Agent。

2月6日,当“腾讯云代码助手CodeBuddy”官方账号正式宣布桌面Agent工具“WorkBuddy”启动内测时,这场备受关注的“桌面大考”,又迎来了一个重量级玩家。

腾讯云CodeBuddy 团队对华尔街见闻表示,WorkBuddy在腾讯内部很早就推出了,旨在帮助公司内非开发者也能提高日常的效率。如今看到很多办公人群、研究人群、各行各业,对于“应用来解决日常任务”的诉求越来越强烈,所以基于CodeBuddy目前成熟的AI Coding基建,推出了轻量便捷极简的产品设计风格。

“我们会继续深度打磨用户反馈,然后在上半年找合适的时间正式推出这个产品。” 

与时下火热的OpenClaw能够调取系统级权限和更灵活的操作不同,WorkBuddy的定位更多是“通过读取电脑上的经授权文件夹,实现多类自主操作”。

这意味着,WorkBuddy的场景更多是明确文件夹约束下的有限操作。

这或许也折射了腾讯在该领域的“减法式”产品思考——它假设大多数职场人不仅关心“能不能把事做完”,也担心 AI 会不会捅娄子,于是选择的产品路线并不激进,而是看重稳定、可复用、可交付的执行结果。

WorkBuddy的推出,不仅标志着腾讯正式加入桌面Agent工具的市场竞争,更可视为大厂试图通过“智能体”这一新变量,重新定义职场效率边界的重要信号。 

腾讯入局的时机,恰好踩在了全球桌面Agent爆发的临界点上。 

就在不久前,OpenClaw等产品在技术社区迅速走红,用户惊叹于AI能够深度访问电脑系统、文件、甚至自主执行跨应用任务。

这种被称为“24小时待命贾维斯”的体验,让业界直言“桌面Agent的ChatGPT时刻”已经到来。

相比于目前市面上火爆的同类工具,WorkBuddy没有走纯极客路线,而是定位为面向非技术背景的职场人群。

这意味着,它不再要求用户具备编程知识,只需要通过自然语言描述需求,它就能像一个“懂行”的同事一样去执行任务。这种从“技术工具”向“职场助手”的范式转移,是腾讯对桌面Agent大众化的一次大胆尝试。 

据介绍,WorkBuddy可以直接在本地电脑自主规划并执行多模态复杂任务。具体来看,WorkBuddy具备两大特点: 

一是深度本地操作能力:,能够“听懂人话”并“真能操作本地文件”。

在获得授权后,它可以读取文件夹、批量处理文件、生成文档或PPT数据深度分析、行业调研、多任务 Agent 并行处理等。这意味着,它打破了传统AI“只能看、不能动”的尴尬局面,真正切入了办公的最后一公里。  

二是多步骤任务的自主规划,与简单的指令响应不同,WorkBuddy强调“带脑子思考”。

此外,WorkBuddy还内置了多种海内外的模型和主流 MCP Server 和 Skills 技能包等高阶功能,这使其在保持简单易用的同时,具备了极强的扩展性,能够应对金融、调研、创作等垂直细分场景的深度需求。

华尔街见闻获悉,WorkBuddy由腾讯云CodeBuddy团队开发,此前已在腾讯内部推出并启动内测,目前已经有超过2000名不同岗位员工参与深度使用,并在数据处理与分析、构建本地知识库、内容文案创作、海报生成、自动化办公等场景获得广泛应用。

长期以来,尽管大模型在对话框里表现得无所不知,但当用户回到真实的办公场景,面对繁杂的本地文件、琐碎的多任务切换时,大模型往往显得“手脚受限”。

如今,随着AI竞争进入下半场,行业竞赛的焦点正在从“比拼模型参数”转向“比拼落地能力”。单纯的聊天机器人已经无法满足职场人复杂、细碎且极度依赖本地文件的需求。谁能先占据用户的电脑桌面,谁就拿到了通往下一代“AI操作系统”的门票。 

OpenClaw等工具的爆红已经证明了用户对于“能跑在自己电脑里、深度操作应用”的Agent有着极度饥渴的需求。

腾讯此时出手,既是为了在一众先行者的包围中抢占生态位,也是为了将其深耕多年的企业服务能力,通过Agent这一载体进行智能化升级。

然而,在市场情绪被再次点燃的背后,WorkBuddy以及一众桌面Agent玩家也面临着挑战。

首当其冲的便是“越权”与“隐私”的博弈。桌面Agent的核心价值在于深度访问用户的电脑系统、文件和应用,这种深度的互动意味着用户必须让渡极高的系统权限。正如业界对OpenClaw“24小时待命贾维斯”的期待一样,越是强大的Agent,其掌握的个人偏好和本地项目数据就越详尽。

如何在提供便利的同时,确保这些敏感数据不被滥用或在网络传输中泄露,将是AI Agent产品必须面对的合规“生死线”。

腾讯云CodeBuddy 团队告诉华尔街见闻,WorkBuddy背后依靠CodeBuddy的安全保护机制,并通过 “沙盒隔离 + Skill 标准化 + 危险操作拦截”的多层防御策略来应对桌面 Agent 的部署挑战。

其核心思路是:"授权信任并验证" —— 信任用户指令意图,通过用户授权验证执行安全性和危险操作黑名单兜底机制。

此外,Agent与底座模型之间的“父子关系”也决定了其能力的上限与下限。

尽管桌面Agent可以通过工程手段优化执行路径,但Agent的基础能力依然由底层大模型施展。一旦底层模型出现“幻觉”或逻辑断裂,Agent在自动执行任务中或许也会带来严重后果。

更值得一提的是,桌面Agent的兴起,本质上是在重构人与计算机的交互关系。过去以来用户是应用之间的“搬运工”,在浏览器、办公套件和沟通工具间来回穿梭;而随着WorkBuddy这类桌面Agent的普及,未来的交互范式可能变为“以任务为中心”。

当一个Agent能够跨越应用、代表用户完成批量取消邮件订阅或整理价格差异等复杂任务时,传统的应用软件可能会逐渐沦为Agent调用的“技能包”。这意味着,未来的桌面生态竞争,可能不再是软件功能的堆砌,而是谁的接口更利于Agent调用,谁能提供更适配AI的操作环境。

从全球范围来看,桌面Agent的竞争才刚刚拉开大幕。不止Manus、OpenClaw、Claude Cowork等,还有其它不少同类产品纷纷抢滩上线。

当AI真正接管了我们的鼠标和键盘,那是效率的极致提升,也是对数字安全底线的全新考验。随着“桌面Agent大战”的硝烟四起,一场关于生产力范式的变革,已然兵临城下。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。