FEATUREDHacker News 首页· rssEN16:03 · 04·28
Cua 发布 macOS 后台操控工具,AI 智能体操作应用时不再抢你的鼠标
Cua 开源了一个叫 Cua Driver 的工具,专门给 macOS 14 以上系统用。它能让 AI 智能体在后台直接点击、打字、滚动和读取应用界面,全程不抢你的鼠标光标。实现上用了 SLEventPostToPid 接口和类似 yabai 的窗口聚焦但不置顶的技巧,还加了一个 (-1,-1) 坐标的预点击来避免 Chromium 应用丢点击的问题。...
#Agent#Tools#Cua#Claude Code
精选理由
我会先打个折:这是个人项目 Show HN,不是大厂发布,也没有多源交叉验证,所以分数停在 78 这个档位。但 HKR 三项都站得住——它瞄准的是 macOS GUI Agent 里光标被抢、点击丢失这些真实失败模式,技术细节给得够,而且多 Agent 宿主机输入隔离这个方向确实值得盯。
一句话点评
Cua 让 AI 能在 macOS 后台操控应用,全程不抢鼠标,但多智能体同时跑一台机器时的输入隔离问题还没解决。
锐评
Cua 开源的这个 Driver 工具解决了一个很实际的痛点:让 AI 智能体在 macOS 后台操作应用时,不再霸占你的鼠标光标。实现上用了 SLEventPostToPid 接口直接把点击、打字事件塞给目标进程,配合类似 yabai 的窗口聚焦但不置顶的技巧,还加了一个 (-1,-1) 坐标的预点击来避免 Chromium 类应用丢点击的老毛病。
这套方案目前只支持 macOS 14 以上,正文没提 Windows 和 Linux 的支持时间表。另外,他们自己点出了一个关键限制:当多个智能体共用一台主机时,输入隔离还没做好。这意味着如果你同时跑两个 AI 任务,它们可能会互相干扰,这点在生产环境里是个硬伤。
整体看,这是个实用的底层工具,适合想在自己 Mac 上跑桌面自动化智能体的开发者。但别指望它现在就能稳定支撑多租户场景,那个输入隔离的坑还没填。
HKR 分解
hook ✓knowledge ✓resonance ✓