Playwright生产级RPA实战：反检测+Shadow DOM穿透+验证码人机协作的5个关键方案（附踩坑经验）

码农飞哥

411人浏览 · 2026-06-22 19:32:34

码农飞哥 · 2026-06-22 19:32:34 发布

文章目录

从Demo到生产，多平台自动化系统稳定运行的核心挑战与解决方案

做过自动化项目的人都知道，Demo跑通和生产环境稳定运行之间，隔着一条巨大的鸿沟。

最近复盘了一个多平台RPA项目，整理出5个最致命的坑，每个都是真金白银买来的教训。

1. 反检测：别用自带浏览器内核

Playwright自带的Chromium特征太明显，主流平台的反爬系统秒识别。解法是连接本机安装的Chrome，通过CDP协议控制，配合独立Profile隔离会话。

关键参数：

--disable-blink-features=AutomationControlled
通过CDP debug端口连接，而不是Playwright默认启动方式
每个平台独立Profile目录

这一步做对，反检测成功率直接从40%拉到95%以上。

2. Shadow DOM穿透：表单可能藏了10层

越来越多平台把关键表单放进Web Components的Shadow DOM里，page.locator()、page.query_selector() 在Shadow边界外完全失效。

我的方案：写JS递归遍历shadowRoot，按placeholder文本匹配输入框，不依赖随时可能变的CSS类名。递归深度上限设10层，覆盖目前遇到的所有场景。

这个方案的核心优势：对UI结构变化有很强的容错性。只要placeholder文案不变，表单怎么嵌套都能找到。

3. 验证码处理：不要硬解，做人机协作

滑块验证码自动识别率不稳定，强行破解反而触发更严格的风控。更聪明的做法：

注入MutationObserver实时监听DOM变化
检测到验证码关键词（滑块、安全验证等）立即触发告警
钉钉机器人秒级推送，支持@指定人
人工在浏览器窗口完成验证（30秒）
系统检测验证码消失，自动恢复执行

这种"人机协作"模式比硬解验证码靠谱得多。同样的思路在AI Agent系统里也适用：让机器做擅长的重复工作，需要判断的交给人。

4. 多账号Session串台：Cookie是隐形炸弹

共享浏览器实例处理多账号任务时，上一个账号的Cookie会"污染"下一个任务，导致操作到错误账号上。

方案：

每个平台独立浏览器Profile目录
任务开始前读取Cookie中的账号标识字段
当前登录账号与目标账号不匹配 -> 强制登出再登录
不依赖"上一次登录成功"的缓存假设

5. Chrome僵尸进程会拖垮整台机器

Chrome超过120秒无页面交互，大概率已经挂死。不主动清理的后果：内存持续增长直到机器卡死。

进程守护方案：

Watchdog线程定时检测Chrome活跃度
超时强制kill进程
主进程崩溃自动重启，带指数退避（避免秒崩秒启的死循环）
连续5次快速崩溃（<30秒）触发停机告警

总结

RPA最大的敌人不是技术难度，是平台UI的随时变化。

这5个问题的共同特点是：开发环境很难复现，只有在生产环境大规模运行时才会暴露。所以一定要有完善的日志、告警和自愈机制。

这些经验对做爬虫、做自动化测试、做AI Agent的同学都有参考价值。
在这里插入图片描述

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

ChatGPT 5.5 辅助测试用例生成实践：从支付回调接口到可验证的研发流程

AI Agent技术社区

2026年如何用Gemini镜像站辅助学术写作？

把Gemini融入学术写作流程，能从文献处理、初稿打磨到格式校对等环节释放大量时间。对于国内研究者，选择像RskAi这样无需复杂网络配置、集成多款先进模型的镜像服务，让技术直接服务研究思维。想一站式体验不同模型在学术辅助上的侧重，可以访问，从一个小任务开始，逐步建立自己的AI辅助写作方法。【本文完】

AI Agent技术社区

AI 中转站：企业大模型应用中容易被忽视的安全关键点

2026年3月，墨西哥三人初创团队遭遇AI密钥盗用危机，团队月度常规Google Cloud费用仅180美元，攻击者盗取Gemini关联API密钥后，48小时疯狂调用模型接口，产生82314.44美元（约56.8万元）账单，费用暴涨近455倍，远超企业账户流动资金，团队濒临破产。此次事件叠加多重隐患：API密钥权限自动扩张、平台无异常调用风控告警、密钥缺少分级隔离，且企业全量AI模型调用流量，缺少