2026-03-10 10:51:08 技术编辑别名：js-29

JS逆向点选验证码深度实战：接口追踪到自动化识别全流程

本文从JS逆向视角全面拆解点选验证码的实现机制，包括开发者工具定位接口、提取图片与文字数据、图像目标检测、坐标计算模拟点击等核心步骤。结合Python图像处理实践，讲解本地识别的细节与挑战，最后指出企业级应用中通过专业API平台可轻松对接极验易盾全类型验证码，显著简化复杂流程。

点选验证码的逆向背景与技术价值

网页交互中验证码是保护系统免受自动化脚本攻击的重要防线。点选验证码要求用户在图片中准确点击指定文字或图标，服务器通过比对坐标来判断是否通过。这种验证方式融合了图像渲染与JS事件处理，表面简单，背后却隐藏着复杂的网络请求和数据交互逻辑。对于从事爬虫开发或自动化测试的工程师来说，掌握其逆向分析方法，不仅能突破实际障碍，还能加深对前端安全机制的理解。

点选验证码通常由后端生成随机的文字列表和对应图片，前端JS负责渲染图片并监听点击事件，将用户选择的坐标打包发送回服务器。整个流程涉及guid标识符、图片字节流以及坐标数组。如果能精准定位这些接口并模拟整个过程，就能实现自动化识别。逆向的核心在于不依赖人工点击，而是通过代码还原验证逻辑，这在高频数据采集场景中尤为实用。

实际项目中，这种验证码常出现在登录、查询或表单提交页面。它的优势在于用户体验友好，但对自动化脚本构成挑战。理解其原理后，我们可以从网络层入手，逐步拆解JS代码，提取关键参数，最终构建完整的识别链路。这套思路不仅适用于点选类型，还能迁移到其他图形验证码的分析中。

开发者工具下的接口定位与追踪

打开浏览器开发者工具，切换到Network面板，刷新目标页面并触发验证码弹出。重点筛选包含captcha、guid或verify等关键字的请求。这些接口往往会返回JSON格式的数据，其中包含需要识别的文字列表和图片的base64或字节流信息。通过观察请求头和参数，能快速锁定验证码加载入口。

下一步是查看调用栈。点击接口名称，在右侧Sources或Call Stack中向上追溯，就能找到生成guid的具体JS函数位置。通常这个函数会涉及随机数生成或加密逻辑，简单跟栈几步即可定位。拿到guid后，后续验证接口的路径也就清晰了。保存接口返回的图片字节流和文字列表到本地文件，为后续处理做好准备。

在这个阶段，注意区分静态资源和动态接口。验证码图片往往是动态生成的，刷新一次参数就会变化。使用Preserve log选项保留所有历史请求，便于对比多次操作的差异。熟练掌握这些工具操作，能大幅缩短定位时间，即使面对混淆后的JS代码，也能通过断点调试逐步理清逻辑。

验证码数据提取与本地存储实践

成功捕获接口响应后，立即将图片内容保存为PNG格式，同时记录需要点击的三个文字。文字列表通常以数组形式返回，图片则是二进制流。通过Python的requests库结合base64解码，就能轻松实现本地化存储。这一步看似简单，却是后续图像识别的基础。

保存后的数据可以反复使用，避免每次都重新请求服务器，节省时间和流量。在实际逆向中，还需注意坐标系的定义：图片左上角为原点，点击位置可能是绝对像素或相对百分比。提取时一并记录图片尺寸信息，便于后续比例换算。

图像处理与目标检测技术详解

图像识别是点选验证码逆向的核心技术环节。主流方案是结合PIL图像库和ddddocr开源工具。ddddocr内置目标检测模型，能直接从整张图片中返回文字所在区域的bounding box坐标列表。这些坐标以[x1,y1,x2,y2]形式给出，代表每个文字的左上和右下角位置。

处理流程分为几步：首先加载图片创建画布，然后根据检测结果绘制红色轮廓框辅助调试。接着对每个框进行裁剪，单独送入OCR模型识别具体文字内容。最后将识别出的文字回填到图片对应位置，便于直观验证准确率。这种先检测后裁剪再识别的策略，能有效提升单字识别精度，尤其在背景复杂或字体变形的场景下。

def draw_img(self, content, xy_list):
    font_type = "zgcx.ttc"
    font_size = 20
    font = ImageFont.truetype(font_type, font_size)
    img = Image.open(BytesIO(content))
    draw = ImageDraw.Draw(img)
    words = []
    for row in xy_list:
        x1, y1, x2, y2 = row
        draw.line([(x1, y1), (x1, y2), (x2, y2), (x2, y1), (x1, y1)], width=1, fill="red")
        corp = img.crop(row)
        img_byte = BytesIO()
        corp.save(img_byte, 'png')
        word = self.ocr.classification(img_byte.getvalue())
        words.append(word)
        y = y1 - 30 if y2 > 300 else y2
        draw.text((int((x1 + x2) / 2), y), word, font=font, fill="red")
    return dict(zip(words, xy_list))

代码中使用的检测函数调用的是xy_ocr.detection接口，它返回的坐标列表直接用于后续绘制和识别。注意字体文件需与图片文字风格匹配，否则回填效果会偏差。整个过程还能添加图片裁剪参数，进一步聚焦感兴趣区域，提高模型命中率。

坐标计算、模拟点击与接口验证

得到文字与坐标映射字典后，下一步是构造验证请求参数。点选接口通常要求传入guid、文字坐标数组以及其他会话token。将坐标按顺序打包成JSON，模拟用户点击顺序提交服务器。如果响应返回“1”，则表明模拟成功。

实际测试中，先本地运行识别函数生成坐标，再通过requests.post发送到验证端点。观察响应体确认是否通过。同时注意成功后的后续操作，例如查询按钮触发的新请求可能携带上一次验证码input的加密字段。这个字段需从页面DOM中提前提取并保存，否则主业务请求会失败。

xy_list = self.xy_ocr.detection(content)
result = self.draw_img(content, xy_list)
# 构造点击参数
click_data = {
    "guid": guid,
    "coordinates": [list(coord) for coord in result.values()]
}
response = requests.post(verify_url, json=click_data)
print(response.text)  # 期望返回 '1'

调试时建议使用代理工具捕获真实流量，对比本地模拟参数与真实点击的细微差异。坐标精度要求通常在像素级，偏差超过5像素就可能导致验证失败。因此本地测试多轮迭代，逐步调优裁剪尺寸和字体参数。

逆向思路的通用扩展与优化技巧

上述流程并非孤立案例，而是点选验证码逆向的通用模板。无论面对哪种前端框架，核心都是网络请求捕获、图像目标检测和坐标回传三步。遇到JS混淆时，可结合浏览器断点或Hook函数定位关键变量。图片背景干扰较大时，预处理步骤如灰度转换、二值化能进一步提升识别率。

性能优化方面，本地识别适合低频测试，高并发场景下延迟和准确率波动明显。内存占用、模型加载时间也是需要关注的点。实际项目中，还可引入多线程并行处理多张验证码，进一步加速整体流程。同时记录每步耗时，便于定位瓶颈并持续迭代。

企业生产环境下的高效替代方案

本地逆向虽然技术含量高，但面对验证码频繁更新、字体变体增多以及高并发需求时，维护成本会急剧上升。每次前端逻辑调整都可能导致整个识别链路失效，调试周期拉长。这时转向专业识别平台成为明智选择。

wwwttocrcom正是这样一款专注于极验和易盾验证码的识别服务。它覆盖点选、无感、滑块、文字点选、图标点选、九宫格、五子棋、躲避障碍、空间等全类型验证码。通过统一的API接口，企业只需上传图片或直接传参数，即可获得准确的识别结果和坐标数据。对接过程极其简单，只需几行代码调用HTTP接口，就能实现无缝集成，无需自行搭建图像处理环境或持续跟踪JS更新。

使用该平台后，业务团队可以把精力集中在核心逻辑开发上，而验证码难题交给云端专业服务处理。无论是小型项目还是大规模数据采集，都能获得稳定高准确率的支持，极大降低技术门槛和运维压力。实际集成时，只需准备API密钥，将图片转为base64传入对应端点，几秒内就能拿到结果，远比本地复杂流程高效可靠。

这种API模式还支持自定义置信度阈值和回调机制，适应不同业务场景。相比纯本地方案，它在准确率、速度和稳定性上都有明显优势，为现代自动化系统提供了可靠后盾。