← 返回文章列表

深度解析:YOLOV5入门与滑动验证码位置识别实战

前言yolo是大名鼎鼎的目标检测算法,其核心思维是(YouOnlyLookOnce),仅用一次就可得出结果,相比于传统的滑动窗口法可以获得巨大的性能提升。本文基于yolo的稳定版本v5进行实验,完成了滑动验证码空缺位置的识别任务,在少量的数

前言

yolo是大名鼎鼎的目标检测算法,其核心思维是(You Only Look Once),仅用一次就可得出结果,相比于传统的滑动窗口法可以获得巨大的性能提升。本文基于yolo的稳定版本v5进行实验,完成了滑动验证码空缺位置的识别任务,在少量的数据集上取得了比较不错的效果。本文不涉及算法原理讲解,仅侧重于实践应用,对底层感兴趣的同学可以移步【

你一定从未看过如此通俗易懂的YOLO系列(从v1到v5)模型解读

】。

环境

python3.9.13

windows10

CPU:R7-7840HS

GPU:无(集显)

YOLOV5

源码

git clone https://github.com/ultralytics/yolov5.git

模型

这里使用yolov5s模型,体积适中,效果也十分不错。更多模型可以进入官方仓库中下载。模型下载后可以放到yolo的根目录,在后续train.py中需要配置使用。

https://github.com/ultralytics/yolov5/releases/download/v7.0/yolov5s.pt

安装库

pip install -r requirements.txt

数据准备

我们从网易易盾

行为式验证码

手动下载30张滑动验证码的图片,如您希望结果更加准确,可以下载更多的图片加入训练集。当然,动手能力强的同学可以写个脚本自动下载,我这里偷个懒。