使用Python识别验证码 ddddocr
发表于|更新于|开发
|浏览量:
GitHub 地址:https://github.com/sml2h3/ddddocr
安装
1 | pip install ddddocr |
如果 windows 安装报错:ImportError:DLL load failed: 找不到指定的模块。
需要安装 vc 运行库:
https://aka.ms/vs/16/release/VC_redist.x86.exe
https://aka.ms/vs/16/release/VC_redist.x64.exe
基本使用:
1 | import ddddocr |
初始化传参 show_ad=False 输出就不带作者的广告了。
文章作者: 张理坤
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 杂烩饭!
相关推荐
2026-05-13
Python 使用 Easyocr 进行图像识别
如果你有 NVIDIA GPU,可以额外安装 CUDA,提供更好的性能,没有 NVIDIA GPU,可以使用 CPU 计算。 easyocr 官方地址:https://github.com/jaidedai/easyocr 安装 pytorch1pip3 install torch torchvision torchaudio 安装 easyocr1pip3 install easyocr 精简输出默认情况下会输出:Neither CUDA nor MPS are available - defaulting to CPU. Note: This module is much faster with a GPU. 可以通过添加参数 verbose=False 来去掉这个提示。 默认会输出坐标、字符等信息,如果只需要输出字符,可以增加参数 detail=0 获得精简的输出。 1234import easyocrreader = easyocr.Reader(['en'], gpu=False, verbose=False) # 这里加载英文模型,如果需要识别...
2025-02-22
使用Python识别验证码 Muggle OCR
最近发现个 ddddocr,识别率很高,识别速度还很快:使用Python识别验证码 ddddocr 以前用过什么 pytesseract 识别效果很差,还需要电脑上安装 Tesseract OCR 的软件,但是使用下来,效果不好,后面也用过 PaddleOCR 可以识别,但是识别速度比较慢,成功率也不高。后面又看到了这个开源工具,吹牛逼比较厉害,号称自己是验证码识别的最高境界,就试试看。官方的 GitHub 地址是:https://github.com/litongjava/muggle_ocr 效果展示 环境OS: Windows 11Python: python-3.10.10-amd64 安装这个开源程序在 pypi 仓库上被移除了,需要在 GitHub 上将源码包下载下来安装。 下载到本地,解压后,打开 cmd 命令提示符, 123456REM 创建虚拟环境python -m venv venvREM 安装muggle_ocrcd muggle_ocr-mainpython setup.py install 报错处理error: numpy 2.2.1 is in...
2025-03-24
Python读写文件
使用 Python 读写文件很方便,有多种方法,但是读写大文件还是需要优化的。 python open 文件的模式: 模式 描述 r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。 r+ 打开一个文件用于读写。文件指针将会放在文件的开头。 rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。 w 打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。 wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。 w+ 打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。 wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。 a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 ...
2026-05-13
Django RestFramework 使用router生成路由
django 使用的是模块化结构,每个 app 都可以独立拆分,那么注册路由的时候也可以灵活一点, 使用 drf 框架提供的 router 来自动生成路由 应用级 urls.py 12345678910111213from django.urls import path, includefrom rest_framework import routersfrom app01 import viewsrouter = routers.DefaultRouter()router.register(r'groups', views.GroupViewSet)router.register(r'students', views.StudentViewSet)urlpatterns = [ path('/', include(router.urls)),] 这里 path 路径是/, 引用了 router, router 注册了两个路由, 分别是 groups 和 students, 生成的 api 路径就是 /...
2026-05-13
Python使用dotenv来管理环境变量
管理环境变量是一件比较麻烦的事情,好在 python 有 python-dotenv 可以帮助我们来简化这个操作 安装直接 pip 来安装就好 1pip install python-dotenv 使用创建.env 文件,记得添加到.gitignore 里面 .env 文件内容为键值对形式 12#这是注释FOO="BAR" 123456import dotenvimport osdotenv.load_dotenv()print(os.getenv("FOO")) shell 脚本怎么使用.env 文件123source .envecho $FOO

2026-05-13
selenium--web自动化工具
selenium 是一个 web 自动化工具,它可以控制 chrome 浏览器实现我们想要的功能,跟爬虫不同的是:它是模拟人类的操作。 安装下载对应版本的 chromedriverhttps://chromedriver.chromium.org/downloads放到 PATH 环境变量里, 如果是 mac,可以直接执行 1brew install chromedriver 安装 python 包1pip install selenium -i https://pypi.tuna.tsinghua.edu.cn/simple 编写脚本获取 xpath获取 xpath 可以按下 ctrl + shift + c 点击按钮, 高亮的地方右键复制 full xpath 获取 idCharome 浏览器界面按下 ctrl + shift + c 点击页面, 右边属性记录一下 html 的 id 属性 代码1234567891011121314151617181920#!/usr/bin/python# -*- coding: utf-8 -*-import timefrom...
评论
公告
此博客为我记录运维工作总结所用,供网友阅读参考,如有侵权,请通知我,我会核实后进行处理。
欢迎加入技术交流群:
