https://github.com/UB-Mannheim/tesseract/wiki pytesseract除了要install还需要到这里下载软件安装
二值化思路:先把图片转成灰度,然后threshold的值是一个自己设的值,颜色区间是0-255,所以这个threshold值就设一个中间值左右,例如140,那么这张灰度图片中140以上的值全部变成255,140以下的全部变成0,for循环就是为了遍历图片中每一个像素点,直到遍历完成,图片就会变成只要黑和白两种颜色。
ps:二值化的作用是非常简单的图片处理,但如果是多种颜色的验证码,因为颜色会的差会导致二值化处理时候归为了白色,所以这个作用不大,但如果是识别正常的图片文字上面那个pytesseract是挺好用的,如果要识别中文记得放入中文包才行。