Python如何識別驗證碼文字輸出?Python怎么使用ddddocr模塊識別驗證碼

雖然說到現在各種網站上的驗證碼形式層出不窮 , 但還是有很多網站是通過圖文驗證碼來進行校驗的 。而圖文驗證碼就是要識別處圖片之中的文字然后將其和真正值進行比對 , 如果相同就可通過校驗 。所以下面這篇文章小編會給大家分享一個簡單識別驗證碼的方法 , 往下看看吧 。

Python如何識別驗證碼文字輸出?Python怎么使用ddddocr模塊識別驗證碼


一、ddddorc庫
ddddorc庫是一個非常簡單的圖像文字識別模塊 , 它能夠輕松將各種驗證碼圖片之中的的字符識別并且讀取出來 。通過pip工具命令將其下載安裝好即可 , 不過需要注意python版本是要在3.0及其以上才可以用這個模塊的 , 示例如下:
pip install ddddocr二、使用模塊
因為這個模塊只是github上一個簡單的開源項目 , 所以并沒有對太多的版本進行適配 , 如果在使用時出現報錯等情況的話 , 那么就要降低一下python版本來使用它了 。
使用ddddocr模塊來完成圖文驗證碼識別是比較簡單的 , 導入模塊之中調用同名但首字母大寫的方法來實例化驗證碼識別對象 。然后用open()函數將驗證碼圖片打開并返回文件對象 , 之后就是用read()方法將這個圖像以二進制字節格式讀取出來 。
讀取出來之后使用驗證碼識別對象去調用classification()方法 , 并且將圖片數組作為參數傳遞進去即可 , 這樣就可以把文字識別出來了 , 詳細代碼示例如下所示:
import ddddocrocr = ddddocr.DdddOcr()with open('img_3.png', 'rb') as f:    img_bytes = f.read()result = ocr.classification(img_bytes)print(result)【Python如何識別驗證碼文字輸出?Python怎么使用ddddocr模塊識別驗證碼】最后還有一點使用需要注意的時 , 不能夠用這個模塊去識別其他圖像上的文字 , 因為大部分圖文驗證碼都是純底色或者是帶有細小條紋的 , 這樣可以簡單將背景去除掉忽略 。

    猜你喜歡