前言:
? 很多小伙伴們反饋,在web自動化的過程中,經常會被登錄的驗證碼給卡住,不知道如何去通過驗證碼的驗證。今天專門給大家來聊聊驗證碼的問題,一般的情況下遇到驗證碼我們可以都可以找開發去幫忙解決,關閉驗證碼,或者給一個萬能的驗證碼!那么如果開發不提供幫助的話,我們自己有沒有辦法來處理這些驗證碼的問題呢?答案當然是有的,常見的驗證碼一般分為兩類,一類是圖文驗證碼,一類是滑動驗證碼!

關于圖文識別的驗證碼,之前已經出了相關的識別解決方案,今天就不做過多的介紹了,有興趣的小伙伴可以私聊領取配套的視頻資料。今天我們主要來聊聊滑動驗證碼如何去識別破解。
滑動驗證破解思路
關于滑動驗證碼破解的思路大體上來講就是以下兩個步驟:
? 1、獲取滑塊滑動的距離
? 2、模擬拖動滑塊,通過驗證。
? 聽起來是比較簡單,但是獲取滑塊滑動的距離,大多數小伙伴沒有思路,不知道怎么去獲取。其實要獲取下來也不難,關于這種滑動的驗證碼,滑塊和缺口背景都是分別是一張獨立的圖片,我們可以把這兩張圖片,下載下來借助于圖像識別的技術,去識別缺口在背景圖中的位置,然后減去滑塊當前所在位置,就可以得出需要滑動的距離。這個時候很多小伙伴會想圖像識別技術我不會啊,不會沒有關系,后面會給到大家一個封裝好的滑塊識別模塊,只要你傳入滑塊和缺口背景圖的元素節點就能計算出滑塊的缺口位置。
案例講解
話不多說,我們先來看一個案例(QQ空間登錄),這邊用到了一個我自己封裝的滑動距離識別的模塊slideVerfication,有需要的小伙伴可以私聊獲取。qq空間登錄案例實現步驟如下:
? 1、創建一個driver對象,訪問qq登錄頁面
? 2、輸入賬號密碼
? 3、點擊登錄
? 4、模擬滑動驗證
實現代碼
"""
============================
Author:檸檬班-木森
Time:2020/4/20 20:12
E-mail:[email protected]
Company:湖南零檬信息技術有限公司
============================
"""
import time
from selenium import webdriver
from slideVerfication import SlideVerificationCode
# 1、創建一個driver對象,訪問qq登錄頁面
browser = webdriver.Chrome()
browser.get("https://qzone.qq.com/")
# 2、輸入賬號密碼
# 2.0 點擊切換到登錄的iframe
browser.switch_to.frame('login_frame')
# 2.1 點擊賬號密碼登錄
browser.find_element_by_id('switcher_plogin').click()
# 2.2定位賬號輸入框,輸入賬號
browser.find_element_by_id("u").send_keys("123292678")
# 2.3定位密碼輸入輸入密碼
browser.find_element_by_id("p").send_keys("Python01")
# 3、點擊登錄
browser.find_element_by_id('login_button').click()
time.sleep(3)
# 4、模擬滑動驗證
# 4.1切換到滑動驗證碼的iframe中
tcaptcha = browser.find_element_by_id("tcaptcha_iframe")
browser.switch_to.frame(tcaptcha)
# 4.2 獲取滑動相關的元素
# 選擇拖動滑塊的節點
slide_element = browser.find_element_by_id('tcaptcha_drag_thumb')
# 獲取滑塊圖片的節點
slideBlock_ele = browser.find_element_by_id('slideBlock')
# 獲取缺口背景圖片節點
slideBg = browser.find_element_by_id('slideBg')
# 4.3計算滑動距離
sc = SlideVerificationCode(save_image=True)
distance = sc.get_element_slide_distance(slideBlock_ele,slideBg)
# 滑動距離誤差校正,滑動距離*圖片在網頁上顯示的縮放比-滑塊相對的初始位置
distance = distance*(280/680) - 22
print("校正后的滑動距離",distance)
# 4.4、進行滑動
sc.slide_verification(browser,slide_element,distance=100)
運行效果:

關于滑動驗證碼的識別問題就這樣解決了,那么接下來給大家來講講封裝的slideVerfication這個模塊的識別原理,其實關于這個模塊圖像識別,也是借助了第三方的圖像處理模塊來進行識別的,python中有很多現成的用來處理圖片的庫,這邊我使用的是opencv-python來進行識別的。slideVerfication模塊上面用到的兩個方法的部分參考代碼如下:
def get_element_slide_distance(self, slider_ele, background_ele, correct=0):
"""
根據傳入滑塊,和背景的節點,計算滑塊的距離
該方法只能計算 滑塊和背景圖都是一張完整圖片的場景,
如果背景圖是通過多張小圖拼接起來的背景圖,
該方法不適用,請使用get_image_slide_distance這個方法
:param slider_ele: 滑塊圖片的節點
:type slider_ele: WebElement
:param background_ele: 背景圖的節點
:type background_ele:WebElement
:param correct:滑塊缺口截圖的修正值,默認為0,調試截圖是否正確的情況下才會用
:type: int
:return: 背景圖缺口位置的X軸坐標位置(缺口圖片左邊界位置)
"""
# 獲取驗證碼的圖片
slider_url = slider_ele.get_attribute("src")
background_url = background_ele.get_attribute("src")
# 下載驗證碼背景圖,滑動圖片
slider = "slider.jpg"
background = "background.jpg"
self.onload_save_img(slider_url, slider)
self.onload_save_img(background_url, background)
# 讀取進行色度圖片,轉換為numpy中的數組類型數據,
slider_pic = cv2.imread(slider, 0)
background_pic = cv2.imread(background, 0)
# 獲取缺口圖數組的形狀 -->缺口圖的寬和高
width, height = slider_pic.shape[::-1]
# 將處理之后的圖片另存
slider01 = "slider01.jpg"
background_01 = "background01.jpg"
cv2.imwrite(background_01, background_pic)
cv2.imwrite(slider01, slider_pic)
# 讀取另存的滑塊圖
slider_pic = cv2.imread(slider01)
# 進行色彩轉換
slider_pic = cv2.cvtColor(slider_pic, cv2.COLOR_BGR2GRAY)
# 獲取色差的絕對值
slider_pic = abs(255 - slider_pic)
# 保存圖片
cv2.imwrite(slider01, slider_pic)
# 讀取滑塊
slider_pic = cv2.imread(slider01)
# 讀取背景圖
background_pic = cv2.imread(background_01)
# 比較兩張圖的重疊區域
result = cv2.matchTemplate(slider_pic, background_pic, cv2.TM_CCOEFF_NORMED)
# 獲取圖片的缺口位置
top, left = np.unravel_index(result.argmax(), result.shape)
# 背景圖中的圖片缺口坐標位置
print("當前滑塊的缺口位置:", (left, top, left + width, top + height))
return left
def slide_verification(self, driver, slide_element, distance):
"""
滑動滑塊進行驗證
:param driver: driver對象
:type driver:webdriver.Chrome
:param slide_element: 滑塊的元組
:type slider_ele: WebElement
:param distance: 滑動的距離
:type: int
:return:
"""
# 獲取滑動前頁面的url地址
start_url = driver.current_url
print("需要滑動的距離為:", distance)
# 根據滑動距離生成滑動軌跡
locus = self.get_slide_locus(distance)
print("生成的滑動軌跡為:{},軌跡的距離之和為{}".format(locus, distance))
# 按下鼠標左鍵
ActionChains(driver).click_and_hold(slide_element).perform()
time.sleep(0.5)
# 遍歷軌跡進行滑動
for loc in locus:
time.sleep(0.01)
ActionChains(driver).move_by_offset(loc, random.randint(-5, 5)).perform()
ActionChains(driver).context_click(slide_element)
# 釋放鼠標
ActionChains(driver).release(on_element=slide_element).perform()
? 關于滑動驗證碼識別就給大家分享到這里了,上述解決方案也有對應的講解視頻