變形驗證碼CAPTCHA已過時,AI能辨識文字圖像的驗證碼、破解成功率高達6成,驗證碼保護失效

變形驗證碼已過時,最新AI系統破解成功率高達6成

為了區別人類與機器,一般在登入網路服務時,會需要輸入一組字型扭曲、上下顛倒的身份驗證碼(CAPTCHA),一般文字辨識系統難以識別驗證碼特殊的呈現方式,因此能防止機械人程式重複註冊或登入帳戶。美國一家AI新創Vicarious,最近研發出了一套可以模擬人類視覺系統,能順利破解驗證碼並轉換成文字。

AI 已經能辨識文字圖像的驗證碼

美國AI新創Vicarious 在《科學》雜誌發表了一份研究報告,表示已經研發出一款可以模擬人類視覺的 AI系統,能夠成功破解以文字圖像呈現的「Captcha」及「 reCaptcha」驗證碼系統。

CAPTCHA這個詞最早是在2002年被提出,透過讓用戶輸入圖片上扭曲、變形的文字或數字來判定人類用戶身份,Vicarious新研發的系統叫做「遞歸神經網路」(Recursive Cortical Network,RCN),可以透過機器學習演算法模擬人類大腦運作的模式,系統內的人工神經元會以外部輸入的數據資料為基礎,將遞歸神經網路的人工神經元結構化的,並建構一套模型,這套模型便能快速的模擬人類對於視覺的反應,學習文字的特徵、圖像的輪廓,進而破解驗證碼。

Vicarious新研發的「遞歸神經網路」系統,可以透過機器學習演算法模擬人類大腦運作的模式,進而辨識出文字輪廓。 

破解成功率高達6成,驗證碼保護失效 

透過神經元之間彼此的合作辨識出文字圖像,能破解Captcha驗證碼的「遞歸神經網路」系統的準確率已經達到66%,雖然成功率只有六成,但 Captcha 對於驗證碼的被讀取率標準,必須在1%以下,因此這套AI系統已經遠遠超越文字驗證碼系統所必須具備的保護程度,且已經具備在短時間內反覆嘗試成功破解驗證碼的能力。

「這些研究結果顯示以文字圖像呈現為主的『Captcha』已經過時。」 Vicarious 共同創辦人Dileep George說。隨著AI技術的發展,未來需要提升登入網路服務的驗證難度,才能避免被機器人破解,對資安專家來說,意味著現在的驗證碼系統將要過時。

Vicarious公布破解CAPTCHA圖像驗證的細節

專門研發遞歸皮質網路(Recursive Cortical Network,RCN)技術的Vicarious曾於2013年宣布他們可破解文字版的CAPTCHA圖像驗證,上周Vicarious正式於《科學》(Science)期刊上發表了研究細節,並揭露該公司選擇RCN的原因。

文字版CAPTCHA圖像驗證是在複雜的背景中顯示文字,以能否準確輸入文字來判斷使用者是人類或機器人,若一個演算法可達1%的成功率時,就視為破解了CAPTCHA。

不過,當Vicarious以單一模型進行測試時,在Google的reCAPTCHA上有66%的準確率,在BotDetect有64.4%,在Yahoo有57.4%,在PayPal達57.1%,而一個針對特定形式最佳化的模型最高則可達到90%的準確率。

Vicarious說,人類不經任何訓練就能辨識複雜背景中的文字,但坊間的光學辨識API並不理解物件,也無法將物件自背景中隔離,此外,諸如卷積神經網路(CNN)的深度學習技術在受訓後辨識CAPTCHA的效果也不佳。

根據實驗,深度學習技術縱使在經過230萬個訓練樣本後,準確度仍然遠不及只執行260個訓練樣本的RCN。

2011年創立Vicarious之所以受到矚目並不只因為該公司在RCN技術上的表現,還因為該公司的股東都大有來頭,包括臉書創辦人Mark Zuckerberg、Tesla創辦人 Elon Musk、Amazon創辦人Jeff Bezos、Yahoo共同創辦人楊致遠、Skype共同創辦人Janus Friis,以及Salesforce.com執行長Marc Benioff都曾先後注資Vicarious。


以文字圖像呈現為主的『Captcha』已經過時?think沒關係!反正沒有任何駭客的「機器人破解」可以在insoler註冊成功!yell

每天都有「世界各國駭客」光臨insoler,不斷嘗試註冊惡意帳號、廣告帳號

駭客想要在insoler註冊,只能自己動手註冊!yell但是只要亂貼廣告,馬上就會被全部刪除!yell

🍎たったひとつの真実見抜く、見た目は大人、頭脳は子供、その名は名馬鹿ヒカル!🍏

研究人員釋出unCAPTCHA,宣稱可破解語音版reCAPTCHA

美國馬里蘭大學(University of Maryland)的4名研究人員近日發表一自動化系統unCAPTCHA,宣稱可破解由Google打造的語音版reCAPTCHA,且準確率高達85.15%,並已藉由GitHub釋出了該系統。

Google的reCAPTCHA為全球最受歡迎的CAPTCHA系統之一,透過圖像來驗證來者是人類或機器人,以保護網路服務不被龐大的機器人所侵襲,估計至少有數十萬個網站採用reCAPTCHA。至於語音版的reCAPTCHA則是專為視障人士所設計,它在吵雜的背景環境中以不同的速度、音調或口音唸出數字,並要求使用者填入所聽見的數字。

而unCAPTCHA系統即是基於語音轉換成文字的技術,先下載語音版的CAPTCHA,把這些語音切割成個別的數字音頻,再將各個數字音頻上傳到網路上的各種語音轉文字服務,然後把這些服務的回應修改成數字,例如倘若聽起來像是「True」,那麼可以假設這個數字是「Two」,整合這些不同服務的結果,並將數字回傳至答案上。

unCAPTCHA所利用的線上語音轉換文子服務涵蓋了IBM、Google Cloud、Google Speech Recognition、Sphinx, Wit-AI與Bing Speech Recognition。

在研究人員的測試中,unCAPTCHA辨識個別數字的準確率高達92%,而整串CAPTCHA的準確率也達到85%以上。


很明顯「Google打造的語音版reCAPTCHA」也完全沒用!yell

🍎たったひとつの真実見抜く、見た目は大人、頭脳は子供、その名は名馬鹿ヒカル!🍏