驗(yàn)證碼有什么用?
離考研還有不到90天了,全國(guó)學(xué)子在不分晝夜地復(fù)習(xí)的同時(shí),也開(kāi)始準(zhǔn)備各種報(bào)名事項(xiàng)了。前兩天是考研預(yù)報(bào)名的日子,但是成都大學(xué)的一位大四女生在填寫(xiě)網(wǎng)站登錄驗(yàn)證碼時(shí),竟然出現(xiàn)了“別考”字樣的驗(yàn)證碼。這難道……是冥冥之中自有天意?
這種飽含來(lái)自官方的惡意的驗(yàn)證碼似乎不止一個(gè),還有網(wǎng)友后來(lái)曝光自己的看到的驗(yàn)證碼是“任輸”。所以這屆考研是怎么回事?這才剛報(bào)名就已經(jīng)開(kāi)始瘋狂打擊考生了嗎?
有一個(gè)是意外,這有兩個(gè)了,難道真的是這屆考研特別難,天意要考生知難而退嗎?
其實(shí)啊,這種驗(yàn)證碼背后都是有一個(gè)專(zhuān)門(mén)詞庫(kù)的,會(huì)出現(xiàn)“別考”“任輸”這種詞,并不是詞庫(kù)已經(jīng)智能到能分析你的智商和復(fù)習(xí)成果從而進(jìn)行勸退,而是背后調(diào)皮的程序員大哥把這種詞放進(jìn)了詞庫(kù)中,然后不幸被這兩位考生碰到了。
話(huà)說(shuō)回來(lái),驗(yàn)證碼原本是一種區(qū)分用戶(hù)是計(jì)算機(jī)還是人的公共全自動(dòng)程序,可以防止惡意破解密碼、刷票、論壇灌水等。現(xiàn)在你在幾乎所有網(wǎng)站登錄都需要輸入驗(yàn)證碼,大多數(shù)網(wǎng)站的驗(yàn)證碼都比較親切,搞個(gè)ABC123就可以了,有些比較復(fù)雜的是輸入漢字。
再麻煩一點(diǎn)的就是以問(wèn)答形式來(lái)進(jìn)行填寫(xiě)的驗(yàn)證碼,這種喪心病狂的驗(yàn)證碼,相信大家在12306上已經(jīng)看到不少了。還記得2015年這種超高難度的驗(yàn)證碼還讓不少買(mǎi)票用戶(hù)開(kāi)始懷疑人生,懷疑是不是以后文盲都不準(zhǔn)回老家了。
其實(shí)這種奇葩驗(yàn)證碼不逛讓國(guó)內(nèi)用戶(hù)抓狂,人家老外碰上了一樣心態(tài)要崩。
看到這里估計(jì)又網(wǎng)友要問(wèn)了,這么反人類(lèi)的驗(yàn)證碼機(jī)制,留著干嘛?正常用戶(hù)都不方便進(jìn)行驗(yàn)證了,到底防的是誰(shuí)?。?/p>
然而用戶(hù)要怪,還真不好說(shuō)具體要怪誰(shuí),畢竟大多數(shù)網(wǎng)站都沒(méi)那個(gè)精力自己去搞驗(yàn)證碼技術(shù)或者每天更新背后圖庫(kù),就會(huì)把相關(guān)工作外包給其他技術(shù)公司,比如12306的驗(yàn)證碼其實(shí)就是外包給杭州微觸科技有限公司,所以大家冤有頭債有主,千萬(wàn)別再亂扎12306的小人啦。
再要網(wǎng)上追根述源,現(xiàn)在許多網(wǎng)站采用的驗(yàn)證碼技術(shù)都來(lái)源于谷歌在2009年推出的一個(gè)項(xiàng)目,直到現(xiàn)在,仍有許多網(wǎng)站還在使用由 Google 提供的 reCAPTCHA 服務(wù)(link)。不過(guò)和許多網(wǎng)站提供的詞庫(kù)不同的是,谷歌希望在保障用戶(hù)信息安全的同時(shí)也能讓用戶(hù)的這部分行為不至于做白用功,所以谷歌在圖庫(kù)中特別提供了一些辨識(shí)度不高或者有污漬的驗(yàn)證碼,然后把驗(yàn)證數(shù)據(jù)收集起來(lái),以便將來(lái)使用電腦程序自動(dòng)辨識(shí)受損文獻(xiàn)或者模糊的圖片。
舉例來(lái)說(shuō),一開(kāi)始機(jī)器掃描一本古籍,出來(lái)的是這樣的圖片。
然后人工智能再進(jìn)行初步處理,但是這階段大多生成出來(lái)的東西都會(huì)讓開(kāi)發(fā)者覺(jué)得自己開(kāi)發(fā)的不是人工智能,而是人工智障……
但是如果有了廣大用戶(hù)提供的驗(yàn)證數(shù)據(jù),最后呈現(xiàn)的文字雖然可能仍有一點(diǎn)小錯(cuò)誤,但比起原版可就變得清楚多了。
這種技術(shù)如果能被應(yīng)用在識(shí)別受損古籍碑文上,那用戶(hù)的每次輸入驗(yàn)證碼,將不光是給自己的信息增添一道安全鎖,更是為人類(lèi)做貢獻(xiàn)啊!