利用爬蟲技術做圖像識別的準確率能有多高?
爬蟲技術經常會需要圖像識別,但圖像識別是另一個技術范疇,兩者不要混為一談。 那么,怎么進行圖像識別呢?
傳統的圖像識別,往往需要去噪,二值化,過濾,圖像變換,圖像分割等技術處理,然后根據處理后的圖像和圖庫比較,以識別出圖像。這里必須介紹opencv,最強大的圖像處理。這種辦法的識別率,就不好說了,可能很高,也可能很低。
現在由于人工智能的高速發展,不需要復雜的圖像處理,只需要用大量的圖像給神經網絡訓練模型,訓練完畢即可獲得高準確率的識別,識別率有多高取決于訓練的效果,頂尖的識別率已經超越人類,99%以上的準確率。注意,訓練往往需要大量的數據,1萬張通常是不夠的。
其實爬蟲中對圖像識別往往是驗證碼,驗證碼完全可以通過第三方接口識別,僅僅調用一下就可以,價格最低0.001一個碼。