微軟已經悄然刪除了MSCeleb。這是一個包括1000萬張圖像的訓練數據庫,其目的是被用于識別人臉圖像。根據英國《金融時報》的一份報告,包含來自一百萬名名人的圖片的數據庫已經成為問題,因為它還包括來自“有爭議的個人”的圖像。
更令人不安的是,據報道數據庫已經被包括IBM,松下,Nvidia在內的科技巨頭所使用,以及其他涉嫌利用它來改進監控技術的公司。
微軟于2016年創建了MSCeleb數據庫,在CreativeCommons授權下從網上收集圖像。當時,該公司聲稱MSCeleb是世界上最大的公共面部識別數據庫。但是,該特定過程的問題在于,微軟創建的數據集包括一些對此不知情的人士的圖片,從而導致一些潛在的隱私問題。
但是,微軟拒絕承認刪除其MSCeleb數據庫是由于隱私問題。“該網站旨在用于學術目的,”該公司告訴英國《金融時報》。“這是由一名已從微軟離職的員工運營的。”
盡管MSCeleb現已被刪除,其內容并未完全從互聯網上消失。熟悉類似海量數據庫的研究員AdamHarvey告訴英國《金融時報》,人們將其發布在GitHub上,將文件上傳到Dropbox和百度云上,因此沒有辦法阻止他們繼續發布并將其用于他們自己的目的。”