對于想要構建新功能和更好地開展創新的開發者與工程師們來說,數據有著極高的價值。
然而現實是,這些數據通常高度敏感且無法訪問,在合規性和鎖定狀態的處理上也相當麻煩。
好消息是,大約半年前,由前美國國家安全局(NSA)和亞馬遜工程師組建的一支團隊,就已經在致力于打造一個“適用于數據托管的GitHub平臺”了。
據悉,前NSA和亞馬遜工程師們創立了一家名叫Gretel的初創企業,旨在幫助開發者對敏感數據展開實時、安全地共享。
聯合創始人之一的AlexWatson(其他創始人包括JohnMyers、AliGolshan和LaszloBock)描繪了一個常見的問題:
通常情況下,開發者無需訪問數據庫的完整權限,而是只請求一部分或某個特定的示例。然而在用于酷炫的案例之前,平臺首先得確保數據能夠被安全地共享。
好消息是,以GitHub為代表的企業,已經證實了此類源碼分享平臺的廣闊前景、且有助于簡化代碼的訪問和協作。目前他們缺少的,只是與GitHub體量相當的數據。
AlexWatson補充道:“外媒當前正在開發的軟件,已允許開發者自動檢出數據集的匿名版本”。
這種所謂的‘合成數據’,實質上是人造出來的。其外觀和工作方式,有些類似于常規的敏感用戶數據。
Gretel使用機器學習對數據進行分類(如名稱、地址和其它客戶標識符),并為數據分配盡可能多的類型標簽。
一旦該數據被標記,即可應用訪問策略。然后借助匿名處理大量數據的差異化隱私技術,使之不再與客戶信息捆綁到一起。
顯然,這種借助機器學習生成的完全人造的數據集,已經引起了業內的廣泛關注。此外值得一提的是,Gretel計劃采用與亞馬遜云服務類似的按需收費政策。
目前這家初創企業已經拿到由GreylockPartners牽頭的350萬美元種子輪資金,其它投資者包括MoonshotsCapital、VillageGlobal和幾位天使投資人。