傳統(tǒng)行業(yè)如何更好地與大數(shù)據(jù)相結(jié)合?
傳達(dá)與業(yè)務(wù)利益相關(guān)者有效合作的技巧,并作為數(shù)據(jù)科學(xué)家提供價(jià)值
我們的教育系統(tǒng)傾向于強(qiáng)調(diào)硬技能,大學(xué)畢業(yè)后,我的主要重點(diǎn)是盡可能多地學(xué)習(xí)數(shù)據(jù)實(shí)踐和技術(shù),并擅長(zhǎng)我的技術(shù)技能。我仍然是一個(gè)極客和重視學(xué)術(shù)知識(shí),但在各個(gè)行業(yè)工作后,我開始意識(shí)到軟技能是打開技術(shù)技能的價(jià)值的關(guān)鍵。投資者、億萬(wàn)富翁沃倫?巴菲特(Warren Buffett)在接受采訪時(shí)表示,”比現(xiàn)在多值50%的一條簡(jiǎn)單方法就是磨練你的溝通技巧”。溝通是我過(guò)去績(jī)效評(píng)估中常見(jiàn)的改進(jìn)領(lǐng)域,我認(rèn)為其他人也會(huì)與我聯(lián)系,因?yàn)長(zhǎng)inkedIn分享,溝通在美國(guó)技能差距排行榜上名列第一。在潮汐,我有幸與那些幫助我把這種弱點(diǎn)轉(zhuǎn)化為力量的人一起工作,因此,我想在這篇文章中分享幫助我成為一個(gè)更好的溝通者的主要技巧。溝通框架我們,數(shù)據(jù)人,要求商務(wù)人士更注重?cái)?shù)據(jù)驅(qū)動(dòng),但我們是以業(yè)務(wù)為導(dǎo)向的嗎?在一般溝通時(shí),重要的是要從為什么西蒙·西內(nèi)克在他著名的泰德演講中所說(shuō)。但是,在機(jī)器學(xué)習(xí)項(xiàng)目方面,什么是”為什么”呢?當(dāng)成為數(shù)據(jù)科學(xué)家時(shí),我們經(jīng)常被告知,這是培訓(xùn)模型并驗(yàn)證它們。然而,這確實(shí)是”如何”,而不是”為什么”。那么,數(shù)據(jù)科學(xué)項(xiàng)目背后的”原因”是什么呢? “為什么”總是與實(shí)現(xiàn)某種商業(yè)目標(biāo)有關(guān)。無(wú)論是通過(guò)自動(dòng)化獲得更多的客戶還是提高流程效率,始終有一個(gè)業(yè)務(wù)目標(biāo)。創(chuàng)造價(jià)值的不是模型培訓(xùn)本身,而是模型的使用。正如約書亞·塞登在他的著作《產(chǎn)出超過(guò)產(chǎn)出的結(jié)果》中所解釋的那樣,這改變了我們從產(chǎn)出到結(jié)果的心態(tài)。我們?nèi)绾巫龅竭@一點(diǎn)?金字塔原理是做到這一點(diǎn)的好方法。我們可以從”為什么”開始,捕捉我們想要實(shí)現(xiàn)的目標(biāo)(例如優(yōu)化發(fā)票收集策略,為我們的會(huì)員增加 NPS 分?jǐn)?shù))。稍后,我們可以繼續(xù)使用”如何”,解決我們?yōu)閼?yīng)對(duì)這一挑戰(zhàn)而可以遵循的不同方法(例如自動(dòng)發(fā)票追逐問(wèn)題、預(yù)測(cè)高風(fēng)險(xiǎn)發(fā)票、推薦收款解決方案)。最后,我們可以詳細(xì)闡述每個(gè)解決方案,并包括更多細(xì)節(jié)(例如預(yù)期影響、可交付性、項(xiàng)目復(fù)雜性、實(shí)驗(yàn)技術(shù))。有了這種自上而下的思想結(jié)構(gòu),聽眾可以盡快理解每個(gè)論點(diǎn)的相關(guān)性,并在需要時(shí)積極指導(dǎo)對(duì)話。項(xiàng)目的透明度模型或見(jiàn)解不被使用和遺忘并不罕見(jiàn),從經(jīng)驗(yàn)來(lái)看,業(yè)務(wù)和數(shù)據(jù)團(tuán)隊(duì)之間的不協(xié)調(diào)是其背后的主要原因之一。這些數(shù)據(jù)科學(xué)項(xiàng)目中反復(fù)出現(xiàn)的錯(cuò)誤是,從構(gòu)想階段開始,無(wú)法與業(yè)務(wù)取得聯(lián)系,這通常會(huì)導(dǎo)致大量返工以使任何模型運(yùn)行。數(shù)據(jù)科學(xué)家應(yīng)該與產(chǎn)品團(tuán)隊(duì)討論決策項(xiàng)目的各種主題:成功的定義——一個(gè)項(xiàng)目應(yīng)該始終有特定的目標(biāo),可以帶來(lái)商業(yè)價(jià)值。因此,數(shù)據(jù)科學(xué)家應(yīng)該對(duì)企業(yè)最重要的課題可能是這個(gè)項(xiàng)目的成功是什么樣子,以及如何衡量它。這還應(yīng)確定模型目標(biāo)以及模型目標(biāo)的任何代理的定義(如果與成功標(biāo)準(zhǔn)不同)。有一篇關(guān)于某人如何在這里陷害機(jī)器學(xué)習(xí)問(wèn)題的好文章。在測(cè)試了假設(shè)后,我們可能會(huì)發(fā)現(xiàn)跟蹤指標(biāo)中的權(quán)衡取利,數(shù)據(jù)科學(xué)家可以幫助企業(yè)了解權(quán)衡的影響。運(yùn)營(yíng)問(wèn)題——正如之前討論的那樣,模型在運(yùn)行時(shí)主要產(chǎn)生價(jià)值。為了避免項(xiàng)目交付的延遲,我們應(yīng)該盡早問(wèn)以下問(wèn)題:”如何使用某個(gè)模型?”,”您多久需要更新一次預(yù)測(cè)?”,”誰(shuí)將使用這些數(shù)據(jù)?”否則,錯(cuò)誤的假設(shè)可能導(dǎo)致過(guò)度設(shè)計(jì)的建筑解決方案和錯(cuò)誤的培訓(xùn)數(shù)據(jù)集。數(shù)據(jù)集和可解釋性-功能是實(shí)體的屬性,可以幫助我們預(yù)測(cè)某個(gè)事件。編寫一個(gè)數(shù)據(jù)集來(lái)培訓(xùn)模型階段需要大量的域知識(shí),并建議在此階段引入幾個(gè)在特定領(lǐng)域具有豐富經(jīng)驗(yàn)的人員。機(jī)器學(xué)習(xí)應(yīng)用于對(duì)風(fēng)險(xiǎn)敏感的環(huán)境中(這在像 Tide 這樣的金融科技公司中很常見(jiàn)),對(duì)于利益相關(guān)者來(lái)說(shuō),能夠不同意或同意模型而不成為 ML 專家是很有用的。換句話說(shuō),要具有可解釋的功能,商業(yè)專家將能夠感知檢查,幫助建立ML和業(yè)務(wù)之間的信任。精益實(shí)踐——不僅要了解成功是什么樣子(即我們需要前進(jìn)的方向),還要了解為了創(chuàng)造有價(jià)值的東西而必須達(dá)到的最低范圍。由于業(yè)務(wù)方面的人往往缺乏技術(shù)背景,數(shù)據(jù)科學(xué)家應(yīng)該將最低可行精度帶到表中,從而影響模型技術(shù)的努力和決策。這基本上是模型需要達(dá)到的最低精度,以便有合理的情況下將模型投入生產(chǎn)。它不代表所需的精度,但更多的是一個(gè)最低邊界,使項(xiàng)目去/不去決定。在這些討論中,數(shù)據(jù)科學(xué)家需要向利益攸關(guān)方強(qiáng)調(diào),所選的最低準(zhǔn)確性可能無(wú)法通過(guò)獲得的數(shù)據(jù)和訓(xùn)練有素的模型實(shí)現(xiàn),因此,還應(yīng)商定這一階段(通常為 1–2 沖刺)的可接受時(shí)間框。回顧-溝通是雙向的,我們是在潮汐敏捷實(shí)踐和反饋周期的超級(jí)粉絲。我們邀請(qǐng)回顧性會(huì)議的利益相關(guān)者共同思考項(xiàng)目中的好壞。例如,挑戰(zhàn)如何處理某些攔截器或限制可能會(huì)為數(shù)據(jù)團(tuán)隊(duì)與產(chǎn)品團(tuán)隊(duì)的互動(dòng)創(chuàng)建新的實(shí)踐和提示。創(chuàng)建數(shù)據(jù)文化投入時(shí)間創(chuàng)建一家注重?cái)?shù)據(jù)的公司大有裨資,應(yīng)該能夠在數(shù)據(jù)部門和其他規(guī)模上實(shí)現(xiàn)更輕松的溝通。數(shù)據(jù)團(tuán)隊(duì)最近在大多數(shù)公司中引入,與其他更成熟的職能(如財(cái)務(wù)或法律職能)相比,它們往往與其他業(yè)務(wù)沒(méi)有很好地整合。除此之外,他們沒(méi)有眾所周知的做法和流程。有各種方法可以彌補(bǔ)這一差距:數(shù)據(jù)團(tuán)隊(duì)可以集體開始記錄許多商定的過(guò)程(例如,我們?nèi)绾螠y(cè)試假設(shè),如何在風(fēng)險(xiǎn)策略中使用統(tǒng)計(jì)模型)和常見(jiàn)術(shù)語(yǔ)(例如,功能、機(jī)器學(xué)習(xí)模型、基本模型性能指標(biāo))。這樣,數(shù)據(jù)科學(xué)家就不需要多次研究相同的概念。培訓(xùn)或”午餐和學(xué)習(xí)”類型的活動(dòng)也有助于知識(shí)共享(例如,機(jī)器學(xué)習(xí)項(xiàng)目的生命周期階段是什么,每個(gè)團(tuán)隊(duì)在每個(gè)階段的作用是什么)。這些通常會(huì)引起數(shù)據(jù)科學(xué)領(lǐng)域的很多關(guān)注,這些團(tuán)隊(duì)還沒(méi)有機(jī)會(huì)與數(shù)據(jù)部門合作。以數(shù)據(jù)問(wèn)答會(huì)話的形式阻止通信時(shí)間也可以使數(shù)據(jù)團(tuán)隊(duì)更接近業(yè)務(wù)需求。最后,其他游擊戰(zhàn)術(shù),如在工作通信平臺(tái)上發(fā)布可交付數(shù)據(jù)的見(jiàn)解和測(cè)量的影響,可能會(huì)打破我們與組織其他成員之間看不見(jiàn)的孤島。