娛樂圈這種利益沖突上演的戲碼,就別來隔應統計學了。統計學是一門嚴肅的、綜合性科學,是門一級學科,包含了數理、社會科學和自然學科的各個領域,不僅可以推斷本質,還可以預測未來,直白的講,難的要死,反正我當年大學學的是云里霧里,勉強及格,到現在想起那個SPSS,都心有余悸。
關于那個啥桃的幾張PPT,看看就拉倒了,會做PPT的大有人在,會畫圖的也大有人在,要說是否嚴謹和準確,那就很難說了。
舉例子來講,咨詢類廣告公司,4A啥的,要幫品牌客戶做消費者分析,得委托專業的數據分析公司去做。而數據分析公司給出的案子之所以可以幾萬十幾萬的甚至更高的賣,必然因為用了科學的數據收集方法,你得確保了數據池足夠大,而且是活躍的,分析數據的維度合理或豐富等,來保證最終結論的準確度較高。而想要做到這些,國內一流的數據公司會花大力氣建設自己的數據庫,給網絡用戶打標簽,比如,年齡,興趣,有沒有孩子等等,還得確保不侵犯隱私。然后,幫客戶做用戶行為分析,推廣渠道分析,留存分析,等等。數據分析本身就是一個包羅萬象的概念。
說回這個肖戰粉分析,真正業內的大牙恐怕都笑掉了,不過可能人家也并不理會這些鬧劇。
首先這個數據獲取就有大問題,肖戰粉這個標簽本來就不科學。
如何判定的?
幫肖戰說話了?搜索了肖戰?關注了微博?買周邊了?買歌了?哪個角度起了決定性作用打的這個標簽?還是以上都符合才打的?這點很關鍵。數據選取方式必須科學,否則數據底層就有問題,還分析個P嘞。
如果你號稱數據科學,那我要問了,是微博給了用戶行為數據,還是騰訊給了購買肖戰專輯的用戶行為軌跡,還是天貓等電商給了購買肖戰代言用戶的行為軌跡?
你只要敢說有證據,那可好了,咱們敢起訴哦,泄露我網民的網絡隱私啊!!還敢不敢上網了?那反過來,如果你拿不到,你分析的是個啥?現在碎片化時代,用戶的時間散落在各個平臺上,你怎么抓取到的?如果只是一個微博的,那數據分析肯定不夠嚴謹。
另外一個,數據“查重”了沒?
數據公司之所以要花大力氣做數據庫,因為要抓取用戶,簡單說就是,怎么區別他就是他?我今天上網,我明天也上網,我今天穿黃色,我明天套個馬甲,我一會出現在這,一會出現在那,怎么區分?這個是有非常專業的技術來實現區分的。這樣數據才沒有水,才能做到準確。
好了,往深了說我就是班門弄斧了,看看算了。肖戰真是不容易。