頭條的推薦量是怎么形成的?
我從大數(shù)據(jù)、機(jī)器學(xué)習(xí)算法專業(yè)角度來(lái)回答問(wèn)題:
1、頭條很可能采用協(xié)同過(guò)濾算法,這個(gè)算法可以從用戶緯度和商品緯度為用戶推薦。常采用計(jì)算相似度等方法,也可采用計(jì)算同現(xiàn)矩陣的方法來(lái)實(shí)現(xiàn),總之還是比較成熟的算法,JAVA、python、scala等語(yǔ)言都有成型的計(jì)算框架,比如JAVA的mahout,python的sklearn,scala語(yǔ)言的MLib等。我原來(lái)教學(xué)的時(shí)候讓學(xué)生自己寫代碼實(shí)現(xiàn)不準(zhǔn)使用框架,什么時(shí)候使用框架?工作了再用。
2、關(guān)聯(lián)分析apriori算法這是個(gè)經(jīng)典算法,雖然頻繁訪問(wèn)數(shù)據(jù)庫(kù),但是實(shí)現(xiàn)簡(jiǎn)單,當(dāng)然你也可以用FP—Growth算法不產(chǎn)生候選項(xiàng)目集。關(guān)聯(lián)算法的理論基礎(chǔ)是概率論中的條件概率,即在購(gòu)買A產(chǎn)品的同時(shí)又購(gòu)買B產(chǎn)品的概率是多少,對(duì)于概率模型,根據(jù)大數(shù)定理可以,數(shù)據(jù)量越大分析的越準(zhǔn)確。
頭條的推薦量根據(jù)具體的用戶具體分析。