使用spark運行協同過濾算法?
對于隱式反饋而言,用戶對于item沒有顯式的評分數據,這種情況下對考慮rating值得時候應該需要結合具體的業務場景對應的數據去設計。
例如:
短視頻推薦
(1) 根據不同用戶行為設置rating值
對于短視頻推薦中,可以根據用戶的觀看、點贊、分享等不同行為設置不同的rating值。這樣設置rating值得缺陷在于,用戶點贊和分享的行為數據非常稀疏,無法單一使用,結合觀看、點贊、分享行為數據綜合考慮用戶對item的rating值需要考慮不同行為對rating值得權重影響。
(2) 根據同一行為的不同特征設置rating值。
同一行為可以考慮用戶行為具有的不同特征值來設置用戶對物品的rating值,例如視頻的觀看時長、觀看完成度、如果考慮時間衰減因素的話可以結合觀看時間距離當前的時間差等因素綜合考慮設置item的rating值。
當然,不同的推薦系統中根據具體業務有不同的設置方式,例如電商推薦的可能考慮物品的價格,新聞資訊的推薦可以能考慮篇幅長度等等上面所說的只是一個參考。