降維算法?
1.TSNE
算法思想:
(1)SNE,其基本思想為在高維空間相似的數據點,映射到低維空間距離也是相似的。算法利用距離表達兩個點之間的相似性。常用的距離度量方式是:歐式距離。
(2)t-SNE,做出的優化是用t分布取代SNE中的高斯分布,使得降維后的數據,同類之間更加緊湊,不同類之間距離加大。換言之,對應于無監督聚類指標輪廓系數更好。
2.PCA
算法思想:將原有的n個特征,投影到k為空間,k維度空間之間兩兩正交稱為主成分,新的特征由原特征變換而來。
算法實現:
在python中通過調用模塊sklearn,兩者都是封裝好的函數,參考函數文檔調參即可。