Python 數據挖掘是一項廣受歡迎的任務,它使用各種技術和工具從大量數據中提取有價值的信息。Python 語言本身就為數據挖掘提供了廣泛的支持,這使得使用Python進行數據挖掘變得非常方便。
import pandas as pd import numpy as np from sklearn import datasets # 加載數據集 iris = datasets.load_iris() X = iris.data y = iris.target # 數據預處理 from sklearn.preprocessing import StandardScaler scaler = StandardScaler() X = scaler.fit_transform(X) # 拆分數據集 from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3) # 使用支持向量機分類器 from sklearn.svm import SVC svm = SVC(kernel='linear') svm.fit(X_train, y_train) # 評估模型準確性 from sklearn.metrics import accuracy_score y_pred = svm.predict(X_test) accuracy = accuracy_score(y_test, y_pred) print(f'Accuracy: {accuracy}')
在上面的代碼中,我們首先導入必要的庫和數據集。然后我們對數據進行了預處理,將其縮放到了相同的比例,這是一個很重要的步驟。接下來,我們將數據集拆分為訓練集和測試集,并使用支持向量機分類器進行了訓練。最后,我們使用測試集評估了模型的準確性。
Python 數據挖掘還有很多其他功能和技術,例如聚類分析、關聯規則挖掘等等。Python 的靈活性使得可以使用不同的工具和方法來完成數據挖掘任務。使用Python進行數據挖掘可以幫助數據分析人員更好地理解數據并做出更好的預測,這對企業的決策制定過程非常重要。
上一篇mysql刪除表重復記錄
下一篇python 數據庫事物