統計數據的類型
數據的計量尺度被分為3類:
名義(Nominal)變量:又叫無序列別變量,比如性別:男/女
有序(Ordinal):又叫有序類別變量,比如收入劃分為:低/中/高
度量(Scale):又叫連續性變量,比如具體工資收入金額
特征分析和處理
- 名義變量:One-Hot編碼。比如,兩個變量采用10和01的形式來編碼,三個變量采用100、010和001的形式,以此類推
- 有序變量:按照因變量影響由小到大的順序編碼為1、2、3,…。比如,收入低中高編碼為1、2、3,以此類推
- 度量變量:為了防止結果受某些值較大的屬性的影響一般需要進行標準化處理。比如,Z-Score標準化,Max-Min標準化等
關于數據分析與人工智能的更多內容,歡迎到作者主頁查看~