Python 是一種常用的編程語言,在數(shù)據(jù)分析和處理中也有著廣泛的應(yīng)用,其中處理缺失值是非常常見的一種情況。Python 提供了許多處理缺失值的方法,下面就來介紹一些常用的方法。
1. isnull()
import pandas as pd import numpy as np df = pd.DataFrame({'A': [1, 2, np.nan], 'B': [3, np.nan, 5], 'C': ['a', 'b', 'c']}) print(df.isnull())
這里使用了 pandas 庫,創(chuàng)建了一個 DataFrame,其中包含了一些缺失值。isnull() 方法可以判斷 DataFrame 中的每個元素是否為缺失值,輸出結(jié)果為 True 表示缺失值,F(xiàn)alse 則表示有值。
2. notnull()
import pandas as pd import numpy as np df = pd.DataFrame({'A': [1, 2, np.nan], 'B': [3, np.nan, 5], 'C': ['a', 'b', 'c']}) print(df.notnull())
notnull() 方法與 isnull() 方法相反,它可以判斷 DataFrame 中的每個元素是否有值,輸出結(jié)果為 True 表示有值,F(xiàn)alse 表示缺失值。
3. dropna()
import pandas as pd import numpy as np df = pd.DataFrame({'A': [1, 2, np.nan], 'B': [3, np.nan, 5], 'C': ['a', 'b', 'c']}) print(df.dropna())
dropna() 方法可以將 DataFrame 中含有缺失值的行或列刪除。如果想刪除行,可以使用 df.dropna(axis=0),如果想刪除列,則可以使用 df.dropna(axis=1)。
4. fillna()
import pandas as pd import numpy as np df = pd.DataFrame({'A': [1, 2, np.nan], 'B': [3, np.nan, 5], 'C': ['a', 'b', 'c']}) print(df.fillna(value=0))
fillna() 方法可以將缺失值填充為指定的數(shù)值。在這個例子中,將缺失值填充為 0。
5. interpolate()
import pandas as pd import numpy as np df = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [3, np.nan, 5, 7], 'C': ['a', 'b', 'c', 'd']}) print(df.interpolate())
interpolate() 方法可以通過插值的方式來填補(bǔ)缺失值。它可以根據(jù) DataFrame 中的其他值自動計算缺失值,如上例中的第一行,通過插值方法插出了缺失的值。
以上就是幾種常用的 Python 缺失值判斷的方法,可以根據(jù)具體情況靈活運(yùn)用。