極差怎么計算?
極差最直接也是最簡單的方法,即最大值-最小值(也就是極差)來評價一組數據的離散度。這一方法在日常生活中最為常見,比如比賽中去掉最高最低分就是極差的具體應用。
移動極差
(Moving Range)
兩個或多個連續樣本值中最大值與最小值之差,這種差是按這樣方式計算的:每當得到一個額外的數據點時,就在樣本中加上這個新的點,同時刪除其中時間上“最老的”點,然后計算與這點有關的極差,因此每個極差的計算至少與前一個極差的計算共用一個點的值。一般說來,移動極差用于單值控制圖,并且通常用兩點(連續的點)來計算移動極差。
離均差的平方和
由于誤差的不可控性,因此只由兩個數據來評判一組數據是不科學的。所以人們在要求更高的領域不使用極差來評判。其實,離散度就是數據偏離平均值的程度。因此將數據與均值之差(我們叫它離均差)加起來就能反映出一個準確的離散程度。和越大離散度也就越大。
但是由于偶然誤差是成正態分布的,離均差有正有負,對于大樣本離均差的代數和為零的。為了避免正負問題,在數學有上有兩種方法:一種是取絕對值,也就是常說的離均差絕對值之和。而為了避免符號問題,數學上最常用的是另一種方法--平方,這樣就都成了非負數。因此,離均差的平方和成了評價離散度一個指標。
方差S2
由于離均差的平方和與樣本個數有關,只能反應相同樣本的離散度,而實際工作中做比較很難做到相同的樣本,因此為了消除樣本個數的影響,增加可比性,將標準差求平均值,這就是我們所說的方差成了評價離散度的較好指標。
我們知道,樣本量越大越能反映真實的情況,而算數均值卻完全忽略了這個問題,對此統計學上早有考慮,在統計學中樣本的均差多是除以自由度(n-1),它是意思是樣本能自由選擇的程度。當選到只剩一個時,它不可能再有自由了,所以自由度是n-1。
① 離散程度的通俗解釋——波動大小,
② 為什么要研究一組數據的離散程度。
全面認識一組數據的兩個特征:
探索平均數的代表性。
實際問題的需要。
③探索如何表示一組數據的離散程度——方差的形
成過程。
首先,極差——比較粗略;
其次,平均差,比極差更全面,不常用;
再次,選擇方差,但數值的單位與原數據單位不
一致。
最后,常用標準差。 δ = S2
④統計含義的解釋——方差全面地平均地反映,
標準差全面地直接地反映。
偏離平均數——指與平均數的離差。
平均的——指離差的平均數的平均值。
全面的——指考慮了每個數據的離差。
直接的——指數值單位與原數據單位一致。
⑤應用條件——平均數相同。特殊情況,平均數相
差很小、近似相等時也可以用,不
受兩組數據個數的差異限制。
⑥實際作用:
1°直接比較:
同一時間事物或現象的整齊性、均勻性、一致性的差異;
不同時間過程的穩定性、均衡性、一致性的差異;
2°比較平均數的代表性:
3°與平均數配合作統計分析:如:Vδ =
極差公式
4°樣本估計總體。樣本比較估計總體的差異,用樣本
標準差,估計總體標準差。
*樣本估計總體的方法有兩個:點估計和區間估計。
只要求會點估計,即直接用樣本的特征數作為總體
相應參數的估計值。
標準差SD
由于方差是數據的平方,與檢測值本身相差太大,人們難以直觀的衡量,所以常用方差開根號換算回來這就是我們要說的標準差。
變異系數CV
標準差能很客觀準確的反映一組數據的離散程度,但是對于不同的項目,或同一項目不同的樣本,標準差就缺乏可比性了,因此對于方法學評價來說又引入了變異系數CV。
不過日常的質控工作檢測的都是同一質控物所以有標準差就足以反應了,同時質控的目的是發現有沒有實驗錯誤,要設制警報線,并不是要評價檢測方法,所以只可能使用標準差,而不用變異系數。
頻數分布
①頻數的通俗解釋:頻數出現的次數,小組里數據的個
數。
②數據的分組整理——分三個步驟:
一是確實分組的方法,先分組,這是整理的難點,分
組的方法,根據需要確定。分組的方法確定《課
標》不作要求。
二是累計各小組的頻數,并計算相應的頻率,用頻數
分布表表示整理的結果。
三是根據頻數分布表畫出頻數分布直方圖。
③觀察頻數分布表和分布圖,獲得數據分布的信息和分布
特征
1°數據分布最多,最集中(眾數組)和最少的小組;
2°數據分布(頻數)的變化趨勢與分布狀態;
3°中位數和平均數在哪個小組,是否是偏態分布;
4°獲取所需要的其他數據信息。