方差

跳轉(zhuǎn)到: 導(dǎo)航, 搜索

在概率論和數(shù)理統(tǒng)計(jì)中,方差(英文Variance)用來度量隨機(jī)變量和其數(shù)學(xué)期望(即均值)之間的偏離程度。在許多實(shí)際問題中,研究隨機(jī)變量和均值之間的偏離程度有著很重要的意義。如下面的例子:

已知某零件的真實(shí)長度為a,現(xiàn)用甲、乙兩臺儀器各測量10次,將測量結(jié)果X用坐標(biāo)上的點(diǎn)表示如圖:

Bkhuc.jpg

甲儀器測量結(jié)果:

Bkhud.jpg

乙儀器測量結(jié)果:

兩臺儀器的測量結(jié)果的均值都是 a 。但是用上述結(jié)果評價一下兩臺儀器的優(yōu)劣,很明顯,我們會認(rèn)為乙儀器的性能更好,因?yàn)橐覂x器的測量結(jié)果集中在均值附近。

由此可見,研究隨機(jī)變量與其均值的偏離程度是十分必要的.那么,用怎樣的量去度量這個偏離程度呢?容易看到E(|X-E(X)|)能度量隨機(jī)變量與其均值E(X)的偏離程度. 但由于上式帶有絕對值,運(yùn)算不方便,通常用量

E{[X-E(X)]^2} 這一數(shù)字特征就是方差?! ?/p>

目錄

方差的定義

設(shè)X是一個隨機(jī)變量,若E{[X-E(X)]^2}存在,則稱E{[X-E(X)]^2}為X的方差,記為D(X)或DX。

即D(X)=E{[X-E(X)]^2},而σ(X)=D(X)^0.5(與X有相同的量綱)稱為標(biāo)準(zhǔn)差均方差。即用來衡量一組數(shù)據(jù)的離散程度的統(tǒng)計(jì)量。

方差刻畫了隨機(jī)變量的取值對于其數(shù)學(xué)期望的離散程度。

若X的取值比較集中,則方差D(X)較小;

若X的取值比較分散,則方差D(X)較大。

因此,D(X)是刻畫X取值分散程度的一個量,它是衡量X取值分散程度的一個尺度?! ?/p>

方差的計(jì)算

由定義知,方差是隨機(jī)變量 X 的函數(shù)

g(X)=[X-E(X)]^2

的數(shù)學(xué)期望。即:

Bkhue.jpg

由方差的定義可以得到以下常用計(jì)算公式:

 D(X)=E(X^2)-[E(X)]^2

證明:

D(X)=E[X-E(X)]^2

=E{X^2-2XE(X)+[E(X)]^2}

=E(X^2)-2[E(X)]^2+[E(X)]^2

=E(X^2)-[E(X)]^2

方差其實(shí)就是標(biāo)準(zhǔn)差的平方。  

方差的幾個重要性質(zhì)

(1)設(shè)c是常數(shù),則D(c)=0。

(2)設(shè)X是隨機(jī)變量,c是常數(shù),則有D(cX)=(c^2)D(X)。

(3)設(shè) X 與 Y 是兩個隨機(jī)變量,則

D(X+Y)= D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]}

特別的,當(dāng)X,Y是兩個相互獨(dú)立的隨機(jī)變量,上式中右邊第三項(xiàng)為0(常見協(xié)方差),

則D(X+Y)=D(X)+D(Y)。此性質(zhì)可以推廣到有限多個相互獨(dú)立的隨機(jī)變量之和的情況.

(4)D(X)=0的充分必要條件是X以概率為1取常數(shù)值c,即P{X=c}=1,其中E(X)=c。  

常見隨機(jī)變量的期望和方差

設(shè)隨機(jī)變量X。

X服從(0—1)分布,則E(X)=p D(X)=p(1-p)

X服從泊松分布,即X~ π(λ),則 E(X)= λ,D(X)= λ

X服從均勻分布,即X~U(a,b),則E(X)=(a+b)/2, D(X)=(b-a)^2/12

X服從指數(shù)分布,即X~e(θ), E(X)= θ,D(X)= θ^2

X服從二項(xiàng)分布,即X~B(n,p),則E(x)=np, D(X)=np(1-p)

X 服從正態(tài)分布,即X~N(μ,σ2), 則E(x)=μ, D(X)=σ^2

若Xi~ N(μi,σi^2),i=1,2,…n, 且它們相互獨(dú)立,則它們的線性組合C1X1+C2X2+…+CnXn(Ci是不全為0的常數(shù))仍然服""從正態(tài)分布,且C1X1+C2X2+…+CnXn~N (∑Ciμi, ∑Ci^2σi^2)  

統(tǒng)計(jì)學(xué)的應(yīng)用

概念

樣本中各數(shù)據(jù)與樣本平均數(shù)的差的平方和的平均數(shù)叫做樣本方差;樣本方差的算術(shù)平方根叫做樣本標(biāo)準(zhǔn)差。

Bkhuf.jpg

樣本方差和樣本標(biāo)準(zhǔn)差都是衡量一個樣本波動大小的量,樣本方差或樣本標(biāo)準(zhǔn)差越大,樣本數(shù)據(jù)的波動就越大。

方差和標(biāo)準(zhǔn)差。方差和標(biāo)準(zhǔn)差是測算離散趨勢最重要、最常用的指標(biāo)。方差是各變量值與其均值離差平方的平均數(shù),它是測算數(shù)值型數(shù)據(jù)離散程度的最重要的方法。標(biāo)準(zhǔn)差為方差的平方根,用S表示。標(biāo)準(zhǔn)差相應(yīng)的計(jì)算公式為

標(biāo)準(zhǔn)差與方差不同的是,標(biāo)準(zhǔn)差和變量的計(jì)算單位相同,比方差清楚,因此很多時候我們分析的時候更多的使用的是標(biāo)準(zhǔn)差。  

高考實(shí)例

(甘肅省,2002年)某校初三年級甲、乙兩班舉行電腦漢字輸入速度比賽,兩個班參加比賽的學(xué)生每分鐘輸入漢字的個數(shù),經(jīng)統(tǒng)計(jì)和計(jì)算后結(jié)果如下表所示:

班級 參加人數(shù) 平均字?jǐn)?shù) 中位數(shù) 方差
55 135 149 191
55 135 151 110

 有一位同學(xué)根據(jù)上表得出如下結(jié)論:

①甲、乙兩班學(xué)生的平均水平相同;

②乙班優(yōu)秀的人數(shù)比甲班優(yōu)秀的人數(shù)多(每分鐘輸入漢字達(dá)150個以上為優(yōu)秀);

③甲班學(xué)生比賽成績的波動比乙班學(xué)生比賽成績的波動大.上述結(jié)論正確的是________(填序號).

解:填①、②、③,顯然①、③是正確的是.對于第②個結(jié)論,因?yàn)榧椎闹形粩?shù)為149,表明甲班優(yōu)秀人數(shù)未過半,而乙的中位數(shù)為151,表明乙班優(yōu)秀人數(shù)在半數(shù)以上,故乙班優(yōu)秀的人數(shù)比甲班優(yōu)秀人數(shù)多,∴ ②正確.  

切比雪夫不等式

定理

設(shè)隨機(jī)變量X就有數(shù)學(xué)期望E(X)=μ,方差D(X)=σ^2 ,則對于任意整數(shù)ε,有不等式

Bkhug.jpg
Bkhug.jpg

 成立。

由切比雪夫不等式可以看出,若 ε 越小,則事件{|X-E(X)|< ε }的概率越大,即隨機(jī)變量X 集中在期望附近的可能性越大.

就只連續(xù)性隨機(jī)變量的情況來證明。

設(shè)X的概念密度為 f(x).

Bkhui.jpg

 當(dāng)方差已知時,切比雪夫不等式給出了r.v X與它的期望的偏差不小于3σ 的概率的估計(jì)式 .

如取ε =3σ

Bkhuj.jpg

可見,對任給的分布,只要期望和方差D(X),則 r.v X取值偏離E(X)超過3σ 的概率小于0.111 .  

應(yīng)用實(shí)例

例9 已知正常男性成人血液中 ,每一毫升白細(xì)胞數(shù)平均是7300,均方差是700 . 利用切比雪夫不等式估計(jì)每毫升白細(xì)胞數(shù)在5200~9400之間的概率 .

解:設(shè)每毫升白細(xì)胞數(shù)為X

依題意,E(X)=7300,D(X)=7002

所求為 P(5200 ≤ X≤ 9400)

P(5200≤ X ≤ 9400)

= P(-2100 ≤X-E(X) ≤ 2100)

= P{ |X-E(X)| ≤ 2100}

由切比雪夫不等式,

Bkhuk.jpg

即估計(jì)每毫升白細(xì)胞數(shù)在5200~9400之間的概率不小于8/9 .

關(guān)于“方差”的留言: Feed-icon.png 訂閱討論RSS

目前暫無留言

添加留言

更多醫(yī)學(xué)百科條目

個人工具
名字空間
動作
導(dǎo)航
推薦工具
功能菜單
工具箱