信賴區間
confidence intervals | hypothesis tests | |
μ σ known |
¯x±zα/2σ√n (8.1) proof |
z=¯x−μ0σ/√n (9.1) |
μ σ unknown |
¯x±tα/2(n−1)s√n (8.2) proof |
t=¯x−μ0s/√n (9.2) |
μ1−μ2 σ1,σ2 known |
(¯x1−¯x2)±zα/2√σ21n1+σ22n2 (10.4) proof |
z=(¯x1−¯x2)−D0√σ21n1+σ22n2 (10.5) |
μ1−μ2 σ1=σ2 unknown |
(¯x1−¯x2)±tα/2(n+m−2)√(n1−1)s21+(n2−1)s22n1+n2−2√1n1+1n2 proof |
|
μ1−μ2 σ1,σ2 unknown |
(¯x1−¯x2)±tα/2(d.f.)√s21n1+s22n2 (10.6) proof d.f.=(s21n1+s22n2)21n1−1(s21n1)2+1n2−1(s22n2)2 (10.7) |
t=(¯x1−¯x2)−D0√s21n1+s22n2 (10.8) d.f.=(s21n1+s22n2)21n1−1(s21n1)2+1n2−1(s22n2)2 (10.7) |
p | ¯p±zα/2√¯p(1−¯p)n (8.6) proof |
z=¯p−p0√p0(1−p0)n (9.4) |
p1−p2 | (¯p1−¯p2)±zα/2√¯p1(1−¯p1)n1+¯p2(1−¯p2)n2 (10.13) proof |
z=¯p1−¯p2√¯p(1−¯p)(1n1+1n2) (10.16) |
σ2 | [(n−1)s2χ2α/2,(n−1)s2χ21−α/2] (11.7) proof |
χ2=(n−1)s2σ20 (11.8) |
σ21σ22 | [1Fα/2(n−1,m−1)s21s22,Fα/2(m−1,n−1)s21s22] |
Motivation
我們會先有一個母體,還有母體平均 μ,例如全台灣人的平均身高,但我們不可能真的去調查每個人的身高,有可能調查完最後一個人,第一個人就長高了,所以我們只能抽樣某些人,調查這些人的身高,得到樣本平均 ˉX,來推估母體平均。
既然是估計,難免會有誤差,但我們不能放任誤差任意大,我們得先設定一個我們可以接受的誤差範圍,也就是 |ˉX−μ|≤error
既使限制了誤差的範圍,我們還是沒辦法保證誤差一定在這個範圍中,我們只能描述誤差在這個範圍的機率,並視需求調整這個機率,也就是 P(|ˉX−μ|≤error)=1−α
我們先假設 X∼normal(μ,σ2),所以 ˉX−μσ/√n∼normal(0,1)。注意到 P(−zα/2≤ˉX−μσ/√n≤zα/2)=∫zα/2−zα/2the pdf of normal(0,1)=1−α.
所以我們把上面的式子做一點變化 P(|ˉX−μ|≤error)=P(−error≤ˉX−μ≤error)=P(−errorσ/√n≤ˉX−μσ/√n≤errorσ/√n)=P(−zα/2≤ˉX−μσ/√n≤zα/2)=1−α
能不能在probability function P 裡面任意將不等式變形這點還沒想清楚,但可以注意到不等式的等價變化 −zα/2≤ˉX−μσ/√n≤zα/2⇔−zα/2≤μ−ˉXσ/√n≤zα/2⇔−zα/2σ√n≤μ−ˉX≤zα/2σ√n⇔ˉX−zα/2σ√n≤μ≤ˉX+zα/2σ√n
注意到 zα/2=errorσ/√n,或是寫成 √nerror=zα/2σ,所以
- 當 error 固定時,n 跟 zα/2 成正比。
- 當 n 固定時,error 跟 zα/2 成正比。
- 當 zα/2 固定時,error 跟 n 成反比。
常用的 1−α 數值及其對應的 zα/2 如下 1−α=0.90,zα/2=1.645;1−α=0.95,zα/2=1.96;1−α=0.99,zα/2=2.576.
直觀解釋是,我們抽100次的樣本,然後算100次的樣本平均,然後得到100個信賴區間,則這100個區間裡面,大概會有95個區間包含母體平均。
這裡摘錄書上的說明:For a particular sample, this interval either does or does not contain the mean μ. However, if many such intervals were calculated, about 90% of them should contain the mean μ.
Confidence Intervals for Means, Variance is known
- 我們假設 X∼normal(μ,σ2),所以 ˉX−μσ/√n∼normal(0,1)。
-
P(−zα/2≤ˉX−μσ/√n≤zα/2)=1−α
-
−zα/2≤ˉX−μσ/√n≤zα/2⇔−zα/2≤μ−ˉXσ/√n≤zα/2⇔−zα/2σ√n≤μ−ˉX≤zα/2σ√n⇔ˉX−zα/2σ√n≤μ≤ˉX+zα/2σ√n
Confidence Intervals for Means, Variance is unknown
-
因為 σ2 未知,所以我們用 S2 代替 σ2,於是
ˉX−μS/√n=ˉX−μσ/√nS/σ=ˉX−μσ/√n√(n−1)S2σ2n−1Theorem 5.3.1, Definition 5.3.4∼t(n−1)
-
P(−tα/2(n−1)≤ˉX−μS/√n≤tα/2(n−1))=1−α
-
−tα/2(n−1)≤ˉX−μS/√n≤tα/2(n−1)⇔−tα/2(n−1)≤μ−ˉXS/√n≤tα/2(n−1)⇔−tα/2(n−1)S√n≤μ−ˉX≤tα/2(n−1)S√n⇔ˉX−tα/2(n−1)S√n≤μ≤ˉX+tα/2(n−1)S√n
Confidence Intervals for the Difference of Two Means, Variances are Known
-
X∼normal(μX,σ2X),Y∼normal(μY,σ2Y)Theorem 5.3.1⇒ˉX∼normal(μX,σ2Xn),ˉY∼normal(μY,σ2Ym)Theorem 4.2.14, Theorem 2.3.4⇒ˉX−ˉY∼normal(μX−μY,σ2Xn+σ2Ym)p.102, line -1⇒(ˉX−ˉY)−(μX−μY)√σ2Xn+σ2Ym∼normal(0,1)
-
P(−zα/2≤(ˉX−ˉY)−(μX−μY)√σ2Xn+σ2Ym≤zα/2)=1−α
-
−zα/2≤(ˉX−ˉY)−(μX−μY)√σ2Xn+σ2Ym≤zα/2⇔−zα/2≤(μX−μY)−(ˉX−ˉY)√σ2Xn+σ2Ym≤zα/2⇔−zα/2√σ2Xn+σ2Ym≤(μX−μY)−(ˉX−ˉY)≤zα/2√σ2Xn+σ2Ym⇔(ˉX−ˉY)−zα/2√σ2Xn+σ2Ym≤μX−μY≤(ˉX−ˉY)+zα/2√σ2Xn+σ2Ym
Confidence Intervals for the Difference of Two Means, Variances are Unknown and Equal
-
X∼normal(μX,σ2X),Y∼normal(μY,σ2Y)Theorem 5.3.1⇒ˉX∼normal(μX,σ2Xn),ˉY∼normal(μY,σ2Ym)Theorem 4.2.14, Theorem 2.3.4⇒ˉX−ˉY∼normal(μX−μY,σ2Xn+σ2Ym)p.102, line -1⇒(ˉX−ˉY)−(μX−μY)√σ2Xn+σ2Ym∼normal(0,1)Furthermore, By Theorem 5.3.1(n−1)S2Xσ2∼χ2n−1,(m−1)S2Yσ2∼χ2m−1Lemma 5.3.2⇒(n−1)S2Xσ2+(m−1)S2Yσ2∼χ2n+m−2Definition 5.3.4⇒(ˉX−ˉY)−(μX−μY)√σ2Xn+σ2Ym√(n−1)S2Xσ2+(m−1)S2Yσ2n+m−2∼t(n+m−2)σX=σY=σ⇒(ˉX−ˉY)−(μX−μY)√(n−1)S2X+(m−1)S2Yn+m−2√1n+1m∼t(n+m−2)
-
P(−tα/2(n+m−2)≤(ˉX−ˉY)−(μX−μY)√(n−1)S2X+(m−1)S2Yn+m−2√1n+1m≤tα/2(n+m−2))=1−α
-
−tα/2(n+m−2)≤(ˉX−ˉY)−(μX−μY)√(n−1)S2X+(m−1)S2Yn+m−2√1n+1m≤tα/2(n+m−2)⇔−tα/2(n+m−2)≤(μX−μY)−(ˉX−ˉY)√(n−1)S2X+(m−1)S2Yn+m−2√1n+1m≤tα/2(n+m−2)⇔−tα/2(n+m−2)√(n−1)S2X+(m−1)S2Yn+m−2√1n+1m≤(μX−μY)−(ˉX−ˉY)≤tα/2(n+m−2)√(n−1)S2X+(m−1)S2Yn+m−2√1n+1m⇔(ˉX−ˉY)−tα/2(n+m−2)√(n−1)S2X+(m−1)S2Yn+m−2√1n+1m≤μX−μY≤(ˉX+ˉY)+tα/2(n+m−2)√(n−1)S2X+(m−1)S2Yn+m−2√1n+1m
Confidence Intervals for the Difference of Two Means, Variances are Unknown and Nonequal
證明略。
Confidence Intervals for Variances
-
By Theorem 5.3.1
(n−1)S2σ2∼χ2(n−1)
-
P(χ21−α/2(n−1)≤(n−1)S2σ2≤χ2α/2(n−1))=1−α
-
χ21−α/2(n−1)≤(n−1)S2σ2≤χ2α/2(n−1)⇔1χ2α/2(n−1)≤σ2(n−1)S2≤1χ21−α/2(n−1)⇔(n−1)S2χ2α/2(n−1)≤σ2≤(n−1)S2χ21−α/2(n−1)
Confidence Intervals for the Quotient of Two Variances
-
By Theorem 5.3.1(m−1)S2Yσ2Y∼χ2m−1,(n−1)S2Xσ2X∼χ2n−1p.225, line 1⇒S2Yσ2YS2Xσ2X=[(m−1)S2Yσ2Y]/(m−1)[(n−1)S2Xσ2X]/(n−1)∼F(m−1,n−1)
-
P(F1−α/2(m−1,n−1)≤S2Yσ2YS2Xσ2X≤Fα/2(m−1,n−1))=1−α
-
大部分書籍中,F distribution的表格沒有 1−α/2 的值,所以我們要將 F1−α/2(m−1,n−1) 稍微變形一下。假設 W∼F(m−1,n−1),於是
P(W≥F1−α/2(m−1,n−1))=1−α/2⇒P(1W≤1F1−α/2(m−1,n−1))=1−α/2⇒1−P(1W≤1F1−α/2(m−1,n−1))=α/2⇒P(1W≥1F1−α/2(m−1,n−1))=α/2Theorem 5.3.8, 1W∼F(n−1,m−1)⇒1F1−α/2(m−1,n−1)=Fα/2(n−1,m−1)⇒F1−α/2(m−1,n−1)=1Fα/2(n−1,m−1)所以原本的不等式可以改成 1Fα/2(n−1,m−1)≤S2Yσ2YS2Xσ2X≤Fα/2(m−1,n−1)⇔1Fα/2(n−1,m−1)S2XS2Y≤σ2Xσ2Y≤Fα/2(m−1,n−1)S2XS2Y
Confidence Intervals for Proportions
-
Y∼binomial(n,p)⇒Y=∑ni=1Xi, where Xi∼Bernoulli(p)Central Limit Theorem⇒Yn−p√p(1−p)n=ˉX−p√p(1−p)n∼normal(0,1)
-
P(−zα/2≤Yn−p√p(1−p)n≤zα/2)=1−α
-
−zα/2≤Yn−p√p(1−p)n≤zα/2⇔−zα/2≤p−Yn√p(1−p)n≤zα/2⇔−zα/2√p(1−p)n≤p−Yn≤zα/2√p(1−p)n⇔Yn−zα/2√p(1−p)n≤p≤Yn+zα/2√p(1−p)np≈Yn⇒Yn−zα/2√Yn(1−Yn)n≤p≤Yn+zα/2√Yn(1−Yn)n
Confidence Intervals for the Difference of Two Proportions
-
Y1∼binomial(n1,p1),Y2∼binomial(n2,p2)Central Limit Theorem⇒Y1n1−p1√p1(1−p1)n1∼normal(0,1),Y2n2−p2√p2(1−p2)n2∼normal(0,1)⇒Y1n1∼normal(p1,p1(1−p1)n1),Y2n2∼normal(p2,p2(1−p2)n2)Theorem 4.2.14, Theorem 2.3.4⇒Y1n1−Y2n2∼normal(p1−p2,p1(1−p1)n1+p2(1−p2)n2)p.102, line -1⇒(Y1n1−Y2n2)−(p1−p2)√p1(1−p1)n1+p2(1−p2)n2∼normal(0,1)
-
P(−zα/2≤(Y1n1−Y2n2)−(p1−p2)√p1(1−p1)n1+p2(1−p2)n2≤zα/2)=1−α
-
−zα/2≤(Y1n1−Y2n2)−(p1−p2)√p1(1−p1)n1+p2(1−p2)n2≤zα/2⇔−zα/2≤(p1−p2)−(Y1n1−Y2n2)√p1(1−p1)n1+p2(1−p2)n2≤zα/2⇔−zα/2√p1(1−p1)n1+p2(1−p2)n2≤(p1−p2)−(Y1n1−Y2n2)≤zα/2√p1(1−p1)n1+p2(1−p2)n2⇔(Y1n1−Y2n2)−zα/2√p1(1−p1)n1+p2(1−p2)n2≤p1−p2≤(Y1n1−Y2n2)+zα/2√p1(1−p1)n1+p2(1−p2)n2
No comments:
Post a Comment