当前位置:首页 >> 数学 >> 1.2 独立性检验的基本思想及其初步应用^

1.2 独立性检验的基本思想及其初步应用^


两种变量:
?定量变量:体重、身高、温度、考试成绩等等。 ? 变量 ?分类变量:性别、是否吸烟、是否患肺癌、 ? 宗教信仰、国籍等等。 ?

研究两个变量的相关关系:
?定量变量——回归分析(画散点图、相关系数r、 ? 变量 ? 相关指数R 2、残差分析) ?分类变量—— 独立性检验 ?

分类变量:变量的不同”值”

表示个体所属的不同 类别. 如:性别,是否吸烟,宗教信仰,国籍等 日常生活中我们关心这样一些问题: 1. 吸烟与患肺癌之间有无关系? 2. 秃顶与心脏病之间有无关系? 3. 性别与喜欢数学课之间有无关系? 以上问题能否用回归分析的知识来解决?为 什么?

列联表:两个分 例1.为了调查吸烟是否对患肺癌有影响,某肿瘤研究院随机的 类变量的频数表
调查了9965人,得到如下结果:

不吸烟 吸烟 总计

不患肺癌 7775 2099 9874

患肺癌 42 49 91

总计 7817 2148 9965

比例 0.54% 2.28%

问:吸烟是否对患肺癌有影响? 解 从图表的比例可以看出:吸烟与不吸烟可能对患肺癌的可 能存在差异,我们再通过不同的图表来分析

三维柱形图

不吸烟 吸烟 总计

不患肺癌 7775 2099 9874

患肺癌 42 49 91

总计 7817 2148 9965

8000 7000 6000 5000 4000 3000 2000 1000 0

不吸烟 吸烟 不患肺癌
患肺癌

二维条形图

9000 8000 7000 6000 5000 4000 3000 2000 1000 0 不吸烟 吸烟 患肺癌 不患肺癌

等 高 条 形 图

100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 不吸烟 吸烟

患肺癌 不患肺癌

上面我们通过图形的分析,初步判断吸烟与患 肺癌有关系。那么,事实是否如此呢?我们需 要用统计的观点来考察这个问题

我们首先设基本事件为: H0:吸烟与患肺癌没有关系
我们下面就一般关系做一个推断

不吸烟 吸烟 总计

不患肺癌 a c a+c

患肺癌 b d b+d

总计 a+b c+d a+b+c+d

如果吸烟与患肺癌没有关系,则:

a c ? a?b c?d

a(c+d)≈c(a+b)

ad-bc≈0

因此,| ad-bc |越小,说明吸烟与患肺炎之间没有关系。

为了使样本空间有一定的代表性,我们引入一个随机变量

n(ad ? bc) K ? (a ? b)(c ? d )(a ? c)(b ? d )
2 2

总计的四项

(n=a+b+c+d(样本容量))

若,H0成立,(吸烟与患肺癌无关)则K应该很小,通过计 算我们可以得到K的观测值: k=K2=56.632

表1-12
P(K2≥k) K。
0.50 0.455 0.40 0.708 0.25 1.323 0.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.82 8

说明:根据统计学家的分析: P(K2≥10.828)≈0.001

P( K 2 ? k )

0.50

0.40

0.25

0.15

0.10

0.05

0.025 0.010 0.005

0.001

k

0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

(1)如果k ? 10.828, 就有99.9%的把握认为" X 与Y 有关系" (2)如果k ? 7.879, 就有99.5%的把握认为" X 与Y 有关系" (3)如果k ? 6.635, 就有99%的把握认为" X 与Y 有关系" (4)如果k ? 5.024, 就有97.5%的把握认为" X 与Y 有关系" (5)如果k ? 3.841, 就有95%的把握认为" X 与Y 有关系" (6)如果k ? 2.706, 就有90%的把握认为" X 与Y 有关系" (7)如果k ? 2.706, 就认为没有充分的证据显示 " X 与Y
有关系"

上面的利用K2来检验“两个变量有 关系”的方法成为:独立性检验

?

说明: 两个变量X与Y独立性检验的一般方法: 1.设两个变量的值域分别为{x1,x2}{y1.,y2},列频数列联表
x1 x2 总计 y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d

2.假设“X与Y无关” 3.计算变量X与Y的评判标准K2的观测值 4.利用统计概率表1-12查阅发生的概率 5.得出概率结论

例1.在研究某种新药对小白兔的防治效果时,得到下表 数据: 存活数 死亡数 总计
未用新药 用新药 总计 101 129 230 38 20 58 139 149 288

试分析新药对防治小白兔是否有效? 解:假设“新药对防治小白兔无效” 根据列联表中的数据,得到的 K 观测值k为
2

288 ? ?101? 20 ? 38 ?129 ? k? ? 8.658 ? 7.879 139 ?149 ? 230 ? 58
2

99.5%的把握判定新药对防治小白兔是有效的.

例2.某心脏病医院为了研究秃顶是否与 心脏病有关,对665名男性心脏和772名 其他病人做了研究,是否可以以99%的 把握认为秃顶与心脏病有关? 智 慧 的 闪 光

患心脏病 214 秃顶 不秃顶 451 665 总计

!

不患心脏病 175 597 772

总计 389 1048 1437

秃顶 不秃顶 总计

患心脏病 214 451 665

患其他病 175 597 772

总计 389 1048 1437

解:假设“秃顶与患心脏病无关”
根据列联表中的数据, 得K 的观测值为
2

1437 ? ? 214 ? 597 ? 175 ? 451? k? ? 16.373 ? 6.635 389 ?1048 ? 665 ? 772
2

所以有99%的把握认为”秃顶与患心脏病有关”

? 秃顶=心脏病
研究人员表示,掉头发在很大程度上 是由日渐增大的工作压力、不能充分 休息、不正确饮食和睡眠不足等因素 引起的。在接受调查的人群中,有 41%的受秃头威胁的人表示,他们一 日睡觉时间不足4小时

一般地, 假设有两个分类变量X 和Y , 它们的值域分别为 {x1 , x2 }和{ y1 , y2 }, 其样本频数列联表(称为2 ? 2列联表)为 : y2 y1 总计 x1 a b a+b x2 c d c+d
总计 a+c b+d a+b+c+d

若要推断的结论为H1:”X与Y有关系”,可如下操作: 1.通过三维柱形图和二维条形图,可以粗略地判断两个 变量是否有关系,但是这种判断不精确.

y1 x1 x2
总计 a c a+c

y2
b d b+d

总计 a+b c+d a+b+c+d 不吸烟 吸烟 总计

不患肺癌
a c a+c

患肺癌
b d b+d

总计
a+b c+d a+b+c+d

8000 7000 6000

a
主对角线

5000 4000 副对角线 3000 2000 1000 0 不患肺癌

c

b

d
患肺癌

不吸烟 吸烟

(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与 副对角线上两个柱形高度的乘积bc相差越大,H1成立的 可能性就越大

y1 x1 x2
总计
9000 8000 7000 6000 5000 4000 3000 2000 1000 0

y2
b d b+d

总计 a+b c+d a+b+c+d
患肺癌 不患肺癌

不患肺癌
不吸烟 吸烟 总计 a c a+c

患肺癌
b d b+d

总计
a+b c+d a+b+c+d

a c a+c

b

满足条件X ? x1的个体中 具有Y ? y1的个体所占的

a
d c
不吸烟 吸烟

a 比例为 a?b 满足条件X ? x2的个体中 具有Y ? y1的个体所占的 c 比例为 c?d

(2)在二维条形图中,两个比例的值相差越大,H1成立的可能 性就越大

2.利用独立性检验来考察两个分类变量是否有关系, 并且能较精确地给出这种判断的可靠程度. 具体做法是: 根据观测数据计算由

n ? ad ? bc ? K ? ? a ? b ?? c ? d ?? a ? c ?? b ? d ?
2 2

其中n ? a ? b ? c ? d为样本容量

给出的随机变量K2的值k,其值越大,说明”X与Y有关系” 成立的可能性越大.当得到的观测数据a,b,c,d都不小于 5时,可以通过查表来断言”X与Y有关系”的可信程度


更多相关文档:

1.2独立性检验的基本思想及其初步应用

三元整合导学模式数学学科导学稿主编人:覃振宇 审稿人:高二数学科组 定稿日:2013 年 02 月 20 日 课题:1.2 独立性检验的基本思想及其初步应用(人教 A 版数学...

独立检验的基本思想及其初步应用

2 八、板书设计 1.2 独立性检验的基本思想及其初步应用(一) 一、 有关概念 1、 分类变量 2、 列联表 二、独立性检验 1、独立性检验的思想 2、独立性检验...

1.2 独立性检验的基本思想及其初步应用 教学设计 教案

1.2 独立性检验的基本思想及其初步应用 教学设计 教案。教学准备 1. 教学目标 1、结合生活中的实例了解分类变量的概念,了解列联表和等高条形图的特点 2、通过...

1.2独立性检验的基本思想及其初步应用

1.2 独立性检验的基本思想及其初步应用 课前预习学案一、预习目标: 能用所学的知识对实际问题进行回归分析, 体会回归分析的实际价值与基本 思想;了解判断刻画回归...

《1.2独立性检验的基本思想及其初步应用二》教学案

1.2独立性检验的基本思想及其初步应用二》教学案_高二数学_数学_高中教育_教育专区。1.2独立性检验的基本思想及其初步应用(二) 教学要求: 通过探究“吸烟是否...

3.2.1独立性检验的基本思想及其初步应用

学校:临清二中 学科:数学 编写人: 游恒涛教学目标 审稿人:马英济 3.2.1 独立性检验的基本思想及其初步应用(1)通过对典型案例的探究,了解独立性检验(只要求 2...

1.2 独立性检验的基本思想及其初步应用 学案(人教A版选...

1.2 独立性检验的基本思想及其初步应用 课标解读 1.了解独立性检验的基本思想、方法及其简单应用.(重点) 2.通过收集数据,并依据独立性检验的原理作出合理推断,...

...1.2独立性检验的基本思想及其初步应用练习 新人教A...

2015-2016高中数学 1.2独立性检验的基本思想及其初步应用练习 新人教A版选修1-2_数学_高中教育_教育专区。1 .2 基础梳理 独立性检验的基本思想及其初步应用 1....

独立性检验的基本思想及其初步应用(公开课精品)

1.2 独立性检验的基本思想及其初步应用(1) 授课人:朱永华 时间:2013 年 3 月 14 日(周四)上午第一节 地点:高二(9)班 一、教学目标: 1.知识与技能目标 ...

独立性检验的基本思想及其初步应用(第二课时)

1.2 独立性检验的基本思想及其初步应用(第二课时) 一.教学目标:1,理解独立性检验的基本思想; 2,理解独立性检验的实施步骤; 3,了解随机变量 K2 的含义。 二....
更多相关标签:
网站地图

文档资料共享网 nexoncn.com copyright ©right 2010-2020。
文档资料共享网内容来自网络,如有侵犯请联系客服。email:zhit325@126.com