当前位置:首页 >> 数学 >> 1.2 独立性检验的基本思想及其初步应用^

1.2 独立性检验的基本思想及其初步应用^


两种变量:
?定量变量:体重、身高、温度、考试成绩等等。 ? 变量 ?分类变量:性别、是否吸烟、是否患肺癌、 ? 宗教信仰、国籍等等。 ?

研究两个变量的相关关系:
?定量变量——回归分析(画散点图、相关系数r、 ? 变量 ? 相关指数R 2、残差分析) ?分类变量—— 独立性检验 ?

分类变量:变量的不同”值”

表示个体所属的不同 类别. 如:性别,是否吸烟,宗教信仰,国籍等 日常生活中我们关心这样一些问题: 1. 吸烟与患肺癌之间有无关系? 2. 秃顶与心脏病之间有无关系? 3. 性别与喜欢数学课之间有无关系? 以上问题能否用回归分析的知识来解决?为 什么?

列联表:两个分 例1.为了调查吸烟是否对患肺癌有影响,某肿瘤研究院随机的 类变量的频数表
调查了9965人,得到如下结果:

不吸烟 吸烟 总计

不患肺癌 7775 2099 9874

患肺癌 42 49 91

总计 7817 2148 9965

比例 0.54% 2.28%

问:吸烟是否对患肺癌有影响? 解 从图表的比例可以看出:吸烟与不吸烟可能对患肺癌的可 能存在差异,我们再通过不同的图表来分析

三维柱形图

不吸烟 吸烟 总计

不患肺癌 7775 2099 9874

患肺癌 42 49 91

总计 7817 2148 9965

8000 7000 6000 5000 4000 3000 2000 1000 0

不吸烟 吸烟 不患肺癌
患肺癌

二维条形图

9000 8000 7000 6000 5000 4000 3000 2000 1000 0 不吸烟 吸烟 患肺癌 不患肺癌

等 高 条 形 图

100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 不吸烟 吸烟

患肺癌 不患肺癌

上面我们通过图形的分析,初步判断吸烟与患 肺癌有关系。那么,事实是否如此呢?我们需 要用统计的观点来考察这个问题

我们首先设基本事件为: H0:吸烟与患肺癌没有关系
我们下面就一般关系做一个推断

不吸烟 吸烟 总计

不患肺癌 a c a+c

患肺癌 b d b+d

总计 a+b c+d a+b+c+d

如果吸烟与患肺癌没有关系,则:

a c ? a?b c?d

a(c+d)≈c(a+b)

ad-bc≈0

因此,| ad-bc |越小,说明吸烟与患肺炎之间没有关系。

为了使样本空间有一定的代表性,我们引入一个随机变量

n(ad ? bc) K ? (a ? b)(c ? d )(a ? c)(b ? d )
2 2

总计的四项

(n=a+b+c+d(样本容量))

若,H0成立,(吸烟与患肺癌无关)则K应该很小,通过计 算我们可以得到K的观测值: k=K2=56.632

表1-12
P(K2≥k) K。
0.50 0.455 0.40 0.708 0.25 1.323 0.15 2.072 0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 0.001 10.82 8

说明:根据统计学家的分析: P(K2≥10.828)≈0.001

P( K 2 ? k )

0.50

0.40

0.25

0.15

0.10

0.05

0.025 0.010 0.005

0.001

k

0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

(1)如果k ? 10.828, 就有99.9%的把握认为" X 与Y 有关系" (2)如果k ? 7.879, 就有99.5%的把握认为" X 与Y 有关系" (3)如果k ? 6.635, 就有99%的把握认为" X 与Y 有关系" (4)如果k ? 5.024, 就有97.5%的把握认为" X 与Y 有关系" (5)如果k ? 3.841, 就有95%的把握认为" X 与Y 有关系" (6)如果k ? 2.706, 就有90%的把握认为" X 与Y 有关系" (7)如果k ? 2.706, 就认为没有充分的证据显示 " X 与Y
有关系"

上面的利用K2来检验“两个变量有 关系”的方法成为:独立性检验

?

说明: 两个变量X与Y独立性检验的一般方法: 1.设两个变量的值域分别为{x1,x2}{y1.,y2},列频数列联表
x1 x2 总计 y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d

2.假设“X与Y无关” 3.计算变量X与Y的评判标准K2的观测值 4.利用统计概率表1-12查阅发生的概率 5.得出概率结论

例1.在研究某种新药对小白兔的防治效果时,得到下表 数据: 存活数 死亡数 总计
未用新药 用新药 总计 101 129 230 38 20 58 139 149 288

试分析新药对防治小白兔是否有效? 解:假设“新药对防治小白兔无效” 根据列联表中的数据,得到的 K 观测值k为
2

288 ? ?101? 20 ? 38 ?129 ? k? ? 8.658 ? 7.879 139 ?149 ? 230 ? 58
2

99.5%的把握判定新药对防治小白兔是有效的.

例2.某心脏病医院为了研究秃顶是否与 心脏病有关,对665名男性心脏和772名 其他病人做了研究,是否可以以99%的 把握认为秃顶与心脏病有关? 智 慧 的 闪 光

患心脏病 214 秃顶 不秃顶 451 665 总计

!

不患心脏病 175 597 772

总计 389 1048 1437

秃顶 不秃顶 总计

患心脏病 214 451 665

患其他病 175 597 772

总计 389 1048 1437

解:假设“秃顶与患心脏病无关”
根据列联表中的数据, 得K 的观测值为
2

1437 ? ? 214 ? 597 ? 175 ? 451? k? ? 16.373 ? 6.635 389 ?1048 ? 665 ? 772
2

所以有99%的把握认为”秃顶与患心脏病有关”

? 秃顶=心脏病
研究人员表示,掉头发在很大程度上 是由日渐增大的工作压力、不能充分 休息、不正确饮食和睡眠不足等因素 引起的。在接受调查的人群中,有 41%的受秃头威胁的人表示,他们一 日睡觉时间不足4小时

一般地, 假设有两个分类变量X 和Y , 它们的值域分别为 {x1 , x2 }和{ y1 , y2 }, 其样本频数列联表(称为2 ? 2列联表)为 : y2 y1 总计 x1 a b a+b x2 c d c+d
总计 a+c b+d a+b+c+d

若要推断的结论为H1:”X与Y有关系”,可如下操作: 1.通过三维柱形图和二维条形图,可以粗略地判断两个 变量是否有关系,但是这种判断不精确.

y1 x1 x2
总计 a c a+c

y2
b d b+d

总计 a+b c+d a+b+c+d 不吸烟 吸烟 总计

不患肺癌
a c a+c

患肺癌
b d b+d

总计
a+b c+d a+b+c+d

8000 7000 6000

a
主对角线

5000 4000 副对角线 3000 2000 1000 0 不患肺癌

c

b

d
患肺癌

不吸烟 吸烟

(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与 副对角线上两个柱形高度的乘积bc相差越大,H1成立的 可能性就越大

y1 x1 x2
总计
9000 8000 7000 6000 5000 4000 3000 2000 1000 0

y2
b d b+d

总计 a+b c+d a+b+c+d
患肺癌 不患肺癌

不患肺癌
不吸烟 吸烟 总计 a c a+c

患肺癌
b d b+d

总计
a+b c+d a+b+c+d

a c a+c

b

满足条件X ? x1的个体中 具有Y ? y1的个体所占的

a
d c
不吸烟 吸烟

a 比例为 a?b 满足条件X ? x2的个体中 具有Y ? y1的个体所占的 c 比例为 c?d

(2)在二维条形图中,两个比例的值相差越大,H1成立的可能 性就越大

2.利用独立性检验来考察两个分类变量是否有关系, 并且能较精确地给出这种判断的可靠程度. 具体做法是: 根据观测数据计算由

n ? ad ? bc ? K ? ? a ? b ?? c ? d ?? a ? c ?? b ? d ?
2 2

其中n ? a ? b ? c ? d为样本容量

给出的随机变量K2的值k,其值越大,说明”X与Y有关系” 成立的可能性越大.当得到的观测数据a,b,c,d都不小于 5时,可以通过查表来断言”X与Y有关系”的可信程度


更多相关文档:

1.2独立性检验的基本思想及其初步应用

1.2独立性检验的基本思想及其初步应用_高二数学_数学_高中教育_教育专区。1.2 独立性检验的基本思想及其初步应用(一) 教学要求:通过探究“吸烟是否与患肺癌有关系...

1.2 独立性检验的基本思想及其初步应用(2)

1.2 独立性检验的基本思想及其初步应用(2)_其它课程_高中教育_教育专区。高效课堂导学案(包含预习案、探究案和训练案)高二导学案 班级 【学习目标】 学科:数学 ...

(教案)1.2独立性检验的基本思想及其初步应用

(教案)1.2独立性检验的基本思想及其初步应用_高二数学_数学_高中教育_教育专区。1.2 独立性检验的基本思想及其初步应用例题: 1.三维柱形图中柱的高度表示的是(...

1.2 独立性检验的基本思想及其初步应用(1)

1.2 独立性检验的基本思想及其初步应用(1)_其它课程_高中教育_教育专区。高效课堂导学案(包含预习案、探究案和训练案)高二导学案 班级 【学习目标】 学科:数学 ...

1.2独立性检验的基本思想及其应用(1)

1.2 独立性检验的基本思想及其初步应用(1) 学习目标: 1.通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数 据的列联表和条形图展示在吸烟...

1.2 独立性检验的基本思想及其初步应用

1.2 独立性检验的基本思想及其初步应用 y1 x1 x2 总计 a 8 b y2 21 25 46 ( ). 总计 男生 73 33 女生 总计 认为作业量大 18 8 26 认为作业量不...

3.2.1独立性检验的基本思想及其初步应用

学校:临清二中 学科:数学 编写人: 游恒涛教学目标 审稿人:马英济 3.2.1 独立性检验的基本思想及其初步应用(1)通过对典型案例的探究,了解独立性检验(只要求 2...

1.2独立性检验的基本思想及其初步应用

(主备人) 芦海 学生姓名 审核人 学号 授课时间 课前批改 编号 课后批改 2 课题: 1.2 独立性检验的基本思想及其初步应用 P(k ≥k0) k0 2 达标训练: 1...

独立性检验的基本思想及其初步应用测试题

独立性检验的基本思想及其初步应用河北乐亭一中 李金泉 邮编:063600 练习一一、选择题 1.下面是一个 2×2 列联表 y1 x1 x2 总计 a 2 b y2 21 25 46 ...

1.2独立性检验的基本思想及其初步应用1

高二数学学案选修 1-2(文科) 命制人: 审核人: 使用时间: 课题:独立性检验的基本思想及其初步应用 学习目标:1. 通过对典型例题的探究,了解独立性检验(只要求 ...
更多相关标签:
独立性检验的基本思想 | 独立性检验 基本思想 | 毛泽东思想初步形成于 | 毛主席思想初步形成于 | 毛泽东思想初步形成 | 毛泽东思想的初步形成 | 毛 思想初步形成标志 | 初步广场舞的基本步骤 |
网站地图

文档资料共享网 nexoncn.com copyright ©right 2010-2020。
文档资料共享网内容来自网络,如有侵犯请联系客服。email:zhit325@126.com