当前位置:首页 >> 高中教育 >> 1.2 独立性检验的基本思想及其初步应用

1.2 独立性检验的基本思想及其初步应用


1.2 独立性检验的基本思想 及其初步应用

1、介绍两个相关的概念 (1)分类变量:
对于性别变量,其取值为男和女两种,这种变量的 不同“值”表示个体所属的不同类别,像这样的变量称 为 分类变量,也称为属性变量或定性变量,它们的取值一 定是离散的,而且不同的取值仅表示个体所属的类别。

(2)定量变量:
定量变量的取

值一定是实数,它们的取值大小有 特定的含义,不同取值之间的运算也有特定的含义。
例如身高、体重、考试成绩等,张明的身高是180cm,李立的 身高是175cm,说明张明比李立高180-175=5(cm)。

两种变量:
?定量变量:体重、身高、温度、考试成绩等等。 ? 变量 ?分类变量:性别、是否吸烟、是否患肺癌、 ? 宗教信仰、国籍等等。 ?
在日常生活中,我们常常关心分类变量的之间是否有关系

研究两个变量的相关关系:
?定量变量——回归分析(画散点图、相关系数r、 ? 变量 ? 相关指数R 2、残差分析) ?分类变量——独立性检验 ?

本节研究的是两个分类变量的独立性检验问题。

为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查 了9965人,得到如下结果(单位:人):
表1-9 吸烟与患肺癌列联表
不吸烟 吸烟 总计

不患肺癌 7775 2099 9874

患肺癌 42 49 91

总计 7817 2148 9965

那么吸烟是否对患肺癌有影响?
1、象这样的两个分类变量的频数表叫列联表. 在不吸烟者中,有0.54%患有肺癌; 在吸烟者中,有2.28%患有肺癌。因此,直观上可以 得到结论: 吸烟者和不吸烟者患肺癌的可能性存在差异。 2、与表格相比,图形能更直观地反映出相关数据的总体状 况。

9000 8000 7000 6000 5000 4000 3000 2000 1000 0

不患肺癌

患肺癌

不吸烟

吸烟

图1.2 ? 2

图 1.2 ? 2 是叠在一起的二维条形图, 其中绿色 条高表示不患肺癌的人数, 黑色条高表示患肺 癌的人数.从图中可以看出, 吸烟者中患肺癌的 比例高于不吸烟者中患肺癌的比例.

上面我们通过分析数据和图形,得到的直观印 象是吸烟和患肺癌有关,那么事实是否真的如此呢? 你得到这个结论有多大的把握呢?

为此先假设 H0:吸烟与患肺癌没有关系, 看看能够推出什么样的结论。

如下用字母表示数字得列联表(表1-10)
不患肺癌
不吸烟 吸烟 总计 a c a+c

患肺癌
b d b+d

总计
a+b c+d a+b+c+d

如果“吸烟与患肺癌没有关系”,(即H0 成立) 则在吸烟者中不患肺癌的比例应该与 不吸烟者中相应的比例应差不多,即:

a c ? ? a(c ? d ) ? c(a ? b) ? ad ? bc ? 0. a?b c?d
结论: |ad-bc| 越小,说明H0 成立的可能性越大;反之呢?

为了统一评判标准,我们构造一个随机变量

n(ad ? bc) K ? , (a ? b)(c ? d )(a ? c)(b ? d )
2 2

(1)

其中n ? a ? b ? c ? d为样本容量。
因此:若 H0成立,则K2应很小。 利用公式(1)计算得到 K2 的观测值为

9965(7775 ? 49 ? 42 ? 2099)2 k? ? 56.632. 7817 ? 2148 ? 9874 ? 91
如何看待这个值呢?

在H0成立的情况下,统计学家研究出如下的 2 (2) 概率 P(K ? 6.635) ? 0.01.
即在H0成立的情况下,K2的值大于6.635的 概率非常小, 近似于0.01。而现在K2的值 56.632远大于6.635, 故它是小概率事件,所以 我们认为H0 是不成立的 .虽然这种判断犯错 误的可能性存在, 但我们有99%的把握认为 H0 是不成立的!(即吸烟与患肺癌有关系) 独立性检验的定义:

上面这种利用随机变量K2来确定在多大程度 上可以认为“两个分类变量有关系”的方法 称为两个分类变量的独立性检验。

独立性检验的基本思想:

类似于数学上的反证法,要确认“两个分类变量有关系” 这一结论成立的可信程度,

首先,假设该结论不成立,即假设结论“两个分类变量 没有关系”成立。 其次,在假设下,计算构造的随机变量K2,如果有观 测数据计算得到的K2≥k0 ,则我们有[1-P(K2≥k0)]*100%把 握说明假设不合理(即两个分类变量有关系)。 当K2≤k0 ,则我们没有[1-P(K2≥k0)]*100%把握说明假设不 合理。

具体作法是书本P12: 根据观测数据计算随机变量K2的值k,其值越大,说 明“X与Y有关系”成立的可能性越大。可以通过查阅 下表(表1-12)来确定断言“X与Y有关系”的可信程 度。 表1-12
P( K 2 ? k )

0.50 0.40 0.5

0.15 0.10 0.05 0.025 0.010 0.005 0.001

k

0.445 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

例如:
(1)如果k>10.828,就有99.9%的把握认为“X与Y有关系”; (2)如果k>6.635,就有99%的把握认为“X与Y有关系”; (3)如果k>2.706,就有90%的把握认为“X与Y有关系”;

(4)如果k<=2.706,就认为没有充分的证据显示“X与Y有关系”

例1.秃头与患心脏病

在某医院,因为患心脏病而住院的665名男性病人中,有214 人秃顶;而 另外772名不是因为患心脏病而住院的男性病人中有 175人秃顶。请根据下列数据列出2x2列联表,并用独立性检验方法 判断秃顶与患心脏病是否有关系?
解:根据题目所给数据得到如下列联表1-13:
秃顶 不秃顶 总计 患心脏病 214 451 665 不患心脏病 175 597 772 总计 389 1048 1437

假设:H0:秃顶与患心脏病无关 根据联表1-13中的数据,得到

1437 ? (214 ? 597 ? 175 ? 451) 2 K2 ? ? 16.373 ? 6.635. 389 ?1048 ? 665 ? 772

所以有99%的把握认为“秃顶与患心脏病有关”。

例2.性别与喜欢数学课
为考察高中生的性别与是否喜欢数学课程之间的 关系,在某城市的某校高中生中随机抽取300名学生, 得到如下联表:
男 女 总计

喜欢数学课程 不喜欢数学课程 37 85 35 143 72 228

总计 122 178 300

由表中数据计算K2的观测值k ? 4.513。在多大程度上可以认 为高中生的性别与是否喜欢数学课程之间有关系?为什么? 解:在假设“性别与是否喜欢数学课程之间没有关系”的前提 下K2应该很小,并且 P( K 2 ? 3.841) ? 0.05, 而我们所得到的K2的观测值k ? 4.513超过3.841,这就意味着 “性别与是否喜欢数学课程之间有关系”这一结论错误的可能 性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程 之间有关系”。

例3.秃头与患心脏病

在某医院,因为患心脏病而住院的665名男性病人中,有214 人秃顶;而 另外772名不是因为患心脏病而住院的男性病人中有 175人秃顶。(1)请根据下列数据列出2x2列联表;(2)能否在犯 错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系?
解:根据题目所给数据得到如下列联表1-13:
秃顶 不秃顶 总计 患心脏病 214 451 665 不患心脏病 175 597 772 总计 389 1048 1437

假设:H0:秃顶与患心脏病无关 根据联表1-13中的数据,得到

1437 ? (214 ? 597 ? 175 ? 451) 2 K2 ? ? 16.373 ? 6.635. 389 ?1048 ? 665 ? 772 所以能在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关

思考:
例1、2的结论是否适用于普通的对象?
例1这组数据来自住院的病人,因此所得到的结论适合住院 的病人群体.例2的结论只适合被调查的学校。 大家要注意统计结果的适用范围(这由样本的代表性所决定)

在掌握了两个分类变量的独立性检验方法 之后,就可以模仿例1中的计算解决实际问 题,而没有必要画相应的图形。 图形可帮助向非专业人士解释所得结果; 也可以帮助我们判断所得结果是否合理

练习书本P15-16页
? 认真阅读书本P13页独立性检验的具体做 法: ? 报纸第二期对应的例题及习题

e.

知识结构图
背景分析

条形图

柱形图

列联表

分类变量之间关系

独立性检验


更多相关文档:

1.2独立性检验的基本思想及其初步应用

1.2独立性检验的基本思想及其初步应用_高二数学_数学_高中教育_教育专区。1.2 独立性检验的基本思想及其初步应用(一) 教学要求:通过探究“吸烟是否与患肺癌有关系...

1.2 独立性检验的基本思想及其初步应用

高二数学导学案 编制: 审核: 审批: 班级: 小组: 姓名: 等级: 1.2 独立性检验的基本思想及其初步应用【学习目标】 1.了解独立性检验(只要求 2×2 列联表)...

1.2独立性检验的基本思想及其初步应用

(主备人) 芦海 学生姓名 审核人 学号 授课时间 课前批改 编号 课后批改 2 课题: 1.2 独立性检验的基本思想及其初步应用 P(k ≥k0) k0 2 达标训练: 1...

1.2 独立性检验的基本思想及其初步应用

1.2 独立性检验的基本思想及其初步应用 y1 x1 x2 总计 a 8 b y2 21 25 46 ( ). 总计 男生 73 33 女生 总计 认为作业量大 18 8 26 认为作业量不...

1.2独立性检验的基本思想及其初步应用1

高二数学学案选修 1-2(文科) 命制人: 审核人: 使用时间: 课题:独立性检验的基本思想及其初步应用 学习目标:1. 通过对典型例题的探究,了解独立性检验(只要求 ...

1.2 独立性检验的基本思想及其初步应用(1)

1.2 独立性检验的基本思想及其初步应用(1)_其它课程_高中教育_教育专区。高效课堂导学案(包含预习案、探究案和训练案)高二导学案 班级 【学习目标】 学科:数学 ...

2、1-2独立性检验的基本思想及其初步应用

2、1-2独立性检验的基本思想及其初步应用_高二数学_数学_高中教育_教育专区。高二数学选修1-2全册同步练习1. 2 独立性检验的基本思想及其初步应用一、选择题 1...

1.2 独立性检验的基本思想及其初步应用(2)

1.2 独立性检验的基本思想及其初步应用(2)_其它课程_高中教育_教育专区。高效课堂导学案(包含预习案、探究案和训练案)高二导学案 班级 【学习目标】 学科:数学 ...

1.2 独立性检验的基本思想及其初步应用 教学设计 教案

1.2 独立性检验的基本思想及其初步应用 教学设计 教案。教学准备 1. 教学目标 1、结合生活中的实例了解分类变量的概念,了解列联表和等高条形图的特点 2、通过...
更多相关标签:
独立性检验的基本思想 | 毛泽东思想初步形成于 | 毛泽东思想初步形成 | 毛泽东思想的初步形成 | 毛泽东思想初步形成在 | 初步学开车的基本知识 | 初步广场舞的基本步骤 | 毛泽东思想的初步形 |
网站地图

文档资料共享网 nexoncn.com copyright ©right 2010-2020。
文档资料共享网内容来自网络,如有侵犯请联系客服。email:zhit325@126.com