当前位置:首页 >> 数学 >> 数学选修2-3第三章统计案例教案

数学选修2-3第三章统计案例教案


第三章 统计案例
§3.1 独立性检验(1) 1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了 515 个成年人,其中吸烟者 220 人, 不吸烟者 295 人.调查结果是:吸烟的 220 人中有 37 人患呼吸道疾病(简称患病),183 人未患呼吸道疾病(简称未 患病);不吸烟的 295 人中有 21 人患病,274 人未患病.

>
问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”?
为了研究这个问题, (1)引导学生将上述数据用下表来表示: 患病 吸烟 不吸烟 合计 一.建构数学 1.独立性检验: (1)假设 H 0 :患病与吸烟没有关系. 若将表中“观测值”用字母表示,则得下表: 患病 吸烟 不吸烟 合计 未患病 合计 37 21 58 未患病 183 274 457 合计 220 295 515

a c a?c

b d b?d

a?b c?d a?b?c?d

如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能否定假设 H 0 .否则,应认为假 设 H 0 不能接受,即可作出与假设 H 0 相反的结论. (2)卡方统计量: 为了消除样本对上式的影响,通常用卡方统计量(χ2 ? ? 卡方 χ2 统计量公式: χ
2

(观测值 ? 预期值)2
预期值

)来进行估计.

n ? ad ? bc ? ? (其中 n ? a ? b ? c ? d ) ? a ? b ?? c ? d ?? a ? c ?? b ? d ?
2

由此若 H 0 成立,即患病与吸烟没有关系,则 χ2 的值应该很小.把 a ? 37, b ? 183, c ? 21, d χ2 ? 11.8634 ,统计学中有明确的结论,在 H 0 成立的情况下,随机事件“ ? 发生的概率约为 0.01 ,即 P( ?
2 2

? 274 代入计算得

? 6.635 ”

? 6.635) ? 0.01 ,也就是说,在 H 0 成立的情况下,对统计量 χ2 进行多次观测,

观测值超过 6.635 的频率约为 0.01 .由此,我们有 99%的把握认为 H 0 不成立,即有 99%的把握认为“患病与吸烟 有关系”. 象以上这种用 ? 统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验.
2

2.独立性检验的一般步骤: 一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值:类 患呼吸道疾病与不患呼吸道疾病),得到如下表所示: Ⅱ 类1 Ⅰ 类2 合计

A 和类 B (如吸烟与不吸烟),Ⅱ也有两类取值:类 1 和类 2 (如

A 类B
类 合计

a c a?c

b d b?d

a?b c?d a?b?c?d

推断“Ⅰ和Ⅱ有关系”的步骤为: 第一步,提出假设 H 0 :两个分类变量Ⅰ和Ⅱ没有关系; 第二步,根据 2× 2 列联表和公式计算 χ2 统计量; 第三步,查对课本中临界值表,作出判断. 3.独立性检验与反证法: 反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立; 独立性检验(假设检验)原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立. 四.数学运用 1.例题: 例 1.在 500 人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外 500 名未用血清的人的感冒记录 作比较,结果如表所示.问:该种血清能否起到预防感冒的作用? 未感冒 使用血清 未使用血清 合计 258 216 474 感冒 242 284 526 合计 500 500 1000

分析:在使用该种血清的人中,有

242 284 ? 48.4% 的人患过感冒;在没有使用该种血清的人中,有 ? 56.8% 的 500 500

人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大.从直观上来看,使用过血清的人与没有使用 过血清的人的患感冒的可能性存在差异. 解:提出假设 H 0 :感冒与是否使用该种血清没有关系.由列联表中的数据,求得

?2 ?

1000 ? (258 ? 284 ? 242 ? 216)2 ? 7.075 474 ? 526 ? 500 ? 500
2

∵当 H 0 成立时, ?

? 6.635 的概率约为 0.01 ,∴我们有 99%的把握认为:该种血清能起到预防感冒的作用.

例 2.为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结 果如表所示.根据所选择的 193 个病人的数据,能否作出药的效果与给药方式有关的结论? 有效 口服 注射 合计 58 64 122 无效 40 31 71 合计 98 95 193

分析:在口服的病人中,有

58 64 ? 59% 的人有效;在注射的病人中,有 ? 67% 的人有效.从直观上来看,口服 98 95

与注射的病人的用药效果的有效率有一定的差异,能否认为用药效果与用药方式一定有关呢?下面用独立性检验的方 法加以说明.

解:提出假设 H 0 :药的效果与给药方式没有关系.由列联表中的数据,求得

?2 ?

193 ? (58 ? 31 ? 40 ? 64) 2 ? 1.3896 ? 2.072 122 ? 71? 98 ? 95
2

当 H 0 成立时, ?

? 1.3896 的概率大于 15% ,这个概率比较大,所以根据目前的调查数据,不能否定假设 H 0 ,
,但也不能作出结论“ H 0 成立” , ? 2.706 ,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”

即不能作出药的效果与给药方式有关的结论. 说明:如果观测值 ? 即Ⅰ与Ⅱ没有关系. §3.1 独立性检验(2) 二.数学运用 1.练习题: 1.在对人们的休闲方式的一次调查中,共调查了 124 人,其中女性 70 人,男性 54 人。女性中有 43 人主要的休闲方 式是看电视,另外 27 人主要的休闲方式是运动;男性中有 21 人主要的休闲方式是看电视,另外 33 人主要的休闲方式 是运动。 (1)根据以上数据建立一个 2× 2 列联表; (2)判断性别与休闲方式是否有关系。
2

例 2.气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表 所示.问它们的疗效有无差异(可靠性不低于 99%)? 有效 复方江剪刀草 胆黄片 合计 184 91 275 无效 61 9 70 合计 245 100 345

例 3.下表中给出了某周内中学生是否喝过酒的随机调查结果,若要使结论的可靠性不低于 95%,根据所调查的数据, 能否作出该周内中学生是否喝过酒与性别有关的结论? 喝过酒 男生 女生 合计 77 16 93 没喝过酒 404 122 526 合计 481 138 619

§3.2 回归分析(1) 一.建构数学 1.线性回归模型的定义: 我们将用于估计

y 值的线性函数 a ? bx 作为确定性函数;

y 的实际值与估计值之间的误差记为 ? ,称之为随机误差;


y ? a ? bx ? ? 称为线性回归模型.
③存在观测误差.

说明: (1)产生随机误差的主要原因有: ①所用的确定性函数不恰当引起的误差;②忽略了某些因素的影响; (2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理;②在模型合理的情况下,如何估计 a , b ? 2.探求线性回归系数的最佳估计值: 设有

n

对观测数据

( xi , yi ) (i ? 1, 2 , 3 , n , ,)根 据 线 性 回 归 模 型 , 对 于 每 一 个 xi
,我们希望总误差越小越好,即要使

,对应的随机误差项

? i ? yi ? (a ? bxi )
n

??
i ?1

n

2 i

越小越好.所以,只要求出使

Q(? , ? ) ? ? ( yi ? ? xi ? ? ) 2 取得最小值时的 ? , ?
i ?1

值作为 a , b 的估计值,记为 a , b .

注:这里的

?i

就是拟合直线上的点

? xi , a ? bxi ? 到点 Pi ? xi , yi ? 的距离.

用什么方法求 a , b ? 线性回归方程的方法:最小二乘法. 利用最小二乘法可以得到 a , b 的计算公式为
n n ? ( x ? x )( y ? y ) xi yi ? nx y ? ? i i ? i ?1 i ?1 ? ? n ?b ? n 2 ? ( xi ? x) xi2 ? n( x) 2 , ? ? ? i ?1 i ?1 ? ? ?a ? y ? bx

其中 x

?

1 n ? xi n i ?1



y?

1 n ? yi n i ?1

由此得到的直线

y ? a ? bx 就称为这 n 对数据的回归直线,此直线方程即为线性回归方程.其中 a ,b 分别为 a ,b y 称为回归值.

的估计值, a 称为回归截距, b 称为回归系数, 3. 线性回归方程

y ? a ? bx 中 a , b 的意义是:以 a 为基数, x 每增加 1 个单位, y 相应地平均增加 b 个单位;

4. 化归思想(转化思想) (了解) 在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线 性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线

方程,并给出相应的化为线性回归方程的换元公式. (1) (2) (3)

y ?a?

b x

,令

y' ? y , x' ?

1 ,则有 y ' ? a ? bx ' . x

y ? axb ,令 y ' ? ln y , x ' ? ln x , a ' ? ln a ,则有 y ' ? a '? bx ' .
y ? aebx ,令 y ' ? ln y , x ' ? x , a ' ? ln a ,则有 y ' ? a '? bx ' .
y ? ae x ,令 y ' ? ln y , x ' ?
b

(4)

1 , a ' ? ln a ,则有 y ' ? a '? bx ' . x

(5)

y ? a ? b ln x ,令 y ' ? y , x ' ? ln x ,则有 y ' ? a ? bx ' .

二.数学运用 1.例题: 例 1.下表给出了我国从 1949 年至 1999 年人口数据资料,试根据表中数据估计我国 2004 年的人口数. 年份 人口数/百万

1949 1954 1959 1964 1969 1974 1979 1984 1989 1994 1999 542 603 672 705 807 909 975 1035 1107 1177 1246
y 表示,得到下面的数据表:

解:为了简化数据,先将年份减去 1949 ,并将所得值用 x 表示,对应人口数用

x
y

0 542

5 603

10 672

15 705

20 807

25 909

30 975

35 40 45 50 1035 1107 1177 1246

作出 11 个点

? x, y ? 构成的散点图,
y ? a ? bx ? ? 来表示它们之间的关系.

由图可知,这些点在一条直线附近,可以用线性回归模型 根据公式(1)可得

? ?b ? 14.453, ? ? ?a ? 527.591.
这里的 a, b 分别为 a , b 的估 计值,因此线性回归方程 为

y ? 527.591 ?14.453x
? 55 ,代入线性回归方程 y ? 527.591 ?14.453x 可得 y ? 1322.506 (百万) , 即 2004 年

由于 2004 年对应的 x

的人口总数估计为 13.23 亿.

§3.2 回归分析(2) 1.相关系数的计算公式: 对于 x ,
n

y 随机取到的 n 对数据 ( xi , yi ) (i ? 1, 2,3,
n

, n) ,样本相关系数 r 的计算公式为

r?

? ( xi ? x)( yi ? y)
i ?1

? ( x ? x) ?? ( y ? y)
2 i ?1 i i ?1 i

n

n

?
2

? x y ? nx y
i ?1 i i

?

(? x ? n( x) )(? y ? n( y ) )
i ?1 2 i 2 i ?1 2 i 2

n

n



2.相关系数 r 的性质: (1) | r |? 1 ; (2) | r | 越接近与 1, x , (3) | r | 越接近与 0, x ,

y 的线性相关程度越强; y 的线性相关程度越弱.

可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 3. 作出统计推断: 若 | r |? r0.05 , 则否定 H 0 , 表明有 95% 的把握认为变量 则没有理由拒绝 H 0 ,即就目前数据而言,没有充分理由认为变量 说明:1.对相关系数 r 进行显著性检验,一般取检验水平 ? 某种关系. 3.这里的 r 是对抽样数据而言的.有时即使 | r |? 1 ,两者也不一定是线性相关的.故在统计分析时,不能就数据论数 据,要结合实际情况进行合理解释. 4.对于上节课的例 1,可按下面的过程进行检验: (1)作统计假设 H 0 : x 与

y 与 x 之间具有线性相关关系;若 | r |? r0.05 ,

y 与 x 之间具有线性相关关系.

? 0.05 ,即可靠程度为 95% .

2.这里的 r 指的是线性相关系数, r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的

y 不具有线性相关关系;

(2)由检验水平 0.05 与 n ? 2 (3)根据公式 (4)因为

? 9 在附录 2 中查得 r0.05 ? 0.602 ;

? 2 ? 得相关系数 r ? 0.998 ;

r ? 0.998 ? 0.602 ,即 r ? r0.05 ,所以有 95 ﹪的把握认为 x 与 y 之间具有线性相关关系,线性回归方

程为

y ? 527.591 ?14.453x 是有意义的.


更多相关文档:

数学选修2-3第三章统计案例教案

数学选修2-3第三章统计案例教案_数学_高中教育_教育专区 暂无评价|0人阅读|0次下载|举报文档 数学选修2-3第三章统计案例教案_数学_高中教育_教育专区。第三章...

高中数学选修2-3 第三章 统计案例 单元综合测评

高中数学选修2-3 第三章 统计案例 单元综合测评_高二数学_数学_高中教育_教育专区。单元综合测评三 (时间:90 分钟 满分:120 分) 温馨提示:1.第Ⅰ卷答案写在...

高中数学选修2-3第三章 统计案例

高中数学选修2-3第三章 统计案例_高二数学_数学_高中教育_教育专区。3.1 回归分析的基本思想及其初步应用(一)(新授课) 3.1 回归分析的基本思想及其初步应用(二)...

高中数学选修2-3第三章统计案例教案

高中数学选修2-3第三章统计案例教案_高三数学_数学_高中教育_教育专区。教案第三章 统计案例 独立性检验( )§3.1 独立性检验(1) 一.问题情境 5 月 31 日是...

选修2-3 第三章 统计案例 教案

选修2-3 第三章 统计案例 教案 隐藏>> 选修2-3 第三章 统计案例 §3.1 ...三.建构数学 1.独立性检验: (1)假设 H 0 :患病与吸烟没有关系. 若将表...

选修2-3 第三章 统计案例 综合检测

选修2-3 第三章 统计案例 综合检测_数学_高中教育_教育专区。选修 2-3 第三章 统计案例 综合检测一、选择题(本大题共 8 个小题,每小题 5 分,共 40 ...

选修2-3统计案例单元设计

三、教学内容分析 回归分析和独立性检验都是常用的统计方法,在统计学中也占有很重要的地位,本章 在《数学 3(必修) 》概率统计内容的基础上,通过典型案例进一步...

数学:第三章《统计案例》测试(2)(新人教A版选修2-3)

数学:第三章《统计案例》测试(2)(新人教A版选修2-3)_数学_高中教育_教育专区...学而思网校 www.xueersi.com 高中新课标选修(2-3)第三章统计案例综合测试题一...

数学:第三章《统计案例》测试(1)(新人教A版选修2-3)

数学:第三章统计案例》测试(1)(新人教A版选修2-3)_数学_高中教育_教育专区...解: (1)散点图略; (2)对于农村学生来讲,系数等于 0.42 意味着 1994~...

高中数学B版选修2-3《第三章统计案例》习题答案

高中数学B版选修2-3第三章统计案例》习题答案_高三数学_数学_高中教育_教育专区。 文档贡献者 freelion1 贡献于2015-08-24 1/2 相关文档推荐 ...
更多相关标签:
化学选修四第三章教案 | 选修2 1第三章教案 | 选修1 2统计案例 | 化学选修4第三章 | 高二化学选修4第三章 | 化学选修4第三章试题 | 物理选修3 1第三章 | 选修四第三章测试题 |
网站地图

文档资料共享网 nexoncn.com copyright ©right 2010-2020。
文档资料共享网内容来自网络,如有侵犯请联系客服。email:zhit325@126.com