当前位置:首页 >> 数学 >> 选修1-2统计案例

选修1-2统计案例


复习回顾
1、线性回归模型: y=bx+a+e, 其中a和b为模型的未知参数,e称为随机误差。 2、数据点和它在回归直线上相应位置的差异(yi ? ? yi ) ? i =y ? ? 是随机误差的效应,称 e yi 为残差。 i 3、对每名女大学生计算这个差异,然后分别将所得 n 的值平方后加起来,用数学符号表示为: ( y ? ? y )2

?
i ?1

i

i

称为残差平方和,它代表了随机误差的效应。

刻画模型拟合的精度
2 ? ( y ? y ) ? i i i ?1 n 2 ( y ? y ) ? i i ?1 n

相关指数:R2 ? 1 ?

R2取值越大,则残差平方和越小,即模型的拟合效果 越好.

建立回归模型的基本步骤 1)确定解释变量和预报变量; 2)画出散点图; 3)确定回归方程类型; 4)求出回归方程; 5)利用相关指数或残差进行分析.

回归分析
1. 从一组样本数据出发,确定变量之间的数学 关系式 2. 对这些关系式的可信程度进行各种统计检验, 并从影响某一特定变量的诸多变量中找出哪 些变量的影响显著,哪些不显著 3. 利用所求的关系式,根据一个或几个变量的 取值来预测或控制另一个特定变量的取值, 并给出这种预测或控制的精确程度

回归分析与相关分析的区别
1. 相关分析中,变量 x 变量 y 处于平等的地位;回 归分析中,变量 y 称为因变量,处在被解释的地 位,x 称为自变量,用于预测因变量的变化 2. 相关分析中所涉及的变量 x 和 y 都是随机变量; 回归分析中,因变量 y 是随机变量,自变量 x 可 以是随机变量,也可以是非随机的确定变量 3. 相关分析主要是描述两个变量之间线性关系的密 切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制

问题:一只红铃虫的产卵数y与温度x有关,现收 集了7组观测数据,试建立y与x之间的回归方程
温度x 21 产卵数y 7 23 11
350 300

25 21

27 24

29 66

32 115

35 325

解:1)作散点图;
产卵数

250

200

150

100

50

0 20 22 24 26 28 温度 30 32 34 36

从散点图中可以看出产卵数和温度之间的关系并不能 用线性回归模型来很好地近似。这些散点更像是集中 在一条指数曲线或二次曲线的附近。

探索新知
选变量

一元线性模型
350 300 250

方案1

解:选取气温为解释变量x,产卵数 为预报变量y。

画散点图

200 150 100

选模型

50 0 0 3 6 9 12 15 18 21 24 27 30 33 36 39

估计参数

假设线性回归方程为 :?=bx+a
由计算器得:线性回归方程为y=19.87x-463.73 相关指数R2=r2≈0.8642=0.7464

分析和预测

当 x =28 时, 19.87 28463.73≈ 当 x =28 时, yy == 19.87 ×× 28463.73≈ 93 93
所以,一次函数模型中温度解释了74.64%的产卵数变化。

93>66 ? 模型不好?

奇 怪 ?

合作探究
问题1

二次函数模型
选用y=bx2+a ,还是y=bx2+cx+a ? 如何求a、b ?
y=bx2+a 非线性关系 产卵数 变换 t=x2 y=bt+a 线性关系

方案2

问题2 问题3

400 300 200 100 0 -40 -30 -20

-10 0 -100 -200

10

20

30

气 温 40

方案2解答
平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a 就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a
温度 温度的平方t 产卵数y/个 21 441 7 23 529 11 25 625 21 27 729 24 29 841 66 32 1024 115 35 1225 325

作散点图,并由计算器得: y 和 t 之间的线性回归方程为 y=0.367t-202.54,相关指数R2=r2≈0.8962=0.802

将t=x2代入线性回归方程得: y=0.367x2 -202.54 当x=28时,y=0.367×282202.54≈85,且R2=0.802, 所以,二次函数模型中温度解 释了80.2%的产卵数变化。

产卵数y/个 350 300 250 200 150 100 50 0 0 150 300 450 600 750 900 1050 1200 1350

t

合作探究
产卵数
450 400 350 300 250 200 150 100 50 0 -5 -50 0

指数函数模型

方案3

气 温

-10

5

10

15

20

25

30

35

40

问题1 问题2

如何选取指数函数的底?
y ? c1ec2 x
非线性关系 对数变换 y=bx+a 线性关系

y ? c110c2 x

方案3解答 cx 对数变换:在 y ? c110 2 中两边取常用对数得

lg y ? lg(c110c2 x ) ? lg c1 ? lg10c2 x ? lg c1 ? c2 x lg10 ? c2 x ? lg c1
令 z ? lg y, a ? lg c1 , b ? c2 ,则
就转换为z=bx+a
温度xoC z=lgy 产卵数y/个 21 0.85 7 23 1.04 11 25 1.32 21 27 1.38 24
2.8 2.4 2 1.6 1.2 0.8 0.4 0 0 3 6 9 12 15 18 21 24 27 30 33 36 39

y ? c110c2 x
29 1.82 66
z

32 2.06 115

35 2.51 325

由计算器得:z关于x的线性回归方程

为z=0.118x-1.665 ,y ? 100.118x-1.665 相关指数R2=r2≈0.99252=0.985
当x=28oC 变化 时,y ≈44 ,指数回归 模型中温度解释了98.5%的产卵数的

x

最好的模型是哪个?

400 300

400 300 200 100 0
0 5 10 15 20 25 30 35 40

产卵数

200 100 0 -100

-40

-30

-20

-10 0 -100 -200

10

20

30

气 温 40
-10

450 400 350 300 250 200 150 100 50 0 -5 -50 0

产卵数

产卵数

气 温
5 10 15 20 25 30 35 40

线性模型

二次函数模型

指数函数模型

最好的模型是哪个?

函数模型 线性回归模型

相关指数R2 0.7464 0.802 0.985

比 一 比

二次函数模型 指数函数模型

解: 1)用y = c1ec2x 模型; 令 z = lny 则z=bx+a,(a=lnc1,b=c2),列出变换后数据表并画 出x与z 的散点图
x z 21 23 25 27 29 32 35 1.946 2.398 3.045 3.178 4.19 4.745 5.784
z 7 6 5 4 3 2 1 0 0 10 20 30 40

z

x和z之间的关系可以用线性回归模型来拟合 z = ax+ b+e

应用统计方法解决实际问题需要注意的问题:对 于同样的数据,有不同的统计方法进行分析, 我们要用最有效的方法分析数据。

现在有三个不同的回归模型可供选择来拟合 红铃虫的产卵数与温度数据,他们分别是:

y ? ax ? b ? e, y ? c1e
c2 x ? e

,

z ? c2 x ? b ? e
y ?? t ? ? ?e

y ? ?x ? ? ? e.
2

可以利用直观(散点图和残差图)、相关指 数来确定哪一个模型的拟合效果更好。

(1) 0.272x-3.843 ? , 非线性回归方程 y = e

? = 0.367x - 202.54 二次回归方程 y 残差公式 (1) (1) 0.272x-3.843 ? ? = yi - e ei = yi - y , (i = 1,2...7)
(2) 2
(2) (2) 2 ? ? ei = yi - y = yi - 0.367x + 202.54,

编号 x y 1 21 7 2 23 11


3 25 21 1.76


4 27 24 -9.149 5 29 66 8.889 6 32 115 -14.153 7 35 325 32.928

e(1) 0.52 -0.167

e(2) 47.7 19.397 -5.835

-41.003

-40.107

-58.268

77.965

用线性回归模型解决非线性相关问题

(1)y=f(bx+a+e)

z ? f (y)
(2)y=bg(x)+a+e

?1

bx ? a ? e ? f (y)
Z=bx+a+e
t=g(x)

?1

y=bt+a+e

(3)y=f(bg(x)+a+e)

z ? f (y)t ? g(x)
?1

Z=bt+a+e

小 实际问题 y = f(x) 抽样

结 样本分析 ? = f(x) y

回归模型 ? = f(x) y

小结
用身高预报体重时,需要注意下列问题: ——这些问题也使用于其他问题。 1、回归方程只适用于我们所研究的样本的总体; 2、我们所建立的回归方程一般都有时间性; 3、样本采集的范围会影响回归方程的适用范围; 4、不能期望回归方程得到的预报值就是预报变量的精确值。 事实上,它是预报变量的可能取值的平均值。

涉及到统计的一些思想:
模型适用的总体;
模型的时间性; 样本的取值范围对模型的影响; 模型预报结果的正确理解。

相关系数
? 相关系数又称线性相关系数.它是衡量变量 之间线性相关程度的指标。样本相关系数 用r表示,总体相关系数用ρ表示,相关系数的 取值范围为[-1,1]。|r|值越大,误差Q越小, 变量之间的线性相关程度越高;|r|值越接 近0,Q越大,变量之间的线性相关程度越 低。

相关系数
? 如两者呈正相关,r呈正值,r=1时为完全 正相关;如两者呈负相关则r呈负值,而r=1时为完全负相关。完全正相关或负相关时, 所有图点都在直线回归线上;点子的分布 在直线回归线上下越离散,r的绝对值越小。 相关系数的绝对值越接近1,相关越密切; 越接近于0,相关越不密切。当r=0时,说 明X和Y两个变量之间无直线关系。通常|r| 大于0.8时,认为两个变量有很强的线性相 关性

相关系数的性质
? ? ? ? 相关系数的性质 (1)相关系数可正可负; (2)相关系数的区间是[-1,1]; (3)相关系数是线性关联或线性相依的一 个度量,它不能用于描述非线性关系;

偏差平方和
? 偏差平方和 ? 单次测量值x1与测定平均值之差的平方的 总和,以Q表示,Q值越大,表示测定值之 间的差异越大,用偏差平方和表征差异的 优点是能充分利用测度数据所提供的信息, 缺点是Q随着测定值数目的增多而增大,为 了克服这一缺点,用方差S2=Q/f来表征差 异的大小,其中f为自由度。如一个测定结 果受多个因素影响,则总偏差平方和等于 实验误差与各因素(包括固定因素与随机 因素)所形成的偏差平方和之总和。

残差平方和
? 英文:residual sum of squares[1] ? 概念: ? 为了明确解释变量和随机误差各产生的效 应是多少,统计学上把数据点与它在回归 直线上相应位置的差异称残差,把每个残 差的平方后加起来 称为残差平方和,它表 示随机误差的效应。

相关指数R^2
? 相关指数R^2表示一元多项式回归方程拟合 度的高低,或者说表示一元多项式回归方 程估测的可靠程度的高低。 ? R^2=1-(∑(y-y估测值)^2÷∑(y-y平均值) ^2) ? 相关指数R^2用来刻画回归效果时,R^2越 大,说明模型的拟合效果越好。


更多相关文档:

选修1-2:第一章+统计案例

选修1-2:第一章+统计案例_数学_高中教育_教育专区。高中数学 人教A版 同步测试题高二文数:选修 1—2 统计案例 1.两个变量 x 与 y 的回归模型中分别选择了...

选修1-2 第一章《统计案例》师用

选修1-2 第一章《统计案例》师用_数学_高中教育_教育专区。选修 1-2 第一章《统计案例》§1.1 回归分析的基本思想及其初步应用【知识要点】 ? 线性回归方程...

高中数学选修1-2第一章统计案例测试题带详细解答

高中数学选修1-2第一章统计案例测试题带详细解答_数学_高中教育_教育专区。高中数学选修1-2第一章统计案例测试题带详细解答选修1-2 第一章、统计案例测试一、选...

选修1-2第一章统计案例测试题

选修1-2第一章统计案例测试题_数学_高中教育_教育专区。综合,全面,是一份复习的好资料。作业一 1.下列关于等高条形图的叙述正确的是( ) 统计案例 A.从等高...

高二数学选修1-2-统计案例-教师

高二数学选修1-2-统计案例-教师 隐藏>> 统计案例 1.在画两个变量的散点图时,下面哪个叙述是正确的( A.预报变量在 x 轴上,解释变量在 y 轴上 C.可以选择...

选修1-2第一章统计案例1.2

选修1-2第一章统计案例1.2_数学_高中教育_教育专区。2014--2015 学年下学期高二数学导学稿(统计案例) 年 月 日 选修 1-2 第一章 §1.2 相关系数 统计...

选修1-2《统计案例》测试

高中新课标数学选修(1-2)统计案例测试题一、选择题 1.炼钢时钢水的含碳量与冶炼时间有( ) A .确定性关系 B .相关关系 C .函数关系 D .无任何关系) y ...

选修1-2第一章、统计案例教案

选修1—2 第一章统计案例 第一章、 选修 1-2 第一章、统计案例 1、1 回归分析的基本思想及其初步应用 (第 1 课时) 、 回归分析的基本思想及其初步应用。 ...

高中数学选修1-2第一章统计案例测试题带详细解答

高中数学选修1-2第一章统计案例测试题带详细解答_高三数学_数学_高中教育_教育专区。选修 1-2 第一章、统计案例测试一、选择题 1.已知 x 与 y 之间的一组...
更多相关标签:
统计选修了课程的人数 | 统计学案例 | 生活中的统计学案例 | 基层统计分析实用案例 | 统计学案例分析 | 统计学数据分析案例 | 统计案例 | 统计学案例分析论文 |
网站地图

文档资料共享网 nexoncn.com copyright ©right 2010-2020。
文档资料共享网内容来自网络,如有侵犯请联系客服。email:zhit325@126.com