当前位置:首页 >> 数学 >> 8.5一元线性回归案例

8.5一元线性回归案例


高二数学 选修2-3

8.5一元线性回归 案例

莆二中高二1班
2013-5-25 郑平正 制作

复习 变量之间的两种关系
问题1:正方形的面积y与正方形的边长x之间 的函数关系是 y = x2 确定性关系 问题2:某水田水稻产量y与施肥量x之间是否 有一个确定性的关系? 例如:在 7 块并排

、形状大小相同的试验田上 进行施肥量对水稻产量影响的试验,得

到如下所示的一组数据:
施化肥量x
水稻产量y

15

20

25
365

30

35

40

45

330 345

405 445

450 455

一、定义:
自变量取值一定时,因变量的取值带有一定 随机性的两个变量之间的关系叫做相关关系。 注 1):相关关系是一种不确定性关系; 2):对具有相关关系的两个变量进行

统计分析的方法叫回归分析;
3):表示具有相关关系的两个变量的 一组数据的图形叫做散点图。

现实生活中存在着大量的相关关系。 如:人的身高与体重; 产品的成本与生产数量;

商品的销售额与广告费;
家庭的支出与收入。等等
那么两个具有相关关系的量可以用什么来刻画它们之间的关系?

案例 1 海牛是一种体型较大的水生哺乳动物,体重可达到 700kg, 以水草为食。美洲海牛生活在美国的佛罗里达洲,在船舶运输繁忙 季节,经常被船的螺旋桨击伤致死。下面是佛罗里达洲记录的 1977 年至 1990 年机动船只数目 x 和被船只撞死的海牛数 y 的数据。
年份 船只数量 x 撞死海牛数 y 年份 船只数量 x 撞死海牛数 y 1977 447 13 1984 559 34 1978 460 21 1985 585 33 1979 481 24 1986 614 33 1980 498 16 1987 645 39 1981 513 24 1988 675 43 1982 512 20 1989 711 50 1983 526 15 1990 719 47

现在问: (1)随着机动船的数量的增加,被撞死的海牛数是否会增加? (2)当机动船增加到 750 只,被撞死的海牛会是多少?

显然,在这个案例中,被撞死的海牛数是随机数,无法与机 动船只数建立函数关系。画出这组数据的散点图:
60 50 40 30 20 10 0

400

450

500

550

600

650

700

750

图 8-5-1 发现这些点分布在一条直线的附近,且有上升的趋势。那么 第一个问题的回答就需要知道被撞死的海牛数与船只的数量的密 切程度,引入相关系数。

用 s x 表示 ? x i ? 的标准差, s y 表示 ? y i ? 的标准差,定义
s xy ? x1 y 1 ? x 2 y 2 ? ? ? ? ? x n y n n ? xy

二、定义相关系数: (1)当 s x s y ? 0 ,称 r xy ?
s xy sxsy

为 ? x i ? 和 ? y i ? 的相关系数;

(2)当 r xy ? 0 ,我们称 ? x i ? 和 ? y i ? 正相关; (3)当 rxy ? 0 ,我们称 ? x i ? 和 ? y i ? 负相关; (4)当 r xy ? 0 ,我们称 ? x i ? 和 ? y i ? 不相关。

化简 r xy 得

rxy ?

s xy sxsy

?
?
i?1

n

xi yi ? nxy
2

?
i?1

n

xi ? nx
2

?
i?1

n

yi ? ny
2

2

理论可以证明相关系数 r xy 有以下性质:
(1) r xy 总是在区间 [ ? 1,1] 中取值;

(2)当 r xy ? 0 . 8 时, x 增加, y 也倾向于增加,这时数据
( x 1 , y 1 ), ( x 2 , y 2 ), ? ? ?, ( x n , y n ) 分散在一条上升的直线附近

( 3) 当 r xy

? ? 0 . 8 时 , x 增 加 , y 倾 向 于减 少 ,这 时数 据

( x 1 , y 1 ), ( x 2 , y 2 ), ? ? ?, ( x n , y n ) 分散在一条下降的直线附近

相关关系的测度
(相关系数取值及其意义)
完全负相关 无线性相关 完全正相关

-1.0

-0.5

0

+0.5
正相关程度增加

+1.0

r
负相关程度增加

r xy ?

s xy sxsy

三、相关系数的计算公式:
s xy ? x1 y 1 ? x 2 y 2 ? ? ? ? ? x n y n n
rxy ? s xy sxsy

? xy

相关系数的计算公式

?
?
i?1

n

x i y i ? n xy
2

?
i?1

n

xi ? nx
2

?
i?1

n

yi ? ny
2

2

四、回归直线方程:
? ? ? (1)所求直线方程 y = b x + a

叫做回归直线方程;

n 其中 ? ? ( x i ? x )( y i ? y ) ? ? b ? i ?1 n ? 2 ? ? ( xi ? x ) ? i ?1 ? ?a ? y ? bx

?
i ?1

n

xi yi ? n x y xi ? n x
2 2

?
i ?1

n

(2)相应的直线叫做回归直线。 (3)对两个变量进行的线性分析叫做线性回归分析。

(注意回归直线一定经过样本点的中心)

案例 1 海牛是一种体型较大的水生哺乳动物,体重可达到 700kg, 以水草为食。美洲海牛生活在美国的佛罗里达洲,在船舶运输繁忙 季节,经常被船的螺旋桨击伤致死。下面是佛罗里达洲记录的 1977 年至 1990 年机动船只数目 x 和被船只撞死的海牛数 y 的数据。
年份 船只数量 x 撞死海牛数 y 年份 船只数量 x 撞死海牛数 y 1977 447 13 1984 559 34 1978 460 21 1985 585 33 1979 481 24 1986 614 33 1980 498 16 1987 645 39 1981 513 24 1988 675 43 1982 512 20 1989 711 50 1983 526 15 1990 719 47

现在问: (1)随着机动船的数量的增加,被撞死的海牛数是否会增加? (2)当机动船增加到 750 只,被撞死的海牛会是多少?

解: (1)首先画出案例一相应的散点图:
60 50 40 30 20 10 0

400

450

500

550

600

650

700

750

i

xi

yi

xi yi

xi

2

yi

2

1 2 3 4 5 6 7 8 9 10 11 12 13 14

447 460 481 498 513 512 526 559 585 614 645 675 711 719

13 21 24 16 24 20 15 34 33 33 39 43 50 47

5811 9660 11544 7968 12312 10240 7890 19006 19305 20262 25155 29025 35550 33793
r
xy

199809 211600 231361 248004 263169 262144 276676 312481 342225 376996 416025 455625 505521 516961
? 0 . 9415

169 441 576 256 576 400 225 1156 1089 1089 1521 1849 2500 2209

x ? 567 . 5 , y ? 29 . 43
14
i
i

代入公式,利用计算器得到



则 ? x ? 和 ? y ? 高度正相关,因此,被撞死的海 14 14 2 2 ? x i ? 4618597 ? y i ? 1 4056 ? x i y i ? 247521 i ?1 i? i ?1 牛数会随着机动船数的增加而增加。1

i

xi

yi

xi yi

xi

2

yi

2

1 2 3 4 5 6 7 8 9 10 11 12 13 14

447 460 481 498 513 512 526 559 585 614 645 675 711 719

13 21 24 16 24 20 15 34 33 33 39 43 50 47

5811 9660 11544 7968 12312 10240 7890 19006 19305 20262 25155 29025 35550 33793

199809 211600 231361 248004 263169 262144 276676 312481 342225 376996 416025 455625 505521 516961

169 441 576 256 576 400 225 1156 1089 1089 1521 1849 2500 2209

x则 ? 567 . 5b ? ? 29 . 43 ,y

即回归直线是: y ? 0 . 125 ? 567 . 5 ? 29 . 43 247521 ? 14 x ? 41
4618597
2

?
i ?1

14

所以,当机动船只增加到 750 时,被撞死的海牛数的预测 14 14
x i y i ?a247521 ? y 4618597 ? b x? x29?. 43 ? 0 . 125 ? 567 ?. 5 4056 41 . 5 ? i ? yi 1 ? ?
2

? 14 ? 567 . 5

2

? 0 . 125

是 y i ?1 0 . 125 ? 750 ? 41 . 5 ?1 52 ( 只 ) ? i?

五、典例分析
例1 在 7 块并排、形状大小相同的试验田上 进行施肥量对水稻产量影响的试验,得 到如下所示的一组数据:(单位kg)
施化肥量x 水稻产量y
y
500 450 400 350 300 10 15 20 25 30 35 40 45

15

20

25 365

30

35

40

45

330 345

405 445

450 455

x

2)检验相关系数 r 的显著性水平: i xi yi xiyi 1 15 330 4950 2 20 345 6950
7 2

3 25 365 9125

4 30 405 12150
7 2

5 35 445 15575

6 40 450 18000
7

7 45 455 20475

x = 30 , y = 399.3 , ? x i = 7000 , ? y i =1132725 , ? x i y i = 87175
i ?1
7

i ?1

i ?1

r=
7 2 i ?1

?
i ?1

xi yi ? 7 xy
7 2 2 2

( ? x i ? 7 x )( ? y i ? 7 y )
i ?1

=

87175 ? 7 ? 30 ? 399 . 3 ( 7000 ? 7 ? 30 )( 1132725
2

≈0.9733
2

? 7 ? 399 . 3 )

这说明水稻产量与施化肥量之间高度正相关存在线性相关关系.

若点( x i , y i )的分布趋于一条直线,则 x i 与 y i 满足以下 关系式:
y i ? bx i ? a ? e i , i ? 1, 2 ,? ? ?, n

其中的 e1 , e 2 ,? ? ?, e n 表示随机误差。这个模型称为一元线性回归模 型。解决模型问题,只要求出一元线性回归直线 y ? bx ? a 。 当 r ? 0 时,点呈上升趋势分布,则 b ? 0 ; 当 r ? 0 时,点呈下降趋势分布,则 b ? 0 。

利用回归直线方程对总体进行线性相关性的检验 例2、炼钢是一个氧化降碳的过程,钢水含碳量的多少 直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼 时间的关系。如果已测得炉料熔化完毕时,钢水的含碳 量x与冶炼时间y(从炉料熔化完毕到出刚的时间)的一 列数据,如下表所示:

x(0.01%) y(min)

104 100

180 200

190 210

177 185

147 155

134 135

150 170

191 205

204 235

121 125

(1)y与x是否具有线性相关关系; (2)如果具有线性相关关系,求回归直线方程; (3)预测当钢水含碳量为160个0.01%时,应冶炼多少分 钟?

(1)列出下表,并计算
i xi yi xi y i
1 104 100 10400 2 180 200 3 190 210 4 177 185 5 147 155 6 134 135 7 150 170 8 191 205 9 204 235 10 121 125

36000 39900 32745 22785 18090 25500 39155 47940 15125

x ? 159.8, y ? 172,

?x
i ?1

10

2 i

? 265448, ?

10

y

2 i

? 312350, ?
i ?1

10

i ?1 10

xy
i

? 287640
i

?
i ?1

xi yi ? 1 0 x ? y ? 0 .9 9 0 6 .
2 10 2 2 i ?1

于是,r ?
10 2 i ?1

( ? x i ? 1 0 x )( ? y i ? 1 0 y )

? ? ? y ? bx ? a (2)设所求的回归方程为
^

?b ?

?x y
i i ?1

10

i

? 10 x y ? 10 x
2

?x
i ?1

10

? 1.267

2 i

^

a ? y ? b x ? ? 3 0 .5 1 .
? 所以回归直线的方程为 y=1.267x-30.51

(3)当x=160时,

? y ?

1.267.160-30.51=172

练习1、 假设关于某设备的使用年限x和所有支出的维修费用 y(万元)有如下的统计数据:

x Y

2 2.2

3 3.8

4 5.5

5 6.5

6 7.0

若由此资料所知y对x呈线性相关关系,试求: 1.回归直线方程 2.估计使用年限为10年时,维修费用是多少?

解题步骤: 1.作散点图

2.把数据列表,计算相应的值,求出回归系数 3.写出回归方程,并按要求进行预测说明。

解: (1)由已知数据制成表格。

i
xi yi

1 2 2.2 4.4 4

2 3 3.8 11.4 9
5 2

3 4 5.5 22.0 16

4 5 6.5 32.5 25
5

5 6 7.0 42.0 36

合计 20 25 112.3 90

xi yi
xi
2

x ? 4; y ? 5; ?

x i ? 9 0; ? x i y i ? 1 1 2 .3 .
i ?1

i ?1

? 所以有 b ? 1 .2 3, a ? 0 .0 8 . ?

? ? y ? 1 .2 3 x ? 0 .0 8 .

练习2 (2007年广东)下表提供了某厂节能降耗技术改造后生 产甲产品过程中记录的产量x(吨)与相应的生产能耗y (吨标 准煤)的几组对应数据。
X y 3 2.5 4 3 5 4 6 4.5

(1)请画出上表数据的散点图 (2)请根据上表提供的数据,用最小二乘法求出y关于x的 ? ? 性回归方程 y ? b x ? a

(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准 煤,试根据(2)求出的线性回归方程,预测生产100 吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值: ? 2.5 ? 4 ? 3 ? 5 ? 4 ? 6 ? 4.5 ? 66.5 ) 3

小结:一般地,建立一元线性回归模型的基本步骤为:
(1)画出确定好的解析变量和预报变量的散点图,观察它们 之间的关系(如是否存在线性关系等),计算相关系数。

r xy ?

s xy sxsy

(2)由经验确定回归方程的类型(如我们观察到数据呈线性 关系,则选用线性回归方程y=bx+a). (3)按一定规则估计回归方程中的参数(如最小二乘法)。

b ?

s xy s
2 x

, a ? y - bx

(4)求出回归直线方程y=bx+a,并利用回归直线进行预测。


更多相关文档:

一元线性回归案例

一元线性回归案例_人力资源管理_经管营销_专业资料。一元线性回归案例 1.最小二乘估计公式 ? ? y? ?b x a y ?y ? (x ? x ) ( i ?1 i i n (...

一元线性回归案例

一元线性回归案例_机械/仪表_工程科技_专业资料。讲述一元线性回归的使用案例 8.5 一元线性回归案例 一,教学内容与教学对象分析 学生将在必修课程学习统计的基础上...

一元线性回归方程案例数据

一元线性回归方程案例数据_数学_高中教育_教育专区 暂无评价|0人阅读|0次下载|举报文档 一元线性回归方程案例数据_数学_高中教育_教育专区。某中学高一期中考试后,...

一元线性回归模型案例分析

一元线性回归模型案例分析 一元线性回归模型案例分析一、研究的目的要求 居民消费...线性回归和灰色预测模型... 15页 1下载券 8.5一元线性回归分析案例... 39...

8.5一元线性回归案例(1)教学设计

8.5 一元线性回归案例(1)一、教学目标(一)知识目标 了解样本、样本量的概念;理解变量之间的相关关系的概念、相关系数等概念; (二)能力目标 掌握相关系数公式; (...

第二章一元线性回归案例分析

第二章一元线性回归案例分析_经济学_高等教育_教育专区。第二章 一元线性模型案例分析居民消费模式和消费规模分析 一、研究的目的要求 居民消费在社会经济的持续发展...

一元线性回归方程案例数据

一元线性回归方程案例数据_经济学_高等教育_教育专区。一元线性回归方程案例数据 一元线性回归方程案例数据 8. 一个工厂在某年里每月产品的总成本 据: (单位:...

一元线性回归案例spss

一元线性回归案例spss_数学_自然科学_专业资料。下图为 25 个职业人群的肺癌死亡指数(100=平均水平)和抽烟指数(100=平均 水平)。 职业 抽烟指数 肺癌死亡指数 农...

一元线性回归模型典型例题分析

一元线性回归模型典型例题分析_交通运输_工程科技_专业资料。第二章 一元线性回归模型典型例题分析 例 1、令 kids 表示一名妇女生育孩子的数目,educ 表示该妇女接受...

一元线性回归 案例分析1

线性回归模型解决实际经济问题的能力 ● 熟悉计量软件 Eviews 的基本操作 案例 1...1/2 相关文档推荐 一元回归 案例分析 5页 免费 8.5一元线性回归分析案例.....
更多相关标签:
多元线性回归模型案例 | spss多元线性回归案例 | 多元线性回归案例 | 多元线性回归分析案例 | 线性回归案例 | 一元线性回归案例 | 一元线性回归分析案例 | 一元线性回归模型案例 |
网站地图

文档资料共享网 nexoncn.com copyright ©right 2010-2020。
文档资料共享网内容来自网络,如有侵犯请联系客服。email:zhit325@126.com