当前位置:首页 >> 数学 >> 2.3_变量间的相关关系(第2课时)_图文

2.3_变量间的相关关系(第2课时)_图文

2.3

变量间的相关关系

第二课时

二、探究回归直线方程

如果散点图中点的分布从整体上看大致在一 条直线附近,我们就称这两个变量之间具有线性相 关关系,这条直线叫做回归直线. 注意:利用散点图可以判断变量之间有无相关关系.

思考:你认为回归直线应具有怎样特征?如何求回归直线?
回归直线:从整体上看各数据点与此直线的距离和最小. 假设已经得到两个具有线性相关关系的变量的一组 数据 ( x1 , y1 ), ( x2 , y2 ),?, ( xn , yn )

? ? bx ? a (其中a,b是待定参数.) 且所求回归方程是 y
问题:如何刻画从整体上看各数据点与此直线的距离最小?

假设已经得到两个具有线形相关关系的变量的一组 数据 ( x1 , y1 ), ( x2 , y2 ),?, ( xn , yn )

? ? bx ? a (其中a,b是待定参数.) 且所求回归方程是 y
当变量x取 xi (i ? 1, 2,?, n)时, ?i ? bxi ? a(i ? 1, 2,?n) 可得到 y

它与实际收集到的 yi 之间的偏差是

?i ? yi ? (bxi ? a) yi ? y

(i ? 1, 2?, n)

y
( x1 , y1 )

( xi , yi )
i

? }y ? y

i

}
( x2 , y2 )

( xn , yn )

x

?i ? yi ? (bxi ? a) yi ? y
y
( x1 , y1 )
( x2 , y2 )

(i ? 1, 2?, n)

( xi , yi )
? }y ? y
i i

?2 } y2 ? y

( xn , yn )

x
?i | 则 n 个偏差的和可表达为: ? | yi ? y
i ?1 n

由于含有绝对值,运算不方便,于是改用为

Q ? ( y1 ? bx1 ? a)2 ? ( y2 ? bx2 ? a)2 ? ?? ( yn ? bxn ? a)2
来刻画 n 个点与回归直线在整体上的偏差 所以,当 Q 取最小值时,总体偏差最小。

人们经过长期的实践与研究,已经找到了 计算回归方程的斜率与截距的一般公式:

?

b?
?

?

? ( x ? x)( y ? y) ? x y ? nxy
i ?1 i i

n

n

? ( x ? x)
i ?1 ? i

n

?

2

i ?1 n

i i 2 i

? x ? nx
i ?1

2

,

a ? y ?b x

y ? b x ?a

?

?

?

回归方程

回归方程的截距

以上公式的推导较复杂,故不作推导, 但它的原理较为简单:即各点到该直线的 距离的平方和最小,这一方法叫最小二乘 法。(参看如书P88-89)

回归方程的斜率,又叫回归系数

利用计算器或计算机可求得年龄和人体脂 肪含量的样本数据的回归方程为

y ? 0.577 x ? 0.448
由此我们可以根据一个人的年龄预测其体 内脂肪含量的百分比的回归值.若某人65岁, 则其体内脂肪含量的百分比约为多少?

?

0.577×65-0.448= 37.1
能不能说他体内脂肪含量一定是37.1%?
我们把由一个变量的变化去推测另一个变量 的方法称为回归方法。

【公式应用1】下表提供了某厂节油降耗技术发行后生产甲

产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准 煤)的几组对应数据.
x y 3 2.5 4 3 5 4 6 4.5

(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出 y关于x 的线性回归方程; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准 煤,试根据(2)求出的线性回归方程,预测生产100吨甲 产品的生产能耗比技改前降低多少吨标准煤?

解析:(1)散点图由学生自己画; 2)解:

? X Y ? 66.5
i ?1 i i

4

2 2 2 2 2 X ? 3 ? 4 ? 5 ? 6 ? 86 ? i i ?1

4

X ? 4.5

Y ? 3.5

? ? 3.5 ? 0.7 ? 4.5 ? 0.35 ? ? Y ? bX a y ? 0.7 x ? 0.35 所求的回归方程为
(3) x ? 100

66.5 ? 4 ? 4.5 ? 3.5 66.5 ? 63 ? b? ? ? 0.7 2 86 ? 4 ? 4.5 86 ? 81

y ? 100 ? 0.7 ? 0.35 ? 70.35

预测生产100吨甲产品的生产能耗比技改前降

低 90 ? 70.35 ? 19.65 (吨)

解:计算 x =2006, y =260.2 b?
?

? ( x ? x)( y ? y )
i ?1 i i

n

? ( x ? x)
i ?1 i

n

2

(-4) ? (-24.2)+(-2) ? (-14.2)+0 ? (-3.2)+2 ?15.8+4 ? 25.8 (-4) 2 +(-2) 2 +0 2 +2 2 +4 2 260 = 40 =6.5 ? a= y -b x ? 260.2 ? 6.5 ? 2006 =-12778.8 所以,回归直线方程为y=6.5x-12778.8

【归纳总结】
1、相关关系 (1)概念:自变量取值一定时,因变量的取值带有一 定随机性的两个变量之间的关系叫相关关系。 (2)相关关系与函数关系的异同点。 相同点:两者均是指两个变量间的关系。 不同点:函数关系是一种确定关系,是一种因果系; 相关关系是一种非确定的关系,也不一定是因果关系(但 可能是伴随关系)。

2、两个变量的线性相关
(1)回归分析 对具有相关关系的两个变量进行统计分析的方法叫 回归分析。通俗地讲,回归分析是寻找相关关系中非确 定关系的某种确定性。 (2)散点图

A、定义;B、正相关、负相关。
3、回归直线方程 注:如果关于两个变量统计数据的散点图呈现发散状,则 这两个变量之间不具有相关关系.

总结

求线性回归直线方程的步骤:
第一步:列表 x , y , x y ;
i i i i

第二步:计算

x, y, ? xi , ? xi
2 i ?1 i ?1

n

n

y ;
i

第三步:代入公式计算b,a的值; 第四步:写出直线方程。

3、回归直线方程 (1)回归直线:观察散点图的特征,如果各点大致分 布在一条直线的附近,就称两个变量之间具有线性相关的 关系,这条直线叫做回归直线。 (2)最小二乘法

? ? bx ? a y

n n ? ? (x i -x)(yi -y) ? x i yi -nxy ? ? b= i=1 = i=1 , ? n n 2 2 ? (x -x) x 2 -nx ? ? i i ? i=1 i=1 ? ?a=y-bx. ? 1 n 1 n 其中x= ? x i ,y= ? yi . n i=1 n i=1

(3)利用回归直线对总体进行估计


友情链接:省心范文网 | 省心范文网 | 省心范文网 | 省心范文网 | 省心范文网 | 省心范文网 | 学习资料共享网 | 兰溪范文 | 伤城文章网 | 酷我资料网 | 省心范文网 | 海文库 | 学习资料共享网 | 兰溪范文 | 伤城文章网 | 学习资料共享网 | 兰溪范文 | 伤城文章网 | 酷我资料网 | 省心范文网 | 海文库 | 学习资料共享网 | 兰溪范文 | 伤城文章网 | 学习资料共享网 | 兰溪范文 | 伤城文章网 | 酷我资料网 | 省心范文网 | 海文库 | 学习资料共享网 | 兰溪范文 | 伤城文章网 |
. | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . | . |
网站地图

文档资料共享网 nexoncn.com copyright ©right 2010-2020。
文档资料共享网内容来自网络,如有侵犯请联系客服。email:3088529994@qq.com