当前位置:首页 >> 数学 >> 人教版高中数学必修3全套教案

人教版高中数学必修3全套教案


1.3 算法案例
整体设计 教学分析 在学生学习了算法的初步知识,理解了表示算法的算法步骤、程序框图和程序三种不同方式以后,再 结合典型算法案例,让学生经历设计算法解决问题的全过程,体验算法在解决问题中的重要作用,体会算 法的基本思想,提高逻辑思维能力,发展有条理地思考与数学表达能力. 三维目标 1.理解算法案例的算法步骤和程序框图. 2.引导学生得出自己设计的算法程序

. 3. 体会算法的基本思想,提高逻辑思维能力,发展有条理地思考与数学表达能力. 重点难点 教学重点:引导学生得出自己设计的算法步骤、程序框图和算法程序. 教学难点:体会算法的基本思想,提高逻辑思维能力,发展有条理地思考与数学表达能力. 课时安排 3 课时 教学过程 第 1 课时 案例 1 辗转相除法与更相减损术 导入新课 思路 1(情境导入) 大家喜欢打乒乓球吧,由于东、西方文化及身体条件的不同,西方人喜欢横握拍打球,东方人喜欢直 握拍打球,对于同一个问题,东、西方人处理问题方式是有所不同的.在小学,我们学过求两个正整数的最 大公约数的方法:先用两个数公有的质因数连续去除,一直除到所得的商是互质数为止,然后把所有的除 数连乘起来. 当两个数公有的质因数较大时(如?8 251?与 6 105) ,使用上述方法求最大公约数就比较困 难.下面我们介绍两种不同的算法——辗转相除法与更相减损术,由此可以体会东、西方文化的差异. 思路 2(直接导入) 前面我们学习了算法步骤、 程序框图和算法语句.今天我们将通过辗转相除法与更相减损术来进一步体 会算法的思想. 推进新课 新知探究 提出问题 (1)怎样用短除法求最大公约数? (2)怎样用穷举法(也叫枚举法)求最大公约数? (3)怎样用辗转相除法求最大公约数? (4)怎样用更相减损术求最大公约数? 讨论结果: (1)短除法 求两个正整数的最大公约数的步骤:先用两个数公有的质因数连续去除,一直除到所得的商是两个互 质数为止,然后把所有的除数连乘起来. (2)穷举法(也叫枚举法) 穷举法求两个正整数的最大公约数的解题步骤:从两个数中较小数开始由大到小列举,直到找到公约 数立即中断列举,得到的公约数便是最大公约数. (3)辗转相除法 辗转相除法求两个数的最大公约数,其算法步骤可以描述如下: 第一步,给定两个正整数 m,n.
第 1 页 共 89 页

第二步,求余数 r:计算 m 除以 n,将所得余数存放到变量 r 中. 第三步,更新被除数和余数:m=n,n=r. 第四步,判断余数 r 是否为 0.若余数为 0,则输出结果;否则转向第二步继续循环执行. 如此循环,直到得到结果为止. 这种算法是由欧几里得在公元前 300 年左右首先提出的,因而又叫欧 几里得算法. (4)更相减损术 我国早期也有解决求最大公约数问题的算法,就是更相减损术. 《九章算术》是中国古代的数学专著, 其中的“更相减损术”也可以用来求两个数的最大公约数,即“可半者半之,不可半者,副置分母、子之数, 以少减多,更相减损,求其等也.以等数约之.”翻译为现代语言如下: 第一步,任意给定两个正整数,判断它们是否都是偶数,若是,用 2 约简;若不是,执行第二步. 第二步,以较大的数减去较小的数,接着把所得的差与较小的数比较,并以大数减小数,继续这个操 作,直到所得的数相等为止,则这个数(等数)或这个数与约简的数的乘积就是所求的最大公约数. 应用示例 例 1 用辗转相除法求 8 251 与 6 105 的最大公约数,写出算法分析,画出程序框图,写出算法程序. 解:用两数中较大的数除以较小的数,求得商和余数:8 251=6 105× 1+2 146. 由此可得, 105 与 2 146 的公约数也是 8 251 与 6 105 的公约数, 6 反过来, 251 与 6 105 的公约数也是 6 105 8 与 2 146 的公约数,所以它们的最大公约数相等. 对 6 105 与 2 146 重复上述步骤:6 105=2 146× 2+1 813. 同理,2 146 与 1 813 的最大公约数也是 6 105 与 2 146 的最大公约数.继续重复上述步骤: 2 146=1 813× 1+333, 1 813=333× 5+148, 333=148× 2+37, 148=37× 4. 最后的除数 37 是 148 和 37 的最大公约数,也就是 8 251 与 6 105 的最大公约数. 这就是辗转相除法.由除法的性质可以知道,对于任意两个正整数,上述除法步骤总可以在有限步之后 完成,从而总可以用辗转相除法求出两个正整数的最大公约数. 算法分析:从上面的例子可以看出,辗转相除法中包含重复操作的步骤,因此可以用循环结构来构造算法. 算法步骤如下: 第一步,给定两个正整数 m,n. 第二步,计算 m 除以 n 所得的余数为 r. 第三步,m=n,n=r. 第四步,若 r=0,则 m,n 的最大公约数等于 m;否则,返回第二步. 程序框图如下图:

第 2 页 共 89 页

程序: INPUT m,n DO r=m MOD n m=n n=r LOOP UNTIL r=0 PRINT m END 点评:从教学实践看,有些学生不能理解算法中的转化过程,例如:求 8 251 与 6 105 的最大公约数,为什 么可以转化为求 6 105 与 2 146 的公约数.因为 8 251=6 105× 1+2 146, 可以化为 8 251-6 105× 1=2 164,所以公约数能够整除等式两边的数,即 6 105 与 2 146 的公约数也是 8 251 与 6 105 的公约数. 变式训练 你能用当型循环结构构造算法,求两个正整数的最大公约数吗?试画出程序框图和程序. 解:当型循环结构的程序框图如下图:

程序: INPUT m,n r=1 WHILE r>0 r=m MOD n m=n n=r WEND PRINT m END 例 2 用更相减损术求 98 与 63 的最大公约数. 解:由于 63 不是偶数,把 98 和 63 以大数减小数,并辗转相减,如下图所示. 98-63=35 63-35=28 35-28=7 28-7=21
第 3 页 共 89 页

21-7=14 14-7=7 所以,98 和 63 的最大公约数等于 7. 点评:更相减损术与辗转相除法的比较:尽管两种算法分别来源于东、西方古代数学名著,但是二者的算 理却是相似的,有异曲同工之妙.主要区别在于辗转相除法进行的是除法运算,即辗转相除;而更相减损 术进行的是减法运算,即辗转相减,但是实质都是一个不断的递归过程. 变式训练 用辗转相除法或者更相减损术求三个数 324,243,135 的最大公约数. 解:324=243× 1+81, 243=81× 3+0, 则 324 与 243 的最大公约数为 81. 又 135=81× 1+54,81=54× 1+27, 54=27× 2+0, 则 81 与 135 的最大公约数为 27. 所以,三个数 324、243、135 的最大公约数为 27. 另法:324-243=81,243-81=162,162-81=81,则 324 与 243 的最大公约数为 81. 135-81=54,81-54=27,54-27=27,则 81 与 135 的最大公约数为 27. 所以,三个数 324、243.135 的最大公约数为 27. 例 3 (1)用辗转相除法求 123 和 48 的最大公约数. (2)用更相减损术求 80 和 36 的最大公约数. 解: (1)辗转相除法求最大公约数的过程如下: 123=2× 48+27, 48=1× 27+21, 27=1× 21+6, 21=3× 6+3, 6=2× 3+0, 最后 6 能被 3 整除,得 123 和 48 的最大公约数为 3. (2)我们将 80 作为大数,36 作为小数,因为 80 和 36 都是偶数,要除公因数 2. 80÷ 2=40,36÷ 2=18. 40 和 18 都是偶数,要除公因数 2. 40÷ 2=20,18÷ 2=9. 下面来求 20 与 9 的最大公约数, 20-9=11, 11-9=2, 9-2=7, 7-2=5, 5-2=3, 3-2=1, 2-1=1, 可得 80 和 36 的最大公约数为 22× 1=4. 点评:对比两种方法控制好算法的结束,辗转相除法是到达余数为 0,更相减损术是到达减数和差相等. 变式训练 分别用辗转相除法和更相减损术求 1 734,816 的最大公约数. 解:辗转相除法: 1 734=816× 2+102,816=102× 8(余 0) , ∴1 734 与 816 的最大公约数是 102.
第 4 页 共 89 页

更相减损术:因为两数皆为偶数,首先除以 2 得到 867,408,再求 867 与 408 的最大公约数. 867-408=459, 459-408=51, 408-51=357, 357-51=306, 306-51=255, 255-51=204, 204-51=153, 153-51=102, 102-51=51. ∴1 734 与 816 的最大公约数是 51× 2=102. 利用更相减损术可另解: 1 734-816=918, 918-816=102, 816-102=714, 714-102=612, 612-102=510, 510-102=408, 408-102=306, 306-102=204, 204-102=102. ∴1 734 与 816 的最大公约数是 102. 知能训练 求 319,377,116 的最大公约数. 解:377=319× 1+58, 319=58× 5+29, 58=29× 2. ∴377 与 319 的最大公约数为 29,再求 29 与 116 的最大公约数. 116=29× 4. ∴29 与 116 的最大公约数为 29. ∴377,319,116 的最大公约数为 29. 拓展提升 试写出利用更相减损术求两个正整数的最大公约数的程序. 解:更相减损术程序: INPUT “m,n=”;m,n WHILE m<>n IF m>n THEN m=m-n ELSE m=n-m END IF WEND PRINT m END 课堂小结 (1)用辗转相除法求最大公约数.
第 5 页 共 89 页

(2)用更相减损术求最大公约数. 思想方法:递归思想. 作业 分别用辗转相除法和更相减损术求 261,319 的最大公约数. 分析:本题主要考查辗转相除法和更相减损术及其应用.使用辗转相除法可依据 m=nq+r,反复执行,直 到 r=0 为止;用更相减损术就是根据 m-n=r,反复执行,直到 n=r 为止. 解:辗转相除法: 319=261× 1+58, 261=58× 4+29, 58=29× 2. ∴319 与 261 的最大公约数是 29. 更相减损术: 319-261=58, 261-58=203, 203-58=145, 145-58=87, 87-58=29, 58-29=29, ∴319 与 261 的最大公约数是 29. 设计感想 数学不仅是一门科学,也是一种文化,本节的引入从东、西方文化的不同开始,逐步向学生渗透数学 文化.从知识方面主要学习用两种方法求两个正整数的最大公约数,从思想方法方面,主要学习递归思想. 本节设置精彩例题, 不仅让学生学到知识, 而且让学生进一步体会算法的思想, 培养学生的爱国主义情操. 第 2 课时 案例 2 秦九韶算法 导入新课 思路 1(情境导入) 大家都喜欢吃苹果吧,我们吃苹果都是从外到里一口一口的吃,而虫子却是先钻到苹果里面从里到外 一口一口的吃,由此看来处理同一个问题的方法多种多样.怎样求多项式 f(x)=x5+x4+x3+x2+x+1 当 x=5 时的 值呢?方法也是多种多样的,今天我们开始学习秦九韶算法. 思路 2(直接导入) 前面我们学习了辗转相除法与更相减损术, 今天我们开始学习秦九韶算法. 推进新课 新知探究 提出问题 (1)求多项式 f(x)=x5+x4+x3+x2+x+1 当 x=5 时的值有哪些方法?比较它们的特点. (2)什么是秦九韶算法? (3)怎样评价一个算法的好坏? 讨论结果: (1)怎样求多项式 f(x)=x5+x4+x3+x2+x+1 当 x=5 时的值呢? 一个自然的做法就是把 5 代入多项式 f(x),计算各项的值,然后把它们加起来,这时,我们一共做了 1+2+3+4=10 次乘法运算,5 次加法运算. 另一种做法是先计算 x2 的值,然后依次计算 x2· (x2· x,(x2· x)· 的值,这样每次都可以利 x, x)· ( x)· x 用上一次计算的结果,这时,我们一共做了 4 次乘法运算,5 次加法运算. 第二种做法与第一种做法相比,乘法的运算次数减少了,因而能够提高运算效率,对于计算机来说, 做一次乘法运算所用的时间比做一次加法运算要长得多,所以采用第二种做法,计算机能更快地得到结果. (2)上面问题有没有更有效的算法呢?我国南宋时期的数学家秦九韶(约 1202~1261)在他的著作《数书
第 6 页 共 89 页

九章》中提出了下面的算法: 把一个 n 次多项式 f(x)=anxn+an-1xn-1+…+a1x+a0 改写成如下形式: f(x)=anxn+an-1xn-1+…+a1x+a0 =(anxn-1+an-1xn-2+…+a1)x+ a0 =( nxn-2+an-1xn-3+…+a2)x+a1)x+a0 (a =… =(…( nx+an-1)x+an-2)x+…+a1)x+a0. (a 求多项式的值时,首先计算最内层括号内一次多项式的值,即 v1=anx+an-1, 然后由内向外逐层计算一次多项式的值,即 v2=v1x+an-2, v3=v2x+an-3, … vn=vn-1x+a0, 这样,求 n 次多项式 f(x)的值就转化为求 n 个一次多项式的值. 上述方法称为秦九韶算法.直到今天,这种算法仍是多项式求值比较先进的算法. (3)计算机的一个很重要的特点就是运算速度快,但即便如此,算法好坏的一个重要标志仍然是运算的 次数.如果一个算法从理论上需要超出计算机允许范围内的运算次数, 那么这样的算法就只能是一个理论的 算法. 应用示例 例 1 已知一个 5 次多项式为 f(x)=5x5+2x4+3.5x3-2.6x2+1.7x-0.8, 用秦九韶算法求这个多项式当 x=5 时的值. 解:根据秦九韶算法,把多项式改写成如下形式: f(x)=((((5x+2)x+3.5)x-2.6)x+1.7)x-0.8, 按照从内到外的顺序,依次计算一次多项式当 x=5 时的值: v0=5; v1=5× 5+2=27; v2=27× 5+3.5=138.5; v3=138.5× 5-2.6=689.9; v4=689.9× 5+1.7=3 451.2; v5=3 415.2× 5-0.8=17 255.2; 所以,当 x=5 时,多项式的值等于 17 255.2. 算法分析:观察上述秦九韶算法中的 n 个一次式,可见 vk 的计算要用到 vk-1 的值,若令 v0=an,我们可以 得到下面的公式:

?v 0 ? a n , ? ?v k ? v k ?1 x ? a n ? k (k ? 1,2, ? , n).
这是一个在秦九韶算法中反复执行的步骤,因此可用循环结构来实现. 算法步骤如下: 第一步,输入多项式次数 n、最高次的系数 an 和 x 的值. 第二步,将 v 的值初始化为 an,将 i 的值初始化为 n-1. 第三步,输入 i 次项的系数 ai. 第四步,v=vx+ai,i=i-1. 第五步,判断 i 是否大于或等于 0.若是,则返回第三步;否则,输出多项式的值 v. 程序框图如下图:
第 7 页 共 89 页

程序: INPUT “n=”;n INPUT “an=”;a INPUT “x=”;x v=a i=n-1 WHILE i>=0 PRINT “i=”;i INPUT “ai=”;a v=v*x+a i=i-1 WEND PRINT v END 点评:本题是古老算法与现代计算机语言的完美结合,详尽介绍了思想方法、算法步骤、程序框图和算法 语句,是一个典型的算法案例. 变式训练 请以 5 次多项式函数为例说明秦九韶算法,并画出程序框图. 解:设 f(x)=a5x5+a4x4+a3x3+a2x2+a1x+a0 首先,让我们以 5 次多项式一步步地进行改写: f(x)=(a5x4+a4x3+a3x2+a2x+a1)x+a0 =( 5x3+a4x2+ a3x+a2)x+a1)x+a0 (a =((a5x2+a4x+ a3)x+a2)x+a1)x+a0 ( =(( 5x+a4)x+ a3)x+a2)x+a1)x+a0. ((a 上面的分层计算,只用了小括号,计算时,首先计算最内层的括号,然后由里向外逐层计算,直到最外层的 括号,然后加上常数项即可. 程序框图如下图:

第 8 页 共 89 页

例 2 已知 n 次多项式 Pn(x)=a0xn+a1xn-1+…+an-1x+an,如果在一种算法中,计算 x 0 (k=2,3,4,…,n) 的值需要 k-1 次乘法,计算 P3(x0)的值共需要 9 次运算(6 次乘法,3 次加法) ,那么计算 P10(x0)的值共需 要__________次运算.下面给出一种减少运算次数的算法:P0(x)=a0,Pk+1(x)=xPk(x)+ak+1(k=0,1,2,?,n -1) .利用该算法,计算 P3(x0)的值共需要 6 次运算,计算 P10(x0)的值共需要___________次运算. 答案:65 20 点评: 秦九韶算法适用一般的多项式 f(x)=anxn+an-1xn-1+…+a1x+a0 的求值问题.直接法乘法运算的次数最多可 到达

k

(n ? 1)n ,加法最多 n 次.秦九韶算法通过转化把乘法运算的次数减少到最多 n 次,加法最多 n 次. 2

例 3 已知多项式函数 f(x)=2x5-5x4-4x3+3x2-6x+7,求当 x=5 时的函数的值. 解析:把多项式变形为:f(x)=2x5-5x4-4x3+3x2-6x+7 =((((2x-5)x-4)x+3)x-6)x+7. 计算的过程可以列表表示为:

最后的系数 2 677 即为所求的值. 算法过程: v0=2; v1=2× 5-5=5; v2=5× 5-4=21; v3=21× 5+3=108; v4=108× 5-6=534; v5=534× 5+7=2 677. 点评:如果多项式函数中有缺项的话,要以系数为 0 的项补齐后再计算. 知能训练 当 x=2 时,用秦九韶算法求多项式 f(x)=3x5+8x4-3x3+5x2+12x-6 的值. 解法一:根据秦九韶算法,把多项式改写成如下形式: f(x)=((((3x+8)x-3)x+5)x+12)x-6. 按照从内到外的顺序,依次计算一次多项式当 x=2 时的值. v0=3; v1=v0× 2+8=3× 2+8=14; v2=v1× 2-3=14× 2-3=25; v3=v2× 2+5=25× 2+5=55; v4=v3× 2+12=55× 2+12=122; v5=v4× 2-6=122× 2-6=238. ∴当 x=2 时,多项式的值为 238.
第 9 页 共 89 页

解法二:f(x)=((((3x+8)x-3)x+5)x+12)x-6, 则 f(2)=((((3× 2+8)× 2-3)× 2+5)× 2+12)× 2-6=238. 拓展提升 用秦九韶算法求多项式 f(x)=7x7+6x6+5x5+4x4+3x3+2x2+x 当 x=3 时的值. 解:f(x)=((((((7x+6)+5)x+4)x+3)x+2)x+1)x v0=7; v1=7× 3+6=27; v2=27× 3+5=86; v3=86× 3+4=262; v4=262× 3+3=789; v5=789× 3+2=2 369; v6=2 369× 3+1=7 108; v7=7 108× 3+0=21 324. ∴f(3)=21 324. 课堂小结 1.秦九韶算法的方法和步骤. 2.秦九韶算法的计算机程序框图. 作业 已知函数 f(x)=x3-2x2-5x+8,求 f(9)的值. 解:f(x)=x3-2x2-5x+8=(x2-2x-5)x+8=((x-2)x-5)x+8 ∴f(9)=((9-2)× 9-5)× 9+8=530. 设计感想 古老的算法散发浓郁的现代气息,这是一节充满智慧的课.本节主要介绍了秦九韶算法. 通过对秦九韶算法的学习,对算法本身有哪些进一步的认识? 教师引导学生思考、讨论、概括,小结时要关注如下几点: (1)算法具有通用的特点,可以解决一类 问题; (2)解决同一类问题,可以有不同的算法,但计算的效率是不同的,应该选择高效的算法; (3)算 法的种类虽多,但三种逻辑结构可以有效地表达各种算法等等. 第 3 课时 案例 3 进位制 导入新课 情境导入 在日常生活中,我们最熟悉、最常用的是十进制,据说这与古人曾以手指计数有关,爱好天文学的古 人也曾经采用七进制、十二进制、六十进制,至今我们仍然使用一周七天、一年十二个月、一小时六十分 的历法.今天我们来学习一下进位制. 推进新课 新知探究 提出问题 (1)你都了解哪些进位制? (2)举出常见的进位制. (3)思考非十进制数转换为十进制数的转化方法. (4)思考十进制数转换成非十进制数及非十进制之间的转换方法. 活动:先让学生思考或讨论后再回答,经教师提示、点拨,对回答正确的学生及时表扬,对回答不准确的 学生提示引导考虑问题的思路. 讨论结果: (1)进位制是人们为了计数和运算方便而约定的计数系统,约定满二进一,就是二进制;满十进一,就 是十进制;满十二进一,就是十二进制;满六十进一,就是六十进制等等.也就是说:“满几进一”就是几进 制,几进制的基数(都是大于 1 的整数)就是几.
第 10 页 共 89 页

(2)在日常生活中,我们最熟悉、最常用的是十进制,据说这与古人曾以手指计数有关,爱好天文学的 古人也曾经采用七进制、十二进制、六十进制,至今我们仍然使用一周七天、一年十二个月、一小时六十 分的历法. (3)十进制使用 0~9 十个数字.计数时,几个数字排成一行,从右起,第一位是个位,个位上的数字是几, 就表示几个一;第二位是十位,十位上的数字是几,就表示几个十;接着依次是百位、千位、万位…… 例如:十进制数 3 721 中的 3 表示 3 个千,7 表示 7 个百,2 表示 2 个十,1 表示 1 个一.于是,我们得到下 面的式子: 3 721=3× 3+7× 2+2× 1+1× 0. 10 10 10 10 与十进制类似,其他的进位制也可以按照位置原则计数.由于每一种进位制的基数不同,所用的数字个数也 不同.如二进制用 0 和 1 两个数字,七进制用 0~6 七个数字. 一般地,若 k 是一个大于 1 的整数,那么以 k 为基数的 k 进制数可以表示为一串数字连写在一起的形式 anan-1…a1a0(k) (0<an<k,0≤an-1,…,a1,a0<k). 其他进位制的数也可以表示成不同位上数字与基数的幂的乘积之和的形式,如 110 011(2)=1× 5+1× 4+0× 3+0× 2+1× 1+1× 0, 2 2 2 2 2 2 3 2 1 0 7 342(8)=7× +3× +4× +2× . 8 8 8 8 非十进制数转换为十进制数比较简单,只要计算下面的式子值即可: anan-1…a1a0(k)=an× n+an-1× n-1+…+a1× 0. k k k+a 第一步:从左到右依次取出 k 进制数 anan-1…a1a0(k)各位上的数字,乘以相应的 k 的幂,k 的幂从 n 开始取 值,每次递减 1,递减到 0,即 an× n,an-1× n-1,…,a1× 0× 0; k k k,a k 第二步:把所得到的乘积加起来,所得的结果就是相应的十进制数. (4)关于进位制的转换,教科书上以十进制和二进制之间的转换为例讲解,并推广到十进制和其他进制 之间的转换.这样做的原因是,计算机是以二进制的形式进行存储和计算数据的,而一般我们传输给计算机 的数据是十进制数据,因此计算机必须先将十进制数转换为二进制数,再处理,显然运算后首次得到的结 果为二进制数,同时计算机又把运算结果由二进制数转换成十进制数输出. 1°十进制数转换成非十进制数 把十进制数转换为二进制数,教科书上提供了“除 2 取余法”,我们可以类比得到十进制数转换成 k 进制数 的算法“除 k 取余法”. 2°非十进制之间的转换 一个自然的想法是利用十进制作为桥梁.教科书上提供了一个二进制数据与 16 进制数据之间的互化的方 法,也就是先由二进制数转化为十进制数,再由十进制数转化成为 16 进制数. 应用示例 思路 1 例 1 把二进制数 110 011(2)化为十进制数. 解:110 011(2)=1× 5+1× 4+0× 3+0× 2+1× 1+1× 0=1× 2 2 2 2 2 2 32+1× 16+1× 2+1=51. 点评:先把二进制数写成不同位上数字与 2 的幂的乘积之和的形式,再按照十进制的运算规则计算出结果. 变式训练 设计一个算法,把 k 进制数 a(共有 n 位)化为十进制数 b. 算法分析:从例 1 的计算过程可以看出,计算 k 进制数 a 的右数第 i 位数字 ai 与 ki-1 的乘积 ai·i-1,再将其 k 累加,这是一个重复操作的步骤.所以,可以用循环结构来构造算法. 算法步骤如下: 第一步,输入 a,k 和 n 的值. 第二步,将 b 的值初始化为 0,i 的值初始化为 1. 第三步,b=b+ai·i-1,i=i+1. k 第四步,判断 i>n 是否成立.若是,则执行第五步;否则,返回第三步. 第五步,输出 b 的值. 程序框图如下图:
第 11 页 共 89 页

程序: INPUT “a,k,n=”;a,k,n b=0 i=1 t=a MOD 10 DO b=b+t*k^(i-1) a=a\\10 t=a MOD 10 i=i+1 LOOP UNTIL i>n PRINT b END 例 2 把 89 化为二进制数. 解:根据二进制数“满二进一”的原则,可以用 2 连续去除 89 或所得商,然后取余数.具体计算方法如下: 因为 89=2× 44+1,44=2× 22+0, 22=2× 11+0, 11=2× 5+1, 5=2× 2+1, 2=2× 1+0, 1=2× 0+1, 所以 89=2× (2× (2× (2× (2× 2+1)+1)+0)+0)+1 2 =2× (2× (2× (2× (2 +1)+1)+0)+0)+1 6 5 =…=1×2 +0× +1× 4+1× 3+0× 2+0× 1+1× 0 2 2 2 2 2 2 =1 011 001(2). 这种算法叫做除 2 取余法,还可以用下面的除法算式表示:

第 12 页 共 89 页

把上式中各步所得的余数从下到上排列,得到 89=1 011 001(2). 上述方法也可以推广为把十进制数化为 k 进制数的算法,称为除 k 取余法. 变式训练 设计一个程序,实现“除 k 取余法”. 算法分析:从例 2 的计算过程可以看出如下的规律: 若十制数 a 除以 k 所得商是 q0,余数是 r0,即 a=k·0+r0,则 r0 是 a 的 k 进制数的右数第 1 位数. q 若 q0 除以 k 所得的商是 q1,余数是 r1,即 q0=k·1+r1,则 r1 是 a 的 k 进制数的左数第 2 位数. q …… 若 qn-1 除以 k 所得的商是 0,余数是 rn,即 qn-1=rn,则 rn 是 a 的 k 进制数的左数第 1 位数. 这样,我们可以得到算法步骤如下: 第一步,给定十进制正整数 a 和转化后的数的基数 k. 第二步,求出 a 除以 k 所得的商 q,余数 r. 第三步,把得到的余数依次从右到左排列. 第四步,若 q≠0,则 a=q,返回第二步;否则,输出全部余数 r 排列得到的 k 进制数. 程序框图如下图:

程序: INPUT “a,k=”;a,k b=0 i=0 DO q=a\\k r=a MOD k b=b+r*10^i i=i+1 a=q
第 13 页 共 89 页

LOOP UNTIL q=0 PRINT b END 思路 2 例 1 将 8 进制数 314 706(8)化为十进制数,并编写出一个实现算法的程序. 解:314 706(8)=3× 5+1× 4+4× 3+7× 2+0× 1+6× 0=104 902. 8 8 8 8 8 8 所以,化为十进制数是 104 902. 点评:利用把 k 进制数转化为十进制数的一般方法就可以把 8 进制数 314 706(8)化为十进制数. 例 2 把十进制数 89 化为三进制数,并写出程序语句. 解:具体的计算方法如下: 89=3× 29+2, 29=3× 9+2, 9=3× 3+0, 3=3× 1+0, 1=3× 0+1, 所以:89(10)=10 022(3). 点评:根据三进制数满三进一的原则,可以用 3 连续去除 89 及其所得的商,然后按倒序的顺序取出余数 组成数据即可. 知能训练 将十进制数 34 转化为二进制数. 分析:把一个十进制数转换成二进制数,用 2 反复去除这个十进制数,直到商为 0,所得余数(从下往上 读)就是所求. 解:

即 34(10)=100 010(2) 拓展提升 把 1 234(5)分别转化为十进制数和八进制数. 解:1 234(5)=1× 3+2× 2+3× 5 5 5+4=194.

则 1 234(5)=302(8) 所以,1 234(5)=194=302(8) 点评:本题主要考查进位制以及不同进位制数的互化.五进制数直接利用公式就可以转化为十进制数;五 进制数和八进制数之间需要借助于十进制数来转化. 课堂小结 (1)理解算法与进位制的关系. (2)熟练掌握各种进位制之间转化. 作业 习题 1.3A 组 3、4. 设计感想 计算机是以二进制的形式进行存储和计算数据的,而一般我们传输给计算机的数据是十进制数据,因
第 14 页 共 89 页

此计算机必须先将十进制数转换为二进制数,再处理,显然运算后首次得到的结果为二进制数,同时,计 算机又把运算结果由二进制数转换成十进制数输出.因此学好进位制是非常必要的,另外,进位制也是高考 的重点,本节设置了多种题型供学生训练,所以这节课非常实用.

第 15 页 共 89 页

第 2 课时 导入新课 思路 1 客观事物是相互联系的,过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.比如 说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说. 事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度.所以说,函数关系存在着 一种确定性关系,但还存在着另一种非确定性关系——相关关系.为表示这种相关关系,我们接着学习两个变 量的线性相关——回归直线及其方程. 思路 2 某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某 6 天卖出热茶的杯数与当天气 温的对照表: 气温/℃ 杯数 26 20 18 24 13 34 10 38 4 50 -1 64

如果某天的气温是-5 ℃,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?为解决这个问题我们 接着学习两个变量的线性相关——回归直线及其方程. 推进新课 新知探究 提出问题 (1)作散点图的步骤和方法? (2)正、负相关的概念? (3)什么是线性相关? (4)看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢? (5)什么叫做回归直线? (6)如何求回归直线的方程?什么是最小二乘法?它有什么样的思想? (7)利用计算机如何求回归直线的方程? (8)利用计算器如何求回归直线的方程? 活动:学生回顾,再思考或讨论,教师及时提示指导. 讨论结果: (1)建立相应的平面直角坐标系,将各数据在平面直角坐标中的对应点画出来,得到表示两个变 量的一组数据的图形,这样的图形叫做散点图.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来 描述变量之间的关系,即变量之间具有函数关系. b.如果所有的样本点都落在某一函数曲线附近,变量之间就 有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系) (2)如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角 到右下角的区域内,称为负相关. (3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系. (4)大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加,呈正相关的趋势,我们可以从散点图上来 进一步分析. (5)如下图:

从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.如果散点图中点的分布从整
第 16 页 共 89 页

体 上 看 大致 在 一条 直 线附 近 , 我 们就 称 这两 个 变量 之 间 具有 线 性相 关 关系 , 这 条 直线 叫 做回 归直线 (regression line).如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与 体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有 线性相关关系的代表. (6)从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线. 那么,我们应当如何具体求出这个回归方程呢? 有的同学可能会想,我可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到 达一个使距离的和最小的位置,测量出此时的斜率和截距,就可得到回归方程了.但是,这样做可靠吗? 有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同.同样地,这样 做能保证各点与此直线在整体上是最接近的吗? 还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、截距的 平均数,将这两个平均数当成回归方程的斜率和截距. 同学们不妨去实践一下,看看这些方法是不是真的可行? (学生讨论:1.选择能反映直线变化的两个点.2.在图中放上一根细绳,使得上面和下面点的个数相同或基本 相同.3.多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线 的斜率、截距.)教师:分别分析各方法的可靠性.如下图:

上面这些方法虽然有一定的道理,但总让人感到可靠性不强. 实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”.人们经 过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式

第 17 页 共 89 页

n ? ? ( xi ? x )( yi ? y ) ? i ?1 ? ? ?b ? n 2 ? ? ( xi ? x ) ? i ?1 ? ?a ? y ? bx. ?

?x y
i ?1 n i

n

i

? nx y , (1) ? nx
2

?x
i ?1

2 i

其中,b 是回归方程的斜率,a 是截距. 推导公式①的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理. 假设我们已经得到两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn),
^

且所求回归方程是 y =bx+a,
^

其中 a、b 是待定参数.当变量 x 取 xi(i=1,2,…,n)时可以得到 y =bxi+a(i=1,2,…,n),
^

它与实际收集到的 yi 之间的偏差是 yi- y =yi-(bxi+a)(i=1,2,…,n).

^

这样,用这 n 个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.由于(yi- y )可正可负,为了避 免相互抵消,可以考虑用

? | yi ? y i | 来 代 替 , 但 由 于 它 含 有 绝 对 值 , 运 算 不 太 方 便 , 所 以 改 用
i ?1

n

^

Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2 ② 来刻画 n 个点与回归直线在整体上的偏差. 这样,问题就归结为:当 a,b 取什么值时 Q 最小,即总体偏差最小.经过数学上求最小值的运算,a,b 的值由 公式①给出. 通过求②式的最小值而得出回归直线的方法, 即求回归直线, 使得样本数据的点到它的距离的平方和最小, 这一方法叫做最小二乘法(method of least square). (7)利用计算机求回归直线的方程. 根据最小二乘法的思想和公式①,利用计算器或计算机,可以方便地求出回归方程. 以 Excel 软件为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程,具体步骤 如下: ①在 Excel 中选定表示人体的脂肪含量与年龄的相关关系的散点图 (如下图) ,在菜单中选定“图表”中的“添 加趋势线”选项,弹出“添加趋势线”对话框. ②单击“类型”标签,选定“趋势预测/回归分析类型”中的“线性”选项,单击“确定”按钮,得到回归直线. ③双击回归直线,弹出“趋势线格式”对话框.单击“选项”标签,选定“显示公式”,最后单击“确定”按钮,得到回归
^

直线的回归方程 y =0.577x-0.448.

第 18 页 共 89 页

(8)利用计算器求回归直线的方程. 用计算器求这个回归方程的过程如下:

^

所以回归方程为 y =0.577x-0.448. 正像本节开头所说的,我们从人体脂肪含量与年龄这两个变量的一组随机样本数据中,找到了它们之间关 系的一个规律,这个规律是由回归直线来反映的. 直线回归方程的应用: ①描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系. ②利用回归方程进行预测;把预报因子(即自变量 x)代入回归方程对预报量(即因变量 Y)进行估计,即 可得到个体 Y 值的容许区间. ③利用回归方程进行统计控制规定 Y 值的变化,通过控制 x 的范围来实现统计控制的目标.如已经得到了空 气中 NO2 的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中 NO2 的浓度. 应用示例 思路 1 例 1 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热 饮杯数与当天气温的对比表: 摄氏温度/℃ 热饮杯数 -5 156 0 150 4 132 7 128 12 130 15 116 19 104 23 89 27 93 31 76 36 54

(1)画出散点图; (2)从散点图中发现气温与热饮销售杯数之间关系的一般规律; (3)求回归方程; (4)如果某天的气温是 2 ℃,预测这天卖出的热饮杯数. 解: (1)散点图如下图所示:
第 19 页 共 89 页

(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关, 即气温越高,卖出去的热饮杯数越少. (3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式①求出回归方程的系数.
^

利用计算器容易求得回归方程 y =-2.352x+147.767.
^

(4)当 x=2 时, y =143.063.因此,某天的气温为 2 ℃时,这天大约可以卖出 143 杯热饮. 思考 气温为 2 ℃时,小卖部一定能够卖出 143 杯左右热饮吗?为什么? 这里的答案是小卖部不一定能够卖出 143 杯左右热饮,原因如下: 1.线性回归方程中的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果的 偏差. 2.即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于 x 的预报值,能够与实际值 y 很接近. 我们不能保证点(x,y)落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近,事实上,
^

y=bx+a+e= y +e.
^

这里 e 是随机变量,预报值 y 与实际值 y 的接近程度由随机变量 e 的标准差所决定. 一些学生可能会提出问题:既然不一定能够卖出 143 杯左右热饮,那么为什么我们还以“这天大约可 以卖出 143 杯热饮”作为结论呢?这是因为这个结论出现的可能性最大.具体地说,假如我们规定可以选择 连续的 3 个非负整数作为可能的预测结果,则我们选择 142,143 和 144 能够保证预测成功(即实际卖出 的杯数是这 3 个数之一)的概率最大. 例 2 下表为某地近几年机动车辆数与交通事故数的统计资料. 机动车辆数 x/千台 交通事故数 y/千件 95 6.2 110 7.5 112 7.7 120 8.5 129 8.7 135 9.8 150 10.2 180 13

(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说明理由; (2)如果具有线性相关关系,求出线性回归方程. 解: (1)在直角坐标系中画出数据的散点图,如下图.

直观判断散点在一条直线附近,故具有线性相关关系.
第 20 页 共 89 页

(2)计算相应的数据之和:

? xi =1 031, ? yi =71.6,
i ?1 8 i ?1

8

8

? xi2 =137 835, ? xi y i =9 611.7.
i ?1 i ?1

8

将它们代入公式计算得 b≈0.077 4,a=-1.024 1, 所以,所求线性回归方程为=0.077 4x-1.024 1. 思路 2 例 1 给出施化肥量对水稻产量影响的试验数据: 施化肥量 x 水稻产量 y 15 330 20 345 25 365 30 405 35 445 40 450 45 455

(1)画出上表的散点图; (2)求出回归直线的方程. 解:(1)散点图如下图.

(2)表中的数据进行具体计算,列成以下表格: i xi yi xiyi 1 15 330 4 950 2 20 345 6 900
7

3 25 365 9 125
7

4 30 405 12 150

5 35 445 15 575
7

6 40 450 18 000

7 45 455 20 475

x ? 30, y ? 399 .3, ? xi2 ? 7000 , ? yi2 ? 1132725 , ? xi yi ? 87175
i ?1 i ?1 i ?1

故可得到 b=

87175 ? 7 ? 30 ? 399 .3 ≈4.75, 7000 ? 7 ? 30 2
^

a=399.3-4.75×30≈257. 从而得回归直线方程是 y =4.75x+257. 例 2 一个车间为了规定工时定额,需要确定加工零件所花费的时间. 为此进行了 10 次试验,测得数据如下: 零件个数 x(个) 加工时间 y(分) 10 62 20 68 30 75 40 81 50 89 60 95 70 102 80 108 90 115 100 122

请判断 y 与 x 是否具有线性相关关系,如果 y 与 x 具有线性相关关系,求线性回归方程. 解:在直角坐标系中画出数据的散点图,如下图.

第 21 页 共 89 页

直观判断散点在一条直线附近,故具有线性相关关系.由测得的数据表可知:

x ? 55, y ? 91.7, ? xi2 =38 500, ? y i2 =87 777, ? x i y i =55 950.
i ?1 i ?1 i ?1

10

10

10

?x y
b=
i ?1 10 i

10

i

? 10 x y ? ? 10 x 2

?x
i ?1

2 i

55950 ? 10 ? 55 ? 91.7 ≈0.668. 38500 ? 10 ? 55 2

a= y ? bx =91.7-0.668×55≈54.96.
^

因此,所求线性回归方程为 y =bx+a=0.668x+54.96. 例 3 已知 10 条狗的血球体积及红血球数的测量值如下: 血球体积 x(mL) 红血球数 y(百万) 45 6.53 42 6.30 46 9.52 48 7.50 42 6.99 35 5.90 58 9.49 40 6.20 39 6.55 50 8.72

(1)画出上表的散点图; (2)求出回归直线的方程. 解: (1)散点图如下.

(2) x ?

1 (45+42+46+48+42+35+58+40+39+50)=44.50, 10

y?

1 (6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37. 10
^

?x y
i ?1 10 i

10

i

? 10 x y
=0.175,a= y ? bx =-0.418,

设回归直线方程为 y =bx+a,则 b=

?x
i ?1

2 i

? 10 x

2

^

所以所求回归直线的方程为 y =0.175x-0.148. 点评:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数 a,b 的计算公式,算
第 22 页 共 89 页

出 a,b.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的 步骤:计算平均数 x, y ;计算 xi 与 yi 的积,求∑xiyi;计算∑xi2;将结果代入公式求 b;用 a= y ? bx 求 a;写 出回归直线方程. 知能训练 1.下列两个变量之间的关系哪个不是函数关系( ) A.角度和它的余弦值 B.正方形边长和面积 C.正n边形的边数和它的内角和 D.人的年龄和身高 答案:D 2.三点(3,10),(7,20),(11,24)的线性回归方程是( )
^ ^

A. y =5.75-1.75x
^

B. y =1.75+5.75x
^

C. y =1.75-5.75x

D. y =5.75+1.75x

答案:D 3.已知关于某设备的使用年限 x 与所支出的维修费用 y(万元),有如下统计资料: 使用年限 x 维修费用 y 2 2.2
^

3 3.8

4 5.5

5 6.5

6 7.0

设 y 对 x 呈线性相关关系.试求: (1)线性回归方程 y =bx+a 的回归系数 a,b; (2)估计使用年限为 10 年时,维修费用是多少? 答案: (1)b=1.23,a=0.08; (2)12.38. 4.我们考虑两个表示变量 x 与 y 之间的关系的模型,δ 为误差项,模型如下: 模型 1:y=6+4x;模型 2:y=6+4x+e. (1)如果 x=3,e=1,分别求两个模型中 y 的值; (2)分别说明以上两个模型是确定性模型还是随机模型. 解: (1)模型 1:y=6+4x=6+4× 3=18; 模型 2:y=6+4x+e=6+4× 3+1=19. (2)模型 1 中相同的 x 值一定得到相同的 y 值,所以是确定性模型;模型 2 中相同的 x 值,因 δ 的不同,所得 y 值不一定相同,且 δ 为误差项是随机的,所以模型 2 是随机性模型. 5.以下是收集到的新房屋销售价格 y 与房屋大小 x 的数据: 房屋大小 x(m2) 销售价格 y (万元) 80 18.4 105 22 110 21.6 115 24.8 135 29.2

(1)画出数据的散点图; (2)用最小二乘法估计求线性回归方程. 解: (1)散点图如下图.

第 23 页 共 89 页

(2)n=5,

? xi =545, x =109, ? yi =116, y =23.2,
i ?1 i ?1 5

5

5

? xi2 =60 952, ? xi y i =12 952,
i ?1 i ?1

5

b=

5 ? 12952 ? 545 ? 116 ≈0.199,a=23.2-0.199×109≈1.509, 5 ? 60952 ? 545 2

所以,线性回归方程为 y=0.199x+1.509. 拓展提升 某调查者从调查中获知某公司近年来科研费用支出(Xi)与公司所获得利润(Yi)的统计资料如下表: 科研费用支出(Xi)与利润(Yi)统计表 单位:万元 年份 1998 1999 2000 2001 2002 2003 合计
^ ^

科研费用支出 5 11 4 5 3 2 30
^

利润 31 40 30 34 25 20 180

要求估计利润(Yi)对科研费用支出(Xi)的线性回归模型. 解:设线性回归模型直线方程为: Y i ? ? 0 ? ? 1 X i , 因为: x ?

?X
n

i

?

30 =5, Y ? 6

?Y
n

i

?

180 =30, 6
(Xi- X )(Yi- Y ) 0 60 0 0 10 30 100

根据资料列表计算如下表: 年份 1998 1999 2000 2001 2002 2003 合计 Xi 5 11 4 5 3 2 30 Yi 31 40 30 34 25 20 180 XiYi 155 440 120 170 75 40 1 000 Xi2 25 121 16 25 9 4 200 Xi- X 0 6 -1 0 -2 -3 0 Yi- Y 1 10 0 4 -5 -10 0 (Xi- X )2 0 36 1 0 4 9 50

现求解参数 β0、β1 的估计值: 方法一: ? 1 ?
^ ^
^

n ? X ? (? X i )
2 i

n? X i Yi ? ? Yi

2

?

6 ? 1000 ? 30 ? 180 6000 ? 5400 600 ? ? =2, 1200 ? 900 300 6 ? 200 ? 30 2

? 0 ? Y ? ? 1 x =30-2×5=20.
方法二: ? 1 ?
^

? X Y ? nx Y ? X ? n( x )
i i 2 i

2

?

1000 ? 6 ? 5 ? 30 100 ? =2, 50 200 ? 6 ? 5 2
第 24 页 共 89 页

? 0 ? Y ? ? 1 x =30-2×5=20.
方法三: ? 1 ?
^ ^
^

^

^

? ( X ? x )(Y ? Y ) ? 100 =2, 50 ? ( X ? x)
i i 2 i
^

? 0 ? Y ? ? 1 x =30-2×5=20.
所以利润(Yi)对科研费用支出(Xi)的线性回归模型直线方程为: Y i =20+2Xi. 课堂小结 1.求线性回归方程的步骤: (1)计算平均数 x, y ; (2)计算 xi 与 yi 的积,求∑xiyi; (3)计算∑xi2,∑yi2,
n ? ? ( xi ? x )( yi ? y ) ? ?b ? i ?1 n ? ? (4)将上述有关结果代入公式 ? 2 ? ( xi ? x ) ? i ?1 ? ? a ? y ? bx ?

?x y
i ?1 n i

n

i

? nx y , ? nx
2

?x
i ?1

2 i

求 b,a,写出回归直线方程. 2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程 系数公式建立线性回归方程. 作业 习题 2.3A 组 3、4,B 组 1、2. 设计感想 本节课在上节课的基础上,利用实例分析了散点图的分布规律,推导出了线性回归直线的方程的求法,并 利用回归直线的方程估计可能的结果,本节课讲得较为详细,实例较多,便于同学们分析比较.思路 1 和思路 2 的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情 操教育、意志教育和增强学生的自信心,养成良好的学习态度,树立时间观,培养勤奋、刻苦的精神.

第二章

统计

本章教材分析 现代社会是信息化的社会,数字信息随处可见,因此专门研究如何收集、整理、分析数据的科学—— 统计学就备受重视. 统计学是研究如何收集、 整理、 分析数据的科学, 它可以为人们制定决策提供依据. 在 客观世界中,需要认识的现象无穷无尽.要认识某现象的第一步就是通过观察或试验取得观测资料,然后 通过分析这些资料来认识此现象.如何取得有代表性的观测资料并能够正确地加以分析,是正确地认识未 知现象的基础,也是统计所研究的基本问题.本章主要介绍最基本的获取样本数据的方法,以及几种从样 本数据中提取信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内容. 从义务教育阶段来看, 统计知识的教学从小学到初中分为三个阶段, 在每个阶段都要学习收集、 整理、 描述和分析数据等处理数据的基本方法,教学目标随着学段的升高逐渐提高.在义务教育阶段的统计与概 率知识的基础上, 《课程标准》要求通过实际问题及情境,进一步介绍随机抽样、样本估计总体、线性回 归的基本方法, 了解用样本估计总体及其特征的思想, 体会统计思维与确定性思维的差异; 通过实习作业, 较为系统地经历数据收集与处理的全过程,进一步体会统计思维与确定性思维的差异. 本章教学时间约需 7 课时,具体分配如下(仅供参考) :
第 25 页 共 89 页

2.1.1 2.1.2 2.1.3 2.2.1 2.2.2 2.3

简单随机抽样 系统抽样 分层抽样 用样本的频率分布估计总体分布 用样本的数字特征估计总体的数字特征 变量间的相关关系 本章复习

约 1 课时 约 1 课时 约 1 课时 约 1 课时 约 1 课时 约 1 课时 约 1 课时

2.1 随机抽样 2.1.1 简单随机抽样
整体设计 教学分析 教材是以探究一批小包装饼干的卫生是否达标为问题导向,逐步引入简单随机抽样概念.并通过实例 介绍了两种简单随机抽样方法:抽签法和随机数法. 值得注意的是为了使学生获得简单随机抽样的经验,教学中要注意增加学生实践的机会.例如,用抽 签法决定班里参加某项活动的代表人选,用随机数法从全年级同学中抽取样本计算平均身高等等. 三维目标 1.能从现实生活或其他学科中推出具有一定价值的统计问题,提高学生分析问题的能力. 2.理解随机抽样的必要性和重要性,提高学生学习数学的兴趣. 3.学会用抽签法和随机数法抽取样本,培养学生的应用能力. 重点难点 教学重点:理解随机抽样的必要性和重要性,用抽签法和随机数法抽取样本. 教学难点:抽签法和随机数法的实施步骤. 课时安排 1 课时 教学过程 导入新课 抽样的方法很多,某个抽样方法都有各自的优越性与局限性,针对不同的问题应当选择适当的抽样方 法.教师点出课题:简单随机抽样. 推进新课 新知探究 提出问题 (1)在 1936 年美国总统选举前,一份颇有名气的杂志(Literary Digest)的工作人员做了一次民意测验.调 查兰顿(A.Landon)(当时任堪萨斯州州长)和罗斯福(F.D.Roosevelt)(当时的总统)中谁将当选下一届总统.为了 了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在 1936 年电话和汽车 只有少数富人拥有).通过分析收回的调查表,显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中获胜. 实际选举结果正好相反,最后罗斯福在选举中获胜,其数据如下: 候选人 Roosevelt Landon 预测结果% 43 57 选举结果% 62 38

你认为预测结果出错的原因是什么?由此可以总结出什么教训? (2)假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备 怎样做?显然,你只能从中抽取一定数量的饼干作为检验的样本.那么,应当怎样获取样本呢? (3)请总结简单随机抽样的定义. 讨论结果: (1)预测结果出错的原因是:在民意测验的过程中,即抽取样本时,抽取的样本不具有代表性.1936 年拥
第 26 页 共 89 页

有电话和汽车的美国人只是一小部分,那时大部分人还很穷.其调查的结果只是富人的意见,不能代表穷 人的意见. 由此可以看出,抽取样本时,要使抽取出的样本具有代表性,否则调查的结果与实际相差较大. (2)要对这批小包装饼干进行卫生达标检查,只能从中抽取一定数量的饼干作为检验的样本,用样本的卫生 情况来估计这批饼干的卫生情况.如果对这批饼干全部检验,那么费时费力,等检查完了,这批饼干可能 就超过保质期了,再就是会破坏这批饼干的质量,导致无法出售. 获取样本的方法是: 将这批小包装饼干, 放入一个不透明的袋子中, 搅拌均匀, 然后不放回地摸取 (这 样可以保证每一袋饼干被抽到的可能性相等) ,这样就可以得到一个样本.通过检验样本来估计这批饼干 的卫生情况.这种抽样方法称为简单随机抽样. (3)一般地,设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本(n≤N),如果每次抽取时 总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样方 法有两种:抽签法和随机数法. 提出问题 (1)抽签法是大家最熟悉的,也许同学们在做某种游戏,或者选派一部分人参加某项活动时就用过抽签 法.例如,高一(2)班有 45 名学生,现要从中抽出 8 名学生去参加一个座谈会,每名学生的机会均等.我们可以把 45 名学生的学号写在小纸片上,揉成小球,放到一个不透明袋子中,充分搅拌后,再从中逐个抽出 8 个号签,从 而抽出 8 名参加座谈会的学生. 请归纳抽签法的定义.总结抽签法的步骤. (2)你认为抽签法有什么优点和缺点?当总体中的个体数很多时,用抽签法方便吗? (3)随机数法是利用随机数表或随机骰子或计算机产生的随机数进行抽样. 我们仅学习随机数表法即利用随 机数表产生的随机数进行简单随机抽样的方法. 怎样利用随机数表产生样本呢?下面通过例子来说明. 假设我们要考察某公司生产的 500 克袋装牛奶的质量是否达标,现从 800 袋牛奶中抽取 60 袋进行检验. 利用随机数表抽取样本时,可以按照下面的步骤进行. 第一步,先将 800 袋牛奶编号,可以编为 000,001,…,799. 第二步,在随机数表中任选一个数.例如选出第 8 行第 7 列的数 7(为了便于说明,下面摘取了附表 1 的第 6 行至第 10 行.) 16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28 第三步,从选定的数 7 开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数 785,由于 785<799,说明号码 785 在总体内,将它取出;继续向右读,得到 916,由于 916>799,将它去掉.按照这种方法继续 向右读,又取出 567,199,507,…,依次下去,直到样本的 60 个号码全部取出.这样我们就得到一个容量为 60 的 样本. 请归纳随机数表法的步骤. (4)当 N=100 时,分别以 0,3,6 为起点对总体编号,再利用随机数表抽取 10 个号码.你能说出从 0 开始 对总体编号的好处吗? (5)请归纳随机数表法的优点和缺点. 讨论结果: (1)一般地,抽签法就是把总体中的 N 个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后, 每次从中抽取一个号签,连续抽取 n 次,就得到一个容量为 n 的样本. 抽签法的步骤是: 1°将总体中个体从 1—N 编号; 2°将所有编号 1—N 写在形状、大小相同的号签上;
第 27 页 共 89 页

3°将号签放在一个不透明的容器中,搅拌均匀; 4°从容器中每次抽取一个号签,并记录其编号,连续抽取 n 次; 5°从总体中将与抽取到的签的编号相一致的个体取出. (2)抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,如果标号的签搅拌得不均匀, 会导致抽样不公平.因此说当总体中的个体数很多时,用抽签法不方便.这时用随机数法. (3)随机数表法的步骤: 1°将总体中个体编号; 2°在随机数表中任选一个数作为开始; 3°规定从选定的数读取数字的方向; 4°开始读取数字,若不在编号中,则跳过,若在编号中则取出,依次取下去,直到取满为止; 5°根据选定的号码抽取样本. (4)从 0 开始编号时,号码是 00,01,02,…,99;从 3 开始编号时,号码是 003,004,…,102;从 6 开 始编号时,号码是 006,007,…,105.所以以 3,6 为起点对总体编号时,所编的号码是三位,而从 0 开 始编号时,所编的号码是两位,在随机数表中读数时,读取两位比读取三位要省时,所以从 0 开始对总体 编号较好. (5)综上所述可知,简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的.但是, 如果总体中的个体数很多时,对个体编号的工作量太大,即使用随机数表法操作也并不方便快捷.另外,要 想“搅拌均匀”也非常困难,这就容易导致样本的代表性差. 应用示例 例 1 某车间工人加工一种轴共 100 件,为了了解这种轴的直径,要从中抽取 10 件轴在同一条件下测量, 如何采用简单随机抽样的方法抽取样本? 分析:简单随机抽样有两种方法:抽签法和随机数表法,所以有两种思路. 解法一(抽签法) : ①将 100 件轴编号为 1,2,…,100; ②做好大小、形状相同的号签,分别写上这 100 个号码; ③将这些号签放在一个不透明的容器内,搅拌均匀; ④逐个抽取 10 个号签; ⑤然后测量这 10 个号签对应的轴的直径的样本. 解法二(随机数表法) : ①将 100 件轴编号为 00,01,…99; ②在随机数表中选定一个起始位置,如取第 22 行第 1 个数开始(见教材附录 1:随机数表); ③规定读数的方向,如向右读; ④依次选取 10 个为 68,34,30,13,70,55,74,77,40,44, 则这 10 个号签相应的个体即为所要抽取的样本. 点评:本题主要考查简单随机抽样的步骤.抽签法的关键是为了保证每个个体被抽到的可能性相等而必须 搅拌均匀,当总体中的个体无差异,并且总体容量较小时,用抽签法;用随机数表法读数时,所编的号码 是几位,读数时相应地取连续的几个数字,当总体中的个体无差异,并且总体容量较多时,用抽签法. 变式训练 1.下列抽样的方式属于简单随机抽样的有____________. (1)从无限多个个体中抽取 50 个个体作为样本. (2)从 1 000 个个体中一次性抽取 50 个个体作为样本. (3)将 1 000 个个体编号,把号签放在一个足够大的不透明的容器内搅拌均匀,从中逐个抽取 50 个个体 作为样本. (4)箱子里共有 100 个零件,从中选出 10 个零件进行质量检验,在抽样操作中,从中任意取出一个零件 进行质量检验后,再把它放回箱子.
第 28 页 共 89 页

(5)福利彩票用摇奖机摇奖. 解析: (1)中,很明显简单随机抽样是从有限多个个体中抽取,所以(1)不属于; (2)中,简单随机抽 样是逐个抽取,不能是一次性抽取,所以(2)不属于;很明显(3)属于简单随机抽样; (4)中,抽样是 放回抽样,但是简单随机抽样是不放回抽样,所以(4)不属于;很明显(5)属于简单随机抽样. 答案: (5) (3) 2.要从某厂生产的 30 台机器中随机抽取 3 台进行测试,写出用抽签法抽样样本的过程. 分析:由于总体容量和样本容量都较小,所以用抽签法. 解:抽签法,步骤: 第一步,将 30 台机器编号,号码是 01,02,…,30. 第二步,将号码分别写在一张纸条上,揉成团,制成号签. 第三步,将得到的号签放入不透明的袋子中,并充分搅匀. 第四步,从袋子中依次抽取 3 个号签,并记录上面的编号. 第五步,所得号码对应的 3 台机器就是要抽取的样本. 例 2 人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都 是从 52 张牌中抽取 13 张牌,问这种抽样方法是否是简单随机抽样? 解:简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽 然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样. 点评:判断简单随机抽样时,要紧扣简单随机抽样的特征:逐个、不放回抽取且保证每个个体被抽到的可 能性相等. 变式训练 现在有一种“够级”游戏,其用具为四副扑克,包括大小鬼(又称为花)在内共 216 张牌,参与人数为 6 人并坐成一圈.“够级”开始时,从这 6 人中随机指定一人从已经洗好的扑克牌中随机抽取一张牌(这叫 开牌) 然后按逆时针方向, , 根据这张牌上的数字来确定谁先抓牌, 6 人依次从 216 张牌中抓取 36 张牌, 这 问这种抓牌方法是否是简单随机抽样? 解:在这里只有抽取的第一张扑克牌是随机抽取的,其他 215 张牌已经确定,即这 215 张扑克牌被抽取的 可能性与第一张扑克牌可能性不相同,所以不是简单随机抽样. 知能训练 1.为了了解全校 240 名学生的身高情况,从中抽取 40 名学生进行测量,下列说法正确的是( ) A.总体是 240 B.个体 C.样本是 40 名学生 D.样本容量是 40 答案:D 2.为了了解所加工一批零件的长度,抽测了其中 200 个零件的长度,在这个问题中,200 个零件的长度是 ( ) A.总体 B.个体 C.总体的一个样本 D.样本容量 答案:C 3.一个总体中共有 200 个个体,用简单随机抽样的方法从中抽取一个容量为 20 的样本,则某一特定个体 被抽到的可能性是____________. 答案:

1 10

4.为了检验某种产品的质量,决定从 40 件产品中抽取 10 件进行检查,如何用简单随机抽样抽取样本? 解:方法一(抽签法) : ①将这 40 件产品编号为 1,2,…,40; ②做好大小、形状相同的号签,分别写上这 40 个号码; ③将这些号签放在一个不透明的容器内,搅拌均匀; ④连续抽取 10 个号签; ⑤然后对这 10 个号签对应的产品检验. 方法二(随机数表法) :
第 29 页 共 89 页

①将 40 件产品编号,可以编为 00,01,02,…,38,39; ②在随机数表中任选一个数作为开始,例如从第 8 行第 9 列的数 5 开始, ; ③从选定的数 5 开始向右读下去,得到一个两位数字号码 59,由于 59>39,将它去掉;继续向右读,得 到 16,将它取出;继续下去,又得到 19,10,12,07,39,38,33,21,随后的两位数字号码是 12,由于它在前面 已经取出,将它去掉,再继续下去,得到 34.至此,10 个样本号码已经取满,于是,所要抽取的样本号 码是 16,19,10,12,07,39,38,33,21,34. 拓展提升 现有一批编号为 10,11,…,99,100,…,600 的元件,打算从中抽取一个容量为 6 的样本进行质 量检验.如何用随机数法设计抽样方案? 分析:重新编号,使每个号码的位数相同. 解:方法一: 第一步,将元件的编号调整为 010,011,012,…,099,100,…,600. 第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第 6 行第 7 个数“9”,向右 读. 第三步,从数“9”开始,向右读,每次读取三位,凡不在 010—600 中的数跳过去不读,前面已经读过的也跳 过去不读,依次可得到 544,354,378,520,384,263. 第四步,以上这 6 个号码所对应的 6 个元件就是所要抽取的对象. 方法二: 第一步,将每个元件的编号加 100,重新编号为 110,111,112,…,199,200,…,700. 第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第 8 行第 1 个数“6”,向右读. 第三步,从数“6”开始,向右读,每次读取三位,凡不在 110—700 中的数跳过去不读,前面已经读过的也跳 过去不读,依次可得到 630,163,567,199,507,175. 第四步,这 6 个号码分别对应原来的 530,63,467,99,407,75.这些号码对应的 6 个元件就是要抽取的 对象. 课堂小结 1.简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放 回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法. 2.抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅 拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点是当总体容量较大时,仍然不是 很方便,但是比抽签法公平,因此这两种方法只适合总体容量较小的抽样类型. 3.简单随机抽样每个个体入样的可能性都相等,均为

n ,但是这里一定要将每个个体入样的可能性、第 N

n 次每个个体入样的可能性、特定的个体在第 n 次被抽到的可能性这三种情况区分开来,避免在解题中出 现错误. 作业 课本本节练习 2、3. 设计感想 本节教学设计以课程标准的要求为指导, 重视引导学生参与到教学中, 体现了学生的主体地位. 同时, 根据高考的要求,适当拓展了教材,做到了用教材,而不是教教材.

第 30 页 共 89 页

2.1.2 系统抽样
整体设计 教学分析 教材通过探究“学生对教师教学的意见”过程,介绍了一种最简单的系统抽样——等距抽样,并给出实 施等距抽样的步骤. 值得注意的是在教学过程中,适当介绍当

N 不是整数时,应如何实施系统抽样. n

三维目标 1.理解系统抽样,会用系统抽样从总体中抽取样本,了解系统抽样在实际生活中的应用,提高学生学习 数学的兴趣. 2.通过自学课后“阅读与思考”,让学生进一步了解虚假广告是淡化总体和抽样方法、强化统计结果来夸大 产品的有效性,以提高学生理论联系实际的能力. 重点难点 教学重点:实施系统抽样的步骤. 教学难点:当 课时安排 1 课时 教学过程 导入新课 思路 1 上一节我们学习了简单随机抽样,那么简单随机抽样的特点是什么?简单随机抽样是最简单和最基本 的抽样方法,当总体中的个体较少时,常采用简单随机抽样.但是如果总体中的个体较多时,怎样抽取样 本呢?教师点出课题:系统抽样. 思路 2 某中学有 5 000 名学生,打算抽取 200 名学生,调查他们对奥运会的看法,采用简单随机抽样时,无 论是抽签法还是随机数法,实施过程很复杂,需要大量的人力和物力,那么有没有更为方便可行的抽样方 法呢?这就是今天我们学习的内容:系统抽样. 推进新课 新知探究 提出问题 (1) 某学校为了了解高一年级学生对教师教学的意见, 打算从高一年级 500 名学生中抽取 50 名进行调查, 除了用简单随机抽样获取样本外,你能否设计其他抽取样本的?方法?? (2)请归纳系统抽样的定义和步骤. (3)系统抽样有什么特点? 讨论结果: (1)可以将这 500 名学生随机编号 1—500,分成 50 组,每组 10 人,第 1 组是 1—10,第二组 11—20,依次 分下去,然后用简单随机抽样在第 1 组抽取 1 人,比如号码是 2,然后每隔 10 个号抽取一个,得到 2,12, 22,…,492. 这样就得到一个容量为 50 的样本. 这种抽样方法称为系统抽样. (2)一般地,要从容量为 N 的总体中抽取容量为 n 的样本,可将总体分成均衡的若干部分,然后按照预先制 定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样. 其步骤是: 1°采用随机抽样的方法将总体中的 N 个个体编号;
第 31 页 共 89 页

N 不是整数,如何实施系统抽样. n

2°将整体按编号进行分段,确定分段间隔 k(k∈N,l≤k); 3°在第 1 段用简单随机抽样确定起始个体的编号 l(l∈N,l≤k); 4°按照一定的规则抽取样本.通常是将起始编号 l 加上间隔 k 得到第 2 个个体编号(l+k), 再加上 k 得到第 3 个个体编号(l+2k),这样继续下去,直到获取整个样本. 说明:从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简 单化,体现了数学转化思想. (3)系统抽样的特点是: 1°当总体容量 N 较大时,采用系统抽样; 2°将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样, 这时间隔一般为 k=[

N ] . n

3°预先制定的规则指的是:在第 1 段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分 段间隔的整倍数即为抽样编号. 应用示例 例 1 为了了解参加某种知识竞赛的 1 000 名学生的成绩,应采用什么抽样方法较恰当?简述抽样过程. 解:适宜选用系统抽样,抽样过程如下: (1)随机地将这 1 000 名学生编号为 1,2 ,3,…,1000. (2)将总体按编号顺序均分成 50 部分,每部分包括 20 个个体. (3)在第一部分的个体编号 1,2,3,…,20 中,利用简单随机抽样抽取一个号码,比如 18. (4)以 18 为起始号码,每间隔 20 抽取一个号码,这样得到一个容量为 50 的样本:18,38,58,…,978, 998. 点评:系统抽样与简单随机抽样一样,每个个体被抽到的概率都相等,从而说明系统抽样是等概率抽样,它 是公平的.系统抽样是建立在简单随机抽样的基础之上的,当将总体均分后对每一部分进行抽样时,采用 的是简单随机抽样. 变式训练 1.下列抽样不是系统抽样的是( ) A.从标有 1—15 号的 15 个小球中任选 3 个作为样本,按从小号到大号排序,随机确定起点 i,以后为 i+5, i+10(超过 15 则从 1 再数起)号入样 B.工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验 C.搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止 D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为 14 的观众留下来座谈 分析:C 中,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样,所以不是系统抽样. 答案:C 2.某校高中三年级的 295 名学生已经编号为 1,2,…,295,为了了解学生的学习情况,要按 1∶5 的比例 抽取一个样本,用系统抽样的方法进行抽取,并写出过程. 分析:按 1∶5 分段,每段 5 人,共分 59 段,每段抽取一人,关键是确定第 1 段的编号. 解:抽样过程是: (1)按照 1∶5 的比例,应该抽取的样本容量为 295÷ 5=59,我们把 259 名同学分成 59 组,每组 5 人,第 一组是编号为 1—5 的 5 名学生,第 2 组是编号为 6—10 的 5 名学生,依次下去,59 组是编号为 291—295 的 5 名学生; (2)采用简单随机抽样的方法,从第一组 5 名学生中抽出一名学生,不妨设编号为 l(l≤5); (3)按照一定的规则抽取样本.抽取的学生编号为 l+5k(k=0,1,2,…,58),得到 59 个个体作为样本,如当 k=3 时的样本编号为 3,8,13,…,288,293. 例 2 为了了解参加某种知识竞赛的 1 003 名学生的成绩,请用系统抽样抽取一个容量为 50 的样本. 分析:由于

1003 不是整数,所以先从总体中随机剔除 3 个个体. 50
第 32 页 共 89 页

步骤: (1)随机地将这 1003 个个体编号为 1,2,3,…,1003. (2)利用简单随机抽样,先从总体中剔除 3 个个体(可利用随机数表) ,剩下的个体数?1 000?能被样本 容量 50 整除,然后再重新编号为 1,2,3,…,1000. (3)确定分段间隔.

1000 =20,则将这 1 000 名学生分成 50 组,每组 20 人,第 1 组是 1,2,3,…,20; 50

第 2 组是 21,22,23,…,40;依次下去,第 50 组是 981,982,…,1000. (4)在第 1 组用简单随机抽样确定第一个个体编号 l(l≤20). (5)按照一定的规则抽取样本.抽取的学生编号为 l+20k (k=0,1,2,…,19),得到 50 个个体作为样本,如 当 k=2 时的样本编号为 2,22,42,…,982. 点评:如果遇到

N 不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能 n

被样本容量整除. 变式训练 1.某校高中三年级有 1 242 名学生,为了了解他们的身体状况,准备按 1∶40 的比例抽取一个样本,那么 ( ) A.剔除指定的 4 名学生 B.剔除指定的 2 名学生 C.随机剔除 4 名学生 D.随机剔除 2 名学生 分析:为了保证每名学生被抽到的可能性相等,必须是随机剔除学生,由于

1242 的余数是 2,所以要剔 40

除 2 名学生. 答案:D 2.从 2 005 个编号中抽取 20 个号码,采用系统抽样的方法,则抽样的分段间隔为( ) A.99 B.99.5 C.100 D.100.5 答案:C 例 3 从已编号为 1—50 的 50 枚最新研制的某种型号的导弹中随机抽取 5 枚来进行发射实验, 若采用每部 分选取的号码间隔一样的系统抽样方法,则所选取 5 枚导弹的编号可能是( ) A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,4,6,16,32 分析:用系统抽样的方法抽取到的导弹编号应该为 k,k+d,k+2d,k+3d,k+4d,其中 d=50/5=10,k 是 1 到 10 中用 简单随机抽样方法得到的数,因此只有选项 B 满足要求. 答案:B 点评:利用系统抽样抽取的样本的个体编号按从小到大的顺序排起来,从第 2 个号码开始,每一个号码与 前一个号码的差都等于同一个常数,这个常数就是分段间隔. 变式训练 某小礼堂有 25 排座位,每排 20 个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情 况,留下座位号是 15 的所有 25 名学生进行测试,这里运用的是_________抽样方法. 答案:系统 知能训练 1.从学号为 0—50 的高一某班 50 名学生中随机选取 5 名同学参加数学竞赛,采用系统抽样的方法,则所 选 5 名学生的学号不可能是( ) A.1,2,3,4,5 B.5,15,25,35,45 C.2, 12, 22, 32, 42 D.9,19,29,39,49 答案:A 2.采用系统抽样从个体数为 83 的总体中抽取一个样本容量为 10 的样本,那么每个个体入样的可能性为 ( )
第 33 页 共 89 页

A.

1 83

B.

1 80

C.

1 10

D.不相等

答案:A 3.某单位的在岗工人为 624 人,为了调查工作上班时从家到单位的路上平均所用的时间,决定抽取 10% 的工人调查这一情况,如何采用系统抽样的方法完成这一抽样? 答案:先随机剔除 4 人,再按系统抽样抽取样本. 4.某学校有学生 3 000 人,现在要抽取 100 人组成夏令营,怎样抽取样本? 分析:由于总体人数较多,且无差异,所以按系统抽样的步骤来进行抽样. 解:按系统抽样抽取样本,其步骤是: ①将 3 000 名学生随机编号 1,2,…,3000; ②确定分段间隔 k=

3000 =30,将整体按编号进行分 100 组,第 1 组 1—30,第 2 组 31—60,依次分下去, 100

第 100 组 2971—3000; ③在第 1 段用简单随机抽样确定起始个体的编号 l(l∈N,0≤l≤30) ; ④按照一定的规则抽取样本,通常是将起始编号 l 加上间隔 30 得到第 2 个个体编号 l+30,再加上 30,得 到第 3 个个体编号 l+60, 这样继续下去, 直到获取整个样本. 比如 l=15, 则抽取的编号为: 45, …, 15, 75, 2985. 这些号码对应的学生组成样本. 拓展提升 将参加数学竞赛的 1 000 名学生编号如下 000,001,002,…,999,打算从中抽取一个容量为 50 的 样本,按系统抽样方法分成 50 个部分,第一组编号为 000,002,…,019,如果在第一组随机抽取的一个 号码为 015,则抽取的第 40 个号码为_____________. 分析:利用系统抽样抽取样本,在第一组抽取号码为 l=015,分段间隔为 k=

1000 =20,则在第 i 组中抽 50

取的号码为 015+20(i-1).则抽取的第 40 个号码为 015+(40-1)× 20=795. 答案:795 课堂小结 通过本节的学习,应明确什么是系统抽样,系统抽样的适用范围,如何用系统抽样获取样本. 作业 习题 2.1A 组 3.

第 34 页 共 89 页

2.1.3 分层抽样
整体设计 教学分析 教材从“了解某地区中小学生的近视情况及其形成原因”的探究中引入的概念.在探究过程中,应该引 导学生体会:调查者是利用事先掌握的各种信息对总体进行分层,这可以保证每一层一定有个体被抽到, 从而使得样本具有更好的代表性.为了达到此目的,教材利用右栏问题“你认为哪些因素可能影响到学生 的视力?设计抽样方法时,需要考虑这些因素吗?”来引导学生思考,在教学中要充分注意这一点. 教材在探究初中和小学的抽样个数时, 在右栏提出问题“想一想, 为什么要这样取各个学段的个体数?” 用意是向学生强调:含有个体多的层,在样本中的代表也应该多,即样本在该层的个体数也应该多.这样 的样本才具有更好的代表性. 三维目标 1.理解分层抽样的概念,掌握其实施步骤,培养学生发现问题和解决问题的能力; 2.掌握分层抽样与简单随机抽样和系统抽样的区别与联系,提高学生的总结和归纳能力,让学生领会到 客观世界的普遍联系性. 重点难点 教学重点:分层抽样的概念及其步骤. 教学难点:确定各层的入样个体数目,以及根据实际情况选择正确的抽样方法. 课时安排 1 课时 教学过程 导入新课 思路 1 中国共产党第十七次代表大会的代表名额原则上是按各选举单位的党组织数、党员人数进行分配的, 并适当考虑前几次代表大会代表名额数等因素.按照这一分配办法,各选举单位的代表名额,比十六大时 都有增加.另外,按惯例,中央将确定一部分已经退出领导岗位的老党员作为特邀代表出席大会.这种产 生代表的方法是简单随机抽样还是系统抽样?教师点出课题:分层抽样. 思路 2 我们已经学习了两种抽样方法:简单随机抽样和系统抽样,本节课我们学习分层抽样. 推进新课 新知探究 提出问题 (1)假设某地区有高中生 2 400 人,初中生 10 900 人,小学生 11 000 人,此地教育部门为了了解本地区中小 学的近视情况及其形成原因, 要从本地区的小学生中抽取 1%的学生进行调查, 你认为应当怎样抽取样本? (2)想一想为什么这样取各个学段的个体数? (3)请归纳分层抽样的定义. (4)请归纳分层抽样的步骤. (5)分层抽样时如何分层?其适用于什么样的总体? 讨论结果:(1)分别利用系统抽样在高中生中抽取 2 400× 1%=24 人,在初中生中抽取 10 900× 1%=109 人, 在小学生中抽取 11 000× 1%=110 人.这种抽样方法称为分层抽样. (2)含有个体多的层,在样本中的代表也应该多,即样本从该层中抽取的个体数也应该多.这样的样本才有 更好的代表性. (3)一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个 体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样. (4)分层抽样的步骤: ①分层:按某种特征将总体分成若干部分(层) ;
第 35 页 共 89 页

②按抽样比确定每层抽取个体的个数; ③各层分别按简单随机抽样的方法抽取样本; ④综合每层抽样,组成样本. (5)分层抽样又称类型抽样,应用分层抽样应遵循以下要求: ①分层时将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏 的原则,即保证样本结构与总体结构一致性. ②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数 量的比与这层个体数量与总体容量的比相等. ③当总体个体差异明显时,采用分层抽样. 应用示例 例 1 一个单位有职工 500 人,其中不到 35 岁的有 125 人,35 岁至 49 岁的有 280 人,50 岁以上的有 95 人,为了了解这个单位职工与身体状况有关的某项指标,要从中抽取 100 名职工作为样本,职工年龄与这 项指标有关,应该怎样抽取? 分析:由于职工年龄与这项指标有关,所以应选取分层抽样来抽取样本. 解:用分层抽样来抽取样本,步骤是: (1)分层:按年龄将 150 名职工分成三层:不到 35 岁的职工;35 岁至 49 岁的职工;50 岁以上的职工.

100 1 1 ? ,则在不到 35 岁的职工中抽 125× =25 人;在 35 岁至 500 5 5 1 1 49 岁的职工中抽 280× =56 人;在 50 岁以上的职工中抽 95× =19 人. 5 5
(2)确定每层抽取个体的个数.抽样比为 (3)在各层分别按抽签法或随机数表法抽取样本. (4)综合每层抽样,组成样本. 点评: 本题主要考查分层抽样及其实施步骤. 如果总体中的个体有差异时, 那么就用分层抽样抽取样本. 用 分层抽样抽取样本时,要把性质、结构相同的个体组成一层. 变式训练 1.某市的 3 个区共有高中学生 20 000 人,且 3 个区的高中学生人数之比为 2∶3∶5,现要从所有学生中抽 取一个容量为 200 的样本,调查该市高中学生的视力情况,试写出抽样过程. 分析:由于该市高中学生的视力有差异,按 3 个区分成三层,用分层抽样来抽取样本.在 3 个区分别抽取 的学生人数之比也是 2∶3∶5,所以抽取的学生人数分别是 200× 200×

2 3 =40;200× =60; 2?3?5 2?3?5

5 =100. 2?3?5

解:用分层抽样来抽取样本,步骤是: (1)分层:按区将 20 000 名高中生分成三层. (2)确定每层抽取个体的个数.在这 3 个区抽取的学生数目分别是 40、60、100. (3)在各层分别按随机数表法抽取样本. (4)综合每层抽样,组成样本. 2.某单位有老年人 28 人,中年人 54 人,青年人 81 人,为了调查他们的身体状况,从他们中抽取容量为 36 的样本,最适合抽取样本的方法是( ) A.简单随机抽样 B.系统抽样 C.分层抽样 D.先从老年人中剔除 1 人,再用分层抽样 分析:总人数为 28+54+81=163.样本容量为 36,由于总体由差异明显的三部分组成,考虑用分层抽样.若 按 36∶163 取样,无法得到整解,故考虑先剔除 1 人,抽取比例变为 36∶162=2∶9,则中年人取 12 人, 青年人取 18 人,先从老年人中剔除 1 人,老年人取 6 人,组成 36 的样本. 答案:D 例 2 某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有 40 种、10 种、30
第 36 页 共 89 页

种、20 种,现从中抽取一个容量为 20 的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽 取的植物油类与果蔬类食品种数之和是( ) A.4 B.5 C.6 D.7 分析:抽样比为

20 1 1 = ,则抽取的植物油类种数是 10× =2,则抽取的果蔬类食品种数是 5 40 ? 10 ? 30 ? 20 5

20× =4,所以抽取的植物油类与果蔬类食品种数之和是 2+4=6. 答案:C 点评:如果 A、B、C 三层含有的个体数目分别是 x、y、z,在 A、B、C 三层应抽取的个体数目分别是 m、 n、p,那么有 x∶y∶z=m∶n∶p;如果总体有 N 个个体,所抽取的样本容量为 n,某层所含个体数目为 a,在该 层抽取的样本数目为 b,那么有

1 5

n b ? . N a

变式训练 1.(2007 浙江高考,文 13)某校有学生 2 000 人,其中高三学生 500 人.为了解学生的身体素质情况,采 用 按 年 级 分 层 抽 样 的 方 法 , 从 该 校 学 生 中 抽 取 一 个 200 人 的 样 本 . 则 样 本 中 高 三 学 生 的 人 数 为 ______________. 分析:抽样比为

200 1 1 ? ,样本中高三学生的人数为 500× =50. 2000 10 10

答案:50 2.甲校有 3 600 名学生,乙校有 5 400 名学生,丙校有 1 800 名学生,为统计三校学生某方面的情况,计划 采用分层抽样法,抽取一个容量为 90 人的样本,应在这三校分别抽取学生( ) A.30 人,30 人,30 人 B.30 人,45 人,15 人 C.20 人,30 人,10 人 D.30 人,50 人,10 人 分析:抽样比是 400=45 人,

90 1 1 1 ,则应在这三校分别抽取学生: × 600=30 人, 3 × 5 ? 120 120 3600 ? 5400 ? 1800 120

1 × 800=15 人. 1 120

答案:B 知能训练 1.某城区有农民、工人、知识分子家庭共计 2 000 家,其中农民家庭 1 800 户,工人家庭 100 户.现要从 中抽取容量为 40 的样本,调查家庭收入情况,则在整个抽样过程中,可以用到下列抽样方法( ) ①简单随机抽样 ②系统抽样 ③分层抽样 A.②③ B.①③ C.③ D.①②③ 分析:由于各家庭有明显差异,所以首先应用分层抽样的方法分别从农民、工人、知识分子这三类家庭中 抽出若干户,即 36 户、2 户、2 户.又由于农民家庭户数较多,那么在农民家庭这一层宜采用系统抽样; 而工人、知识分子家庭户数较少,宜采用简单随机抽样法.故整个抽样过程要用到①②③三种抽样法. 答案:D 2.某地区有 300 家商店,其中大型商店有 30 家 ,中型商店有 75 家,小型商店有 195 家.为了掌握各商 店的营业情况,要从中抽取一个容量为 20 的样本.若采用分层抽样的方法,抽取的中型商店数是 ______________. 答案:5 3.某校 500 名学生中,O 型血有 200 人,A 型血有 125 人,B 型血有 125 人,AB 型血有 50 人,为了研 究血型与色弱的关系,需从中抽取一个容量为 20 的样本.怎样抽取样本? 分析:由于研究血型与色弱的关系,按血型分层,用分层抽样抽取样本.利用抽样比确定抽取各种血型的 人数. 解:用分层抽样抽取样本.
第 37 页 共 89 页

20 2 2 ,即抽样比为 . ? 500 50 50 2 2 2 ∴200× =8,125× =5,50× =2. 50 50 50
∵ 故 O 型血抽 8 人,A 型血抽 5 人,B 型血抽 5 人,AB 型血抽 2 人. 抽样步骤: ①确定抽样比

2 ; 50

②按比例分配各层所要抽取的个体数,O 型血抽 8 人,A 型血抽 5 人,B 型血抽 5 人,AB 型血抽 2 人; ③用简单随机抽样分别在各种血型中抽取样本,直至取出容量为 20 的样本. 拓展提升 某高级中学有学生 270 人,其中一年级 108 人,二、三年级各 81 人,现要利用抽样方法抽取 10 人参 加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时, 将学生按一、二、三年级依次统一编号为 1,2,…,270;使用系统抽样时,将学生统一随机编号 1,2,…, 270,并将整个编号依次分为 10 段.如果抽得号码有下列四种情况: ①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,92,119,146,173,200,227,254; ④30,57,84,111,138,165,192,219,246,270. 关于上述样本的下列结论中,正确的是( ) A.②③都不能为系统抽样 B.②④都不能为分层抽样 C.①④都可能为系统抽样 D.①③都可能为分层抽样 分析:如果按分层抽样时,在一年级抽取 108×

10 10 =4 人,在二、三年级各抽取 81× =3 人,则在号码 270 270

段 1,2,…,108 抽取 4 个号码,在号码段 109,110,…,189 抽取 3 个号码,在号码段 190,191,…, 270 抽取 3 个号码,①②③符合,所以①②③可能是分层抽样,④不符合,所以④不可能是分层抽样;如 果按系统抽样时,抽取出的号码应该是“等距”的,①③符合,②④不符合,所以①③都可能为系统抽样, ②④都不能为系统抽样. 答案:D 点评:根据样本的号码判断抽样方法时,要紧扣三类抽样方法的特征.利用简单随机抽样抽取出的样本号 码没有规律性; 利用分层抽样抽取出的样本号码有规律性,即在每一层抽取的号码个数 m 等于该层所含个 体数目与抽样比的积,并且应该恰有 m 个号码在该层的号码段内; 利用系统抽样取出的样本号码也有规律 性,其号码按从小到大的顺序排列,则所抽取的号码是:l,l+k,l+2k,…,l+(n-1)k.其中,n 为样本容量,l 是第一组中的号码,k 为分段间隔=总体容量/样本容量. 课堂小结 本节课学习了分层抽样的定义及其实施步骤. 作业 习题 2.1A 组 5. 设计感想 本节课重视从学生的生活经验和已有知识中学习数学和理解数学.首先为教材内容选择生活背景, 让学 生体验数学问题来源于生活实际;其次,大胆调用学生熟知的生活经验,使数学学习变得易于理解掌握;第 三,善于联系生活实际有机改编教材习题,让学生在实践活动中理解掌握知识,变“学了做”为“做中学”.

第 38 页 共 89 页

2.2 用样本估计总体 2.2.1 用样本的频率分布估计总体分布
整体设计 教学分析 教科书通过探究栏目引导学生思考居民生活用水定额管理问题,引出总体分布的估计问题,该案例贯穿 于本节始终.通过对该问题的探究,使学生学会列频率分布表、画频率分布直方图、频率分布折线图.教科书 在这里主要介绍有关频率分布的列表和画图的方法,而关于频率分布的随机性和规律性方面则给教师留下 了较大的发挥空间.教师可以通过初中有关随机事件的知识,也可以利用计算机多媒体技术,引导学生进一步 体会由样本确定的频率分布表和频率分布直方图的随机性; 通过初中有关频率与概率之间的关系,了解频率 分布直方图的规律性,即频率分布与总体分布之间的关系,进一步体会用样本估计总体的思想. 由于样本频率分布直方图可以估计总体分布,因此可以用样本频率分布特征来估计相应的总体分布特 征,这就提供了估计总体特征的另一种途径,其意义在于:在没有原始数据而仅有频率分布的情况下,此方法 可以估计总体的分布特征. 三维目标 1.通过实例体会分布的意义和作用,通过对现实生活的探究,感知应用数学知识解决问题的方法. 2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图,理解数形结合的 数学思想和逻辑推理的数学方法. 3.通过对样本分析和总体估计的过程,感受数学对实际生活的需要,通过实例体会频率分布直方图、 频率折线 图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地作出总体估计,认识到数学知识源 于生活并指导生活的事实,体会数学知识与现实世界的联系. 重点难点 教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 教学难点:能通过样本的频率分布估计总佒的分布. 课时安排 1 课时 教学过程 导入新课 思路 1 在 NBA 的 2006 赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕ 甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49,50 乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29,33 请问从上面的数据中你能否看出甲、乙两名运动员哪一位发挥比较稳定? 如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率 分布估计总体分布(板书课题). 思路 2 如下样本是随机抽取近年来北京地区 7 月 25 日至 8 月 24 日的日最高气温. 7 月 25 日至 8 月 10 日 8月8日 至8月 24 日 41.9 32.5 28.6 32.8 37.5 34.6 31.5 29.8 35.7 33.0 28.8 25.6 35.4 30.8 33.2 24.7 37.2 31.0 32.5 30.0 38.1 28.6 30.3 30.1 34.7 31.5 30.2 29.5 33.7 28.8 29.8 30.3 33.1 33.3

怎样通过上表中的数据,分析比较两时间段内的高温(≥33 ℃)状况?这就是我们这堂课要研究、学习 的主要内容——用样本的频率分布估计总体分布. 思路 3 讨论:我们要了解我校学生每月零花钱的情况,应该怎样进行抽样?
第 39 页 共 89 页

提问:学习了哪些抽样方法?一般在什么时候选取什么样的抽样方法呢? 讨论:通过抽样方法收集数据的目的是什么?(从中寻找所包含的信息,用样本去估计总体) 指出两种估计手段:一是用样本的频率分布估计总体的分布,二是用样本的数字特征(平均数、标准差等) 估计总体的数字特征.这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布. 推进新课 新知探究 提出问题 (1) 我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试 行居民生活用水定额管理,即确定一个居民月用水量标准 a,用水量不超过 a 的部分按平价收费,超出 a 的部分 按议价收费.如果希望大部分居民的日常生活不受影响,那么标准 a 定为多少比较合理呢?你认为,为了较合 理地确定出这个标准,需要做哪些工作?(让学生展开讨论) (2)什么是频率分布? (3)画频率分布直方图有哪些步骤? (4)频率分布直方图的特征是什么? 讨论结果: (1)为了制定一个较为合理的标准 a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个 范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市 居民用水量的分布情况. 分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到 两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供 解释数据的新方式. 下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来 表示数据分布的规律.可以让我们更清楚地看到整个样本数据的频率分布情况. (2)频率分布是指一个样本数据在各个小范围内所占比例的大小;一般用频率分布直方图反映样本的频 率分布. (3)其一般步骤为: ①计算一组数据中最大值与最小值的差,即求极差; ②决定组距与组数; ③将数据分组; ④列频率分布表; ⑤画频率分布直方图. (4)频率分布直方图的特征: ①从频率分布直方图可以清楚地看出数据分布的总体趋势. ②从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了. 同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同 的印象,这种印象有时会影响我们对总体的判断,分别以 0.1 和 1 为组距重新作图,然后谈谈你对图的印象. 提出问题 (1)什么是频率分布折线图? (2)什么是总体密度曲线? (3)对于任何一个总体,它的密度曲线是否一定存在?是否可以被非常准确地画出来? (4)什么叫茎叶图?画茎叶图的步骤有哪些? (5)茎叶图有什么特征? 讨论结果: (1)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. (2)在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为 总体密度曲线.它能够精确地反映总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.
第 40 页 共 89 页

(3) 实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样 本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越?精确?. (4)当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第 二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶 图. 画茎叶图的步骤如下: ①将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶为个位上的数字; ②将最小茎和最大茎之间的数按大小次序排成一列,写在左(右)侧; ③将各个数据的叶按大小次序写在其茎右(左)侧. (5)①用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从 茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示. ②茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记 录,但是没有表示两个记录那么直观,清晰. 茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成, 没有损失任何样本信息,可以在抽样的过程中随时记录(这对于教练员发现运动员现场状态特别有用);而频 率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作. 正确利用三种分布的描述方法, 都能得到一些有关分布的主要特点(如分布是否具有单峰性、 是否具有对称 性、样本点落在各分组中的频率等),这些主要特点受样本的随机性的影响比较小,更接近于总体分布的相应 的特点. 频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式, 茎叶图和频率分布表极为类似,事实上,茎相当于频率分布表中的分组;茎上叶的数目相当于频率分布表中指 定区间组的频数. 应用示例 思路 1 例 1 有 100 名学生,每人只能参加一个运动队,其中参加足球队的有 30 人,参加篮球队的有 27 人,参加排球 队的有 23 人,参加乒乓球队的有 20 人. (1)列出学生参加运动队的频率分布表. (2)画出频率分布条形图. 解:(1)参加足球队记为 1,参加篮球队记为 2,参加排球队记为 3,参加乒乓球队记为 4,得频率分布表如下: 试验结果 参加足球队(记为 1) 参加篮球队(记为 2) 参加排球队(记为 3) 参加乒乓球队(记为 4) 合 计 (2)由上表可知频率分布条形图如下: 频数 30 27 23 20 100 频率 0.30 0.27 0.23 0.20 1.00

例 2 为了了解中学生的身体发育情况,对某中学 17 岁的 60 名女生的身高进行了测量,结果如下: (单位: cm)
第 41 页 共 89 页

154 156 158 162 160 162

159 166 169 159 156 166 162 158 166 160 164 160 157 151 157 161 153 158 164 158 163 158 153 157 159 154 165 166 157 151 146 151 165 158 163 163 162 161 154 165 159 157 159 149 164 168 159 153 列出样本的频率分布表;绘出频率分布直方图. 解:第一步,求极差:上述 60 个数据中最大为 169,最小为 146. 故极差为:169-146=23 cm. 第二步,确定组距和组数,可取组距为 3 cm,则组数为

23 2 ? 7 ,可将全部数据分为 8 组. 3 3

第三步,确定组限: [145.5,148.5),[148.5,151.5),[151.5,154.5),[154.5,157.5),[157.5,160.5),[160.5,163.5), [163.5,166.5),[166.5,169.5). 第四步,列频率分布表: 分组 [145.5,148.5) [148.5,151.5) [151.5,154.5) [154.5,157.5) [157.5,160.5) [160.5,163.5) [163.5,166.5) [166.5,169.5) 合计 第五步,根据上述数据绘制频率分布直方图如下图: 个数累计 频数 1 3 6 8 18 11 10 3 60 频率 0.017 0.050 0.100 0.133 0.300 0.183 0.167 0.050 1.000

以上例 1 和例 2 两种情况的不同之处在于,前者的频率分布表列出的是几个不同数值的频率,相应的条 形图是用其高度表示取各个值的频率; 后者的频率分布表列出的是在不同区间内取值的频率,相应的直方图 是用图表面积的大小来表示在各个区间内取值的频率. 我们在处理一个数理问题时可以采用样本的频率分布估计总体分布的方法,这是因为,频率分布随着样 本容量的增大更加接近于总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布的直方图就演 变成一条光滑的曲线——总体密度曲线.这条曲线是客观存在的,但是我们却很难将它准确地画出,我们只能 用样本的频率分布去对它进行估计.基于频率分布与相应的总体分布有这种关系,再加上我们通常并不知道 一个总体的分布,我们往往是从一个总体中抽取一个样本,用样本的频率去估计相应的总体分布.一般说来, 样本的容量越大,这种估计就越精确. 例 3 从某校高一年级的 1 002 名新生中用系统抽样的方法抽取一个容量为 100 的身高样本,如下(单位: cm) .作出该样本的频率分布表,并估计身高不小于 170(cm)的同学所占的百分率. 168 165 171 167 170 165 170 152 175 174

第 42 页 共 89 页

165 170 160 180 151 177 178 167 161

170 155 170 174 168 158 165 163 165

168 166 168 173 158 175 158 164 174

169 158 164 159 168 165 170 158 156

171 155 174 163 176 169 169 168 167

166 160 170 172 155 151 159 167 166

164 160 165 167 165 163 155 161 162

155 164 179 160 165 166 163 162 161

164 156 163 164 169 163 153 167 164

158 162 172 169 162 167 155 168 166

解: (1)在全部数据中找出最大值 180 与最小值 151,它们相差(极差)29,决定组距为 3; (2)将区间[150.5,180.5]分成 10 组;分别是[150.5,153.5),[153.5,156.5),…,?[177.5,180.5)?; (3)从第一组[150.5,153.5)开始分别统计各组的频数,再计算各组的频率,列频率分布表: 分组 [150.5,153.5) [153.5,156.5) [156.5,159.5) [159.5,162.5) [162.5,165.5) [165.5,168.5) [168.5,171.5) [171.5,174.5) [174.5,177.5) [177.5,180.5) 合计 频数累计 4 12 20 31 53 72 86 93 97 100 频数 4 8 8 11 22 19 14 7 4 3 100 频率 0.04 0.08 0.08 0.11 0.22 0.19 0.14 0.07 0.04 0.03 1

根据频率分布表可以估计,估计身高不小于 170 的同学所占的百分率为: [0.14×

171 .5 ? 170 +0.07+0.04+0.03]× 100%=21%. 171 .5 ? 168 .5

点评:一般地,编制频率分布表的步骤如下: (1)求极差,决定组数和组距; (2)分组,通常对组内的数值所在的区间取左闭右开区间; (3)登记频数,计算频率,列出频率分布表. 思路 2 例 1 下表给出了某校 500 名 12 岁男孩中用随机抽样得出的 120 人的身高(单位:cm). 区间界限 人数 区间界限 人数 [122,126) 5 [142,146) 11 [126,130) 8 [146,150) 6 [130,134) 10 [150,154) 5 [134,138) 22 [154,158) 20 [138,142) 33

(1)列出样本频率分布表; (2)画出频率分布直方图; (3)估计身高小于 134 cm 的人数占总人数的百分比. 分析:根据样本频率分布表、频率分布直方图的一般步骤解题. 解: (1)样本频率分布表如下: 分组 [122,126) [126,130) 频数 5 8
第 43 页 共 89 页

频率 0.04 0.07

[130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158) 合计 (2)其频率分布直方图如下:

10 22 33 20 11 6 5 120

0.08 0.18 0.28 0.17 0.09 0.05 0.04 1

(3) 由样本频率分布表可知身高小于 134 cm 的男孩出现的频率为 0.04+0.07+0.08=0.19,所以我们估计身高 小于 134 cm 的人数占总人数的 19%. 例 2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出 频率分布直方图(如下图),图中从左到右各小长方形面积之比为 2∶4∶17∶15∶9∶3,第二小组频数为 12. (1)第二小组的频率是多少?样本容量是多少? (2)若次数在 110 以上(含 110 次)为达标,试估计该学校全体高一学生的达标率是多少?

分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数 之和等于样本容量,频率之和等于 1. 解: (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:

4 =0.08; 2 ? 4 ? 17 ? 15 ? 9 ? 3

又因为频率=

第二小组频数 , 样本容量 第二小组频数 12 ? =150. 第二小组频率 0.08
第 44 页 共 89 页

所以样本容量=

(2)由图可估计该学校高一学生的达标率约为

17 ? 15 ? 9 ? 3 × 100%=88%. 2 ? 4 ? 17 ? 15 ? 9 ? 3

例 3 甲、乙两篮球运动员在上赛季每场比赛的得分如下,试比较这两位运动员的得分水平. 甲:12,15,24,25,31,31,36,36,37,39,44,49,50; 乙:8,13,14,16,23,26,28,33,38,39,51. 解:画出两人得分的茎叶图如下:

从这个茎叶图可以看出甲运动员的得分大致对称,平均得分及中位数、众数都是 30 多分;乙运动员的得分 除一个 51 外,也大致对称,平均得分及中位数、众数都是 20 多分,因此甲运动员发挥比较稳定,总体得分情况 比乙好. 知能训练 1.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据下图可知( )

A.甲运动员的成绩好于乙运动员 B.乙运动员的成绩好于甲运动员 C.甲、乙两名运动员的成绩没有明显的差异 D.甲运动员的最低得分为 0 分 答案:A 2. 有 一 个 容 量 为 45 的 样 本 数 据 , 分 组 后 各 组 的 频 数 如 下 : (12.5,15.5 ] ,3;(15.5,?18.5? ] , 8;(18.5,21.5] ,9;(21.5,24.5] ,11;(24.5,27.5] ,10;(27.5,30.5] ,4.由此估计,不大于 27.5 的数据约为总体的 ( ) A.91% B.92% C.95% D.30% 答案:A 3.一个容量为 20 的样本数据,数据的分组及各组的频数如下: (10,20),2; (20,30),3; (30,40),4; (40,50),5; (50,60),4; (60,70),2. 则样本在区间(10,50)上的频率为( ) A.0.5 B.0.7 C.0.25 D.0.05 答案:B 4.一个高中研究性学习小组对本地区 2000 年至 2002 年快餐公司发展情况进行了调查,制成了该地区快餐公 司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如下图),根据图中提供的信息可以得 出这三年中该地区每年平均销售盒饭____________万盒.

快餐公司个数情况图 答案:85

快餐公司盒饭年销售量的平均数情况图
第 45 页 共 89 页

拓展提升 为了了解一大片经济林生长情况,随机测量其中的 100 株的底部周长,得到如下数据表(单位:cm). 135 125 109 105 129 111 129 99 102 123 98 97 124 123 126 89 99 101 108 119 102 117 87 111 97 110 90 116 117 98 110 113 131 103 100 121 99 97 99 121 99 110 97 105 115 80 121 102 118 101 121 92 102 92 111 120 123 108 106 113 110 102 123 114 106 121 107 101 119 102 96 109 104 108 117 104 111 95 97 103 100 104 104 104 104 108 91 107 126 104 103 112 128 102 109 118 100 101 108 108

(1)编制频率分布表; (2)绘制频率分布直方图; (3)估计该片经济林中底部周长小于 100 cm 的树木约 占多少?周长不小于 120 cm 的树木约占多少? 解: (1)这组数据的最大值为 135,最小值为 80, 极差为 55,可将其分为 11 组,组距为 5. 频率分布表如下: 分组 [80,85) [85,90) [90,95) [95,100) [100,105) [105,110) [110,115) [115,120) [120,125) [125,130) [130,135] 合计 (2)直方图如下图: 频数 1 2 4 14 24 15 12 9 11 6 2 100 频率 0.01 0.02 0.04 0.14 0.24 0.15 0.12 0.09 0.11 0.06 0.02 1 频率/组距 0.002 0.004 0.008 0.028 0.048 0.030 0.024 0.018 0.022 0.012 0.004 0.2

(3)从频率分布表得,样本中小于 100 的频率为 0.01+0.02+0.04+0.14=0.21,样本中不小于 120 的频率为 0.11+0.06+0.02=0.19,估计该片经济林中底部周长小于 100 cm 的树木约占 21%,周长不小于 120 cm 的树木约 占 19%. 课堂小结 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去 估计总体的分布. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值
第 46 页 共 89 页

较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图. 作业 习题 2.2A 组 1、2. 设计感想 本节课是高一新课程必修三第二章《统计》中的第二节《用样本估计总体》的第一节课,尽管用样本估 计总体是一种实用性很强,操作烦琐、麻烦的工作,但却是统计学中常用的方法,在生产、生活中应用非常广 泛.用样本估计总体,其实就是一种“以偏概全”“以部分代替全部”的思想.虽然有贬义的成分,但我们还是要认 真去教好学好,而且,这也是平时考试和高考中的重点内容之一. 本节要解决的问题就是:为何要用样本估计总体——社会生产、生活的实际需要(必要性),如比赛、竞技 中预测结果,评判质量谁好谁差,水平谁高谁低经常要用到.如何去用样本估计总体——用样本的频率分布去 估计总体的频率分布;怎样用样本估计总体——作出样本频率分布表或频率分布直方图,懂得用 “数据” 语言说话. 另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育并增强学生 的自信心,使学生养成良好的学习态度.

2.2.2 用样本的数字特征估计总体的数字特征
整体设计 教学分析 教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念,重点放 在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均 位置的)统计术语进行误导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位 数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举一反三,使学生思考对于众数和 平均数,是否也有类似的结论.进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法 的特点.在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位 数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中 的方法也可以得到总体的中位数、均值和众数的估计. 教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本 数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.教科书通过例题 向学生展示如何用样本数字特征解决实际问题,通过阅读与思考栏目“生产过程中的质量控制图”,让学生进 一步体会分布的数字特征在实际中的应用. 三维目标 1.能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平均数估计总体 的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法;初步体会、领悟“用 数据说话”的统计思想方法;通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度 和严谨的工作作风. 2.正确理解样本数据标准差的意义和作用,学会计算数据的标准差; 能根据实际问题的需要合理地选取样本, 从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;会用样本的基本数字特征估 计总体的基本数字特征,形成对数据处理过程进行初步评价的意识. 3.在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数 学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证 地理解数学知识与现实世界的联系. 重点难点 教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体 会样本数字特征具有随机性. 教学难点:用样本平均数和标准差估计总体的平均数与标准差;能应用相关知识解决简单的实际问题. 课时安排
第 47 页 共 89 页

2 课时 教学过程 第 1 课时 众数、中位数、平均数 导入新课 思路 1 在一次射击比赛中,甲、乙两名运动员各射击 10 次,命中环数如下﹕ 甲运动员:7,8,6,8,6,5,8,10,7,4; 乙运动员:9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?为了从整体上更好地把握总体的规律,我 们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计总体的数字特征.(板书课题) 思路 2 在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡 时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因 为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作 为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征. 推进新课 新知探究 提出问题 (1)什么是众数、中位数、平均数? (1)如何绘制频率分布直方图? (3)如何从频率分布直方图中估计众数、中位数、平均数? 活动:那么学生回忆初中所学的一些统计知识,思考后展开讨论,教师提示引导. 讨论结果: (1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数) 、中位数(在按大小顺序排列的一 组数据中,居于中间的数称为中位数) 、平均数(一般是一组数据和的算术平均数)等各种数字特征,应当说, 这些数字都能够为我们提供关于样本数据的特征信息. (2)画频率分布直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数; 将数据分组;列频率分布表;画频率分布直方图. (3)教材前面一节在调查 100 位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月 均用水量的众数是 2.25 t(最高的矩形的中点),它告诉我们,该市的月均用水量为 2.25 t 的居民数比月均用 水量为其他值的居民数多,但它并没有告诉我们到底多多少. 请大家翻回到课本看看原来抽样的数据,有没有 2.25 这个数值呢?根据众数的定义,2.25 怎么会是众数 呢?为什么?(请大家思考作答) 分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而 2.25 是由样本数据的频率分布 直方图得来的,所以存在一些偏差.

提问:那么如何从频率分布直方图中估计中位数呢? 分析: 在样本数据中,有 50%的个体小于或等于中位数,也有 50%的个体大于或等于中位数.因此,在频率分布 直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估 计出中位数的值为 2.02. 思考:2.02 这个中位数的估计值,与样本的中位数值 2.0 不一样,你能解释其中的原因吗?(原因同上:样本
第 48 页 共 89 页

数据的频率分布直方图把原始的一些数据给遗失了) 课本显示,大部分居民的月均用水量在中部 (2.02 t 左右) ,但是也有少数居民的月均用水量特别高,显然, 对这部分居民的用水量作出限制是非常合理的. 思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会 成为缺点,你能举例说明吗?(让学生讨论,并举例) 对极端值不敏感有利的例子: 考察课本中表 21 中的数据,如果把最后一个数据错写成 22,并不会对样本 中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中,人为 操作的失误经常造成错误数据. 对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作,这时如果采用 各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公 司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同 时用平均工资和中位数来作为参考指标,选择平均工资较高且中位数较大的公司就业.对极端值不敏感的方 法,不能反映数据中的极端情况. 同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于频率分布直方图 中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的月均用水量的平均值为 2.02 t. 显示了居民月均用水量的平均数,它是频率分布直方图的“重心”.由于平均数与每一个样本数据有关,所 以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.也正因为这个原因, 与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.从图上可以看出,用水量最多 的几个居民对平均数影响较大,这是因为他们的月均用水量与平均数相差太多了. 利用频率分布直方图估计众数、中位数、平均数: 估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点) 估计中位数:中位数把频率分布直方图分成左右两边面积相等. 估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但 只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据 的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者 相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的“重心”. 应用示例 思路 1 例 1 (1)若 M 个数的平均数是 X,N 个数的平均数是 Y,则这 M+N 个数的平均数是___________; (2)如果两组数 x1,x2,…,xn 和 y1,y2,…,yn 的样本平均数分别是 x 和 y,那么一组数 x1+y1,x2+y2,…,xn+yn 的平 均数是___________. 活动:学生思考或交流,教师提示,根据平均数的定义得到结论.

MX ? NY ; M ?N x?y (2) . 2
解: (1) 例 2 某校高一年级的甲、乙两个班级(均为 50 人)的语文测试成绩如下(总分:150 分),试确定这次 考试中,哪个班的语文成绩更好一些. 甲班: 112 86 106 84 100 105 98 102 94 107 87 112 94 94 99 90 120 98 95 119 108 100 96 115 111 104 95 108 111 105 104 107 119 107 93 102 98 112 112 99 92 102 93 84 94 94 100 90 84 114 乙班:
第 49 页 共 89 页

116 95 109 96 106 98 108 99 110 103 94 98 105 101 115 104 112 101 113 96 108 100 110 98 107 87 108 106 103 97 107 106 111 121 97 107 114 122 101 107 107 111 114 106 104 104 95 111 111 110 分析:我们可用一组数据的平均数衡量这组数据的集中水平,因此,分别求出甲、乙两个班的平均分即可. 解:用计算器分别求出甲班的平均分为 101.1,乙班的平均分为 105.4,故这次考试乙班成绩要好于甲班. 思路 2 例 1 下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间. 睡眠时间 [6,6.5) [6.5,7) [7,7.5) [7.5,8) [8,8.5) [8.5,9) 合计 人数 5 17 33 37 6 2 100 频率 0.05 0.17 0.33 0.37 0.06 0.02 1

分析:要确定这 100 名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡眠时间只是一 个范围,可以用各组区间的组中值近似地表示. 解法一:总睡眠时间约为 6.25× 5+6.75× 17+7.25× 33+7.75× 37+8.25× 6+8.75× 2=739(h), 故平均睡眠时间约为 7.39 h. 解法二:求组中值与对应频率之积的和 6.25× 0.05+6.75× 0.17+7.25× 0.33+7.75× 0.37+8.25× 0.06+8.75× 0.02=7.39(h). 答:估计该校学生的日平均睡眠时间约为 7.39 h. 例 2 某单位年收入在 10 000 到 15 000、15 000 到 20 000、20 000 到 25 000、25 000 到 30 000、30 000 到 35 000、35 000 到 40 000 及 40 000 到 50 000 元之间的职工所占的比分别为 10%,15%,20%,25%,15%,10%和 5%,试估计该单位职工的平均年收入. 分析:上述百分比就是各组的频率. 解:估计该单位职工的平均年收入为 12 500× 10%+17 500× 15%+22 500× 20%+27 500× 25%+32 500× 15%+37 500× 10%+45 000× 5%=26 125(元). 答:估计该单位人均年收入约为 26 125 元. 知能训练 从甲、乙两个公司各随机抽取 50 名员工月工资: 甲公司: 800 800 800 800 800 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 0001 2001 2001 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 200 1 500 1 500 1 500 1 500 1 500 1 500 1 500 2 000 2 000 2 000 2 000 2 000 2 500 2 500 2 500 乙公司: 700 700 700 700 700 700 700 700 700 700 700 700 700 700 700 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000
第 50 页 共 89 页

1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 1 000 6 000 8 000 10 000 试计算这两个公司 50 名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资. 答案:甲公司:员工月工资平均数 1 240,众数 1 200,中位数 1 200; 乙公司:员工月工资平均数 1 330,众数 1 000,中位数 1 000;从总体上看乙公司员工月工资比甲公司少,原因 是乙公司有几个收入特高的员工影响了工资平均数. 拓展提升 “用数据说话”, 这是我们经常可以听到的一句话.但是,数据有时也会被利用,从而产生误导.例如,一个企 业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十 万元.这时,年收入的平均数会比中位数大得多.尽管这时中位数比平均数更合理些,但是这个企业的老板到 人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问. 你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释? 这句话的目的是谨防利用人们对统计术语的模糊认识进行误导(蒙骗).使学生能够正确理解在日常生 活中像“我们单位的收入水平比别的单位高”这类话的模糊性,这里的“收入水平”是指员工收入数据的某个 中心点,即可以是中位数、平均数或众数,不同的解释有不同的含义. 在这里应该注意以下几点: 1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常 用于描述分类变量的中心位置. 2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用了数据中排在 中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入错误、测量错误等)时,应该用 抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的 影响程度. 3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中位数相比,平均 数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生 较大的误差.可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度.在体育、文艺等各种 比赛的评分中,使用的是平均数.计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个 别裁判的人为因素而给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公?平 性?. 4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极 端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息, 帮助我们作出决策. 5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用. 课堂小结 1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),会用样本的基本 数字特征估计总体的基本数字特征; 2.平均数对数据有“取齐”的作用,代表一组数据的平均水平; 3.形成对数据处理过程进行初步评价的意识. 作业 习题 2.2A 组 3. 设计感想 本堂课在初中学习的众数、中位数、平均数的基础上,学习了利用频率分布直方图估计众数、中位数、 平均数,这是一种近似估计,但都能说明总体的分布特征,各有优缺点,讲解时紧扣课本内容,讲清讲透,使学生 活学活用,会画频率分布直方图,会利用频率分布直方图估计众数、中位数、平均数,对总体作出正确的估计. (设计者:路 波) 第 2 课时 标准差 导入新课
第 51 页 共 89 页

思路 1 平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断.某地区 的统计显示,该地区的中学生的平均身高为 176 cm,给我们的印象是该地区的中学生生长发育好,身高较高. 但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就 不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.所以我们学习从另 外的角度来考察样本数据的统计量——标准差.(教师板书课题) 思路 2 在一次射击选拔比赛中,甲、乙两名运动员各射击 10 次,命中环数如下﹕ 甲运动员:7,8,7,9,5,4,9,10,7,4; 乙运动员:9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比 赛? 我们知道,x 甲=7,x 乙=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?

从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度 来考察这两组数据——标准差. 推进新课 新知探究 提出问题 (1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)? (2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算 发现,两个样本的平均数均为 125. 甲 乙 110 115 120 100 130 125 125 130 120 115 125 125 135 125 125 145 135 125 125 145

哪种钢筋的质量较好? (3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续 7 年的种植对比实验,年亩产 量分别如下:(千克) 甲:600, 880, 880, 620, 960, 570, 900(平均 773) 乙:800, 860, 850, 750, 750, 800, 700(平均 787) 请你用所学统计学的知识,说明选择哪种品种推广更好? (4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到 1.5 万元的家 庭即达到小康生活水平.民政局对该市 100 户家庭进行调查统计,它们的人均收入达到了 1.6 万元,民政局即 宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际? (5)如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断数据的离散程 度? 讨论结果: (1)利用频率分布直方图估计众数、中位数、平均数: 估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点) 估计中位数:中位数把频率分布直方图分成左右两边面积相等. 估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (2)
第 52 页 共 89 页

由上图可以看出,乙样本的最小值 100 低于甲样本的最小值 110,乙样本的最大值 145 高于甲样本的最大 值 135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定. 我们把一组数据的最大值与最小值的差称为极差(range).由上图可以看出,乙的极差较大,数据点较分 散; 甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比较,操作简单方便,但如果两组 数据的集中程度差异不大时,就不容易得出结论. (3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理. (4)不符合实际. 样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的 分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,都是考察数据的分散程度. (5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的 附近,即乙的分散程度小, 如何用数字去刻画这种分散程度呢? 考察样本数据的分散程度的大小,最常用的 统计量是方差和标准差. 标准差: 考察样本数据的分散程度的大小,最常用的统计量是标准差(standard deviation).标准差是样本数据到平 均数的一种平均距离,一般用 s 表示. 所谓“平均距离”,其含义可作如下理解: 假设样本数据是 x1,x2,…,xn, x 表示这组数据的平均数.xi 到 x 的距离是|xi- x |(i=1,2,…,n). 于是,样本数据 x1,x2,…,xn 到 x 的“平均距离”是 S=

| x1 ? x | ? | x2 ? x | ? ? ? | xn ? x | . n

由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s=

1 [( x1 ? x ) 2 ? ( x 2 ? x ) 2 ? ? ? ( x n ? x ) 2 ] . n

意义: 标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,数据的离散程 度就越小,也就越稳定.从标准差的定义可以看出,标准差 s≥0,当 s=0 时,意味着所有的样本数据都等于样本平 均数. 标准差还可以用于对样本数据的另外一种解释.例如, 在关于居民月均用水量的例子中,平均数 x =1.973,标准差 s=0.868,所以 x +s=2.841, x +2s=3.709; x -s=1.105, x -2s=0.237. 这 100 个数据中,在区间[ x -2s, x +2s]=[0.237,3.709]外的只有 4 个,也就是说, x -2s, x +2s] [ 几乎包含了所有样本数据. 从数学的角度考虑,人们有时用标准差的平方 s2——方差来代替标准差,作为测量样本数据分散程度 的工具: s2=

1 [(x1- x )2+(x2- x )2+…+(xn- x )2]. n

显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差. 需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求 得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前
第 53 页 共 89 页

面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接 受的. 两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入中的运动员成 绩的标准差的计算器计算. 用计算器计算运动员甲的成绩的标准差的过程如下:

即 s 甲=2. 用类似的方法,可得 s 乙≈1.095. 由 s 甲>s 乙可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定. 应用示例 思路 1 例 1 画出下列四组样本数据的条形图,说明它们的异同点. (1)5,5,5,5,5,5,5,5,5; (2)4,4,4,5,5,5,6,6,6; (3)3,3,4,4,5,6,6,7,7; (4)2,2,2,2,5,8,8,8,8. 分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组 数据的标准差. 解:四组样本数据的条形图如下:

四组数据的平均数都是 5.0,标准差分别是:0.00,0.82,1.49,2.83. 它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的. 例 2 甲、乙两人同时生产内径为 25.40 mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零 件中各抽出 20 件,量得其内径尺寸如下(单位:mm): 甲 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39 乙 25.40 25.43 25.44 25.48 25.48
第 54 页 共 89 页

25.47 25.49 25.49 25.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48 从生产的零件内径的尺寸看,谁生产的质量较高? 分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径 25.40 mm), 生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸 25.40 mm 的差异大 时质量低,差异小时质量高;当总体的平均数与标准尺寸很接近时,总体的标准差小的时候质量高,标准差大 的时候质量低.这样,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数 与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们 可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差 异的估计值. 解:用计算器计算可得

x甲 ≈25.401, x乙 ≈25.406;
s 甲≈0.037,s 乙≈0.068. 从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于 s 甲<s 乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一 些. 点评:从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的零件内径(样本 数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本.这样,尽管总体是同一个,但由于样本 不同,相应的样本频率分布与平均数、标准差等都会发生改变,这就会影响到我们对总体情况的估计.如果样 本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就 非常大.这也正是我们在前面讲随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生, 条件许可时,通常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性. 变式训练 某地区全体九年级的 3 000 名学生参加了一次科学测试,为了估计学生的成绩,从不同学校的不同程度 的学生中抽取了 100 名学生的成绩如下: 100 分 12 人,90 分 30 人,80 分 18 人,70 分 24 人,60 分 12 人,50 分 4 人. 请根据以上数据估计该地区 3 000 名学生的平均分、合格率(60 或 60 分以上均属合格). 解:运用计算器计算得:

100 ? 12 ? 90 ? 30 ? 80 ? 18 ? 70 ? 24 ? 60 ? 12 ? 50 ? 4 =79.40, 100
(12+30+18+24+12)÷ 100=96%, 所以样本的平均分是 79.40 分,合格率是 96%,由此来估计总体 3 000 名学生的平均分是 79.40 分,合格率是 96%. 思路 2 例 1 甲、乙两种水稻试验品种连续 5 年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪 一种水稻品种的产量比较稳定. 品种 甲 乙 第1年 9.8 9.4 第2年 9.9 10.3 第3年 10.1 10.8 第4年 10 9.7 第5年 10.2 9.8

解:甲品种的样本平均数为 10,样本方差为 [ (9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷ 5=0.02. 乙品种的样本平均数也为 10,样本方差为 [ (9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷ 5=0.24. 因为 0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.
第 55 页 共 89 页

例 2 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的 100 只日光灯在必 须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差. 天数 灯泡数 151—18 0 1 181—21 0 11 211—24 0 18 241—27 0 20 271—30 0 25 301—33 0 16 331—36 0 7 361—39 0 2

分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命. 解 : 各 组 中 值 分 别 为 165,195,225,255 , 285,315,345,375, 由 此 算 得 平 均 数 约 为 165× 1%+195 ×11%+225×18%+255×20%+285×25%+315×16%+345×7%+375×2%=267.9≈268(天). 这 些 组 中 值 的 方 差 为

1 × [ 1× (165-268)2+11× (195-268)2+18× (225-268)2+20× (255-268)2+ 100

25× (285-268)2+16× (315-268)2+7× (345-268)2+2× (375-268)2]=2 128.60(天 2). 故所求的标准差约 2128 .6 ≈46(天). 答:估计这种日光灯的平均使用寿命约为 268 天,标准差约为 46 天. 知能训练 (1)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一 个最低分后,所剩数据的平均值和方差分别为____________. (2)若给定一组数据 x1,x2,…,xn,方差为 s2,则 ax1,ax2,…,axn 的方差是____________. (3)在相同条件下对自行车运动员甲、乙两人进行了 6 次测试,测得他们的最大速度(单位:m/s)的数据如下: 甲 乙 27 33 38 29 30 38 37 34 35 28 31 36

试判断选谁参加某项重大比赛更合适? 答案: (1)9.5,0.016 (2)a2s2 (3) x甲 =33, x乙 =33,

s甲 ?
2

47 37 2 , ? s乙 ? 3 3

乙的成绩比甲稳定,应选乙参加比赛更合适. 拓展提升 某养鱼专业户在一个养鱼池放入一批鱼苗,一年以后准备出售,为了在出售以前估计卖掉鱼后有多少收 入,这个专业户已经了解到市场的销售价是每千克 15 元,请问,这个专业户还应该了解什么?怎样去了解? 请你为他设计一个方案. 解:这个专业户应了解鱼的总重量,可以先捕出一些鱼(设有 x 条),作上标记后放回鱼塘,过一段时间再捕 出一些鱼(设有 a 条),观察其中带有标记的鱼的条数,作为一个样本来估计总体,则

a条鱼中带有标记的条数 鱼塘中所有带有标记的鱼的条数(x) ? a 鱼塘中鱼的总条数
这样就可以求得总条数,同时把第二次捕出的鱼的平均重量求出来,就可以估计鱼塘中的平均重量,进而 估计全部鱼的重量,最后估计出收入. 课堂小结 1.用样本的数字特征估计总体的数字特征分两类: 用样本平均数估计总体平均数,平均数对数据有“取齐”的作用,代表一组数据的平均水平. 用样本标准差估计总体标准差.样本容量越大,估计就越精确,标准差描述一组数据围绕平均数波动的大 小,反映了一组数据变化的幅度. 2.用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计总体的数字特 征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本容量越大,估计的结果也
第 56 页 共 89 页

就越精确. 作业 习题 2.2A 组 4、5、6、7,B 组 1、2. 设计感想 统计学科,最大的特点就是与现实生活的密切联系,也是新教材的亮点.仅仅想借助“死记硬背一些概念 及公式,简单模仿课本例题”来学习,是绝对不行的.用样本估计总体时,如果抽样的方法比较合理,那么样本可 以反映总体的信息,但从样本得到的信息会有偏差,其原因在于样本的随机性.这种偏差是不可避免的.虽然 我们从样本数据得到的分布、 均值和标准差并不是总体的真正分布、 均值和标准差,而只是总体的一个估计, 但这种估计是合理的,特别是当样本的容量很大时,它们确实反映了总体的信息.教师建议: 亲身经历“提出问 题,收集数据,分析数据,并作出合理决策”过程,在此过程中不仅可以加深对概念等知识的深刻理解,更重要的 是发展了思维,培养了分析及解决问题能力,同时在情感、意志等领域也得到了协调发展,这才是学校学习的 科学而全面的目标,习题设置有层次,尽量源于教材,又高于教材,这也是高考命题原则.

2.3 变量间的相关关系 2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关
整体设计 教学分析 变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学 生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关 系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描 述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学 生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使 学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能 犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性. 三维目标 1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系. 2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关 系,并利用散点图直观体会这种相关关系. 3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程 的系数公式建立线性回归方程. 重点难点 教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识 两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程. 教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思 想. 课时安排 2 课时 教学过程 第 1 课时 导入新课 思路 1 在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.” 按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢? 请同学们如实填写下表(在空格中打“√” ):
第 57 页 共 89 页

好 你的数学成绩 你的物理成绩





学生讨论:我们可以发现自己的数学成绩和物理成绩存在某种关系.(似乎就是数学好的,物理也好; 数学差的,物理也差,但又不全对.) 物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的 数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素, 如是否喜欢物理,用在物理学习上的时间等等.(总结:不能通过一个人的数学成绩是多少就准确地断定他 的物理成绩能达到多少.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩 的结果对物理成绩进行合理估计有非常重要的现实意义.)为很好地说明上述问题,我们开始学习变量之间 的相关关系和两个变量的线性相关.(教师板书课题) 思路 2 某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅 多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能 够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可靠性? 推进新课 新知探究 提出问题 (1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.教师的水 平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗? (2)两个变量间的相关关系是什么?有几种? (3)两个变量间的相关关系的判断. 讨论结果: (1)粮食产量与施肥量有关系,一般是在标准范围内,施肥越多,粮食产量越高;教师的水平与学生的水平是 相关的,如水滴石穿,三人行必有我师等. 我们还可以举出现实生活中存在的许多相关关系的问题.例如: 商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售 收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关. 粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮 食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响. 人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但 人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关. 应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出 相应的判断,因为“经验当中有规律”.但是,不管你的经验多么丰富,如果只凭经验办事,还是很容易出错的.因 此,在分析两个变量之间的相关关系时,我们需要一些有说服力的方法. 在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像 匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有 时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出 判断. (2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关 系.两个变量之间的关系分两类: ①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等; ②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系. 相关关系是一种非确定性关系. 如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关) (3)两个变量间的相关关系的判断:①散点图.②根据散点图中变量的对应点的离散程度,可以准确地判断两 个变量是否具有相关关系.③正相关、负相关的概念.
第 58 页 共 89 页

①教学散点图 出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据: 年龄 脂肪 年龄 脂肪 23 9.5 53 29.6 27 17.8 54 30.2 38 21.2 56 31.4 41 25.9 57 30.8 45 27.5 58 33.5 49 26.3 60 35.2 50 28.2 61 34.6

分析数据:大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加.我们可以作散点图来进一步分 析. ②散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这 样的图形叫做散点图,如下图.

从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定 的关系,这个图支持了我们从数据表中得出的结论. (a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关 系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一 直线附近,变量之间就有线性相关关系) ③正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图 中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个 变量之间不具有相关关系) 应用示例 思路 1 例 1 下列关系中,带有随机性相关关系的是_____________. ①正方形的边长与面积之间的关系 ②水稻产量与施肥量之间的关系 ③人的身高与年龄之间的关系 ④降雪量与交通事故的发生率之间的关系 解析:两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是 函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的 身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变 化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系,因此填②④. 答案:②④ 例 2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?你认为 “健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗? 分析:学生思考,然后讨论交流,教师及时评价. 解:从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体 健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患 病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起 的,所以可以吸烟”的说法是不对的. 点评:在探究研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以
第 59 页 共 89 页

进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.本题的意义在于引 导学生重视对统计结果的解释,从中发现进一步研究的问题. 思路 2 例 1 有时候,一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同类型的某种食品的数据.第二 列表示此种食品所含热量的百分比,第三列数据表示由一些美食家以百分制给出的对此种食品口味的评价: 品牌 A B C D E F G H I J 所含热量的百分比 25 34 20 19 26 20 19 24 19 13 口味记录 89 89 80 78 75 71 65 62 60 52

(1)作出这些数据的散点图. (2)关于两个变量之间的关系,你能得出什么结论? 解:(1)散点图如下:

(2)基本成正相关关系,即食品所含热量越高,口味越好. 例 2 案例分析: 一般说来,一个人的身高越高,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系. 为了对这个问题进行调查,我们收集了北京市某中学 2003 年高三年级 96 名学生的身高与右手一拃长的数据 如下表. 性别 女 女 女 女 女 女 女 女 女 女 女 身高/cm 152 156 158 160 160 160 160 161 162 163 164 右手一拃长/cm 18.5 16.0 17.3 15.0 17.5 19.0 19.0 16.1 18.2 20.0 17.0 性别 女 女 女 女 女 女 女 女 女 女 女
第 60 页 共 89 页

身高/cm 153 157 159 160 160 160 160 161 162 163 164

右手一拃长/cm 16.0 20.0 20.0 16.0 17.5 19.0 19.5 18.0 18.5 21.5 18.5

女 女 女 女 女 女 女 女 女 女 女 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男

164 165 165 166 167 168 170 170 171 172 173 164 168 169 170 170 171 171 172 173 173 174 175 175 175 176 176 177 178 178 179 180 181 182 182 185 191

19.0 15.0 17.5 19.0 19.0 19.0 21.0 21.0 20.0 18.5 22.0 19.0 18.0 17.0 20.0 21.5 21.5 22.3 23.0 20.0 20.0 22.0 16.0 21.0 22.0 19.0 22.0 21.0 21.0 24.0 21.5 22.5 21.5 18.5 24.0 25.0 21.0

女 女 女 女 女 女 女 女 女 女 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男 男

164 165 165 167 168 168 170 171 171 173 162 165 168 169 170 170 171 172 173 173 173 174 175 175 176 176 176 178 178 179 179 181 181 182 183 186 191

20.0 16.0 19.5 19.0 16.0 19.5 21.0 19.0 21.5 18.0 19.0 21.0 19.0 20.0 21.0 22.0 21.5 21.5 20.0 20.0 21.0 22.0 20.0 21.2 16.0 20.0 22.0 21.0 22.5 21.5 23.0 21.1 23.0 21.5 21.2 22.0 23.0

(1)根据上表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似关系吗? (2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系. (3)如果一个学生的身高是 188 cm,你能估计他的一拃大概有多长吗? 解:根据上表中的数据,制成的散点图如下.

第 61 页 共 89 页

从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的. 那么,怎样确定这条直线呢? 同学 1:选择能反映直线变化的两个点,例如(153,16),(191,23)两点确定一条直线. 同学 2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同. 同学 3:多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直 线的斜率、截距. 同学 4:从左端点开始,取两条直线,如下图.再取这两条直线的“中间位置”作一条直线.

同学 5:先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧 的点数尽可能一样多.

同学 6:先将所有的点分成两部分,一部分是身高在 170 cm 以下的,一部分是身高在 170 cm 以上的;然后, 每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即 (164,19),(177,21) ;最后,将这两点连接成一条直线. 同学 7:先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点按照同学 3 的方 法求一个“平均点”,最小的点为(161.3,18.2),中间的点为(170.5,20.1),最大的点为(179.2,21.3).求出这 三个点的“平均点”为(170.3,19.9).我再用直尺连接最大点与最小点,然后平行地推,画出过点(170.3,19.9) 的直线.

同学 8:取一条直线,使得在它附近的点比较多. 在这里需要强调的是,身高和右手一拃长之间没有函数关系.我们得到的直线方程,只是对其变化趋势的一个 近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长,这是十分有意义的.
第 62 页 共 89 页

知能训练 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 10 次试验,收集数据如下: 零件数 x(个) 加工时间 y(min) 10 62 20 68 30 75 40 81 50 89 60 95 70 102 80 108 90 115 100 122

画出散点图; 关于加工零件的个数与加工时间,你能得出什么结论? 答案: (1)散点图如下:

(2)加工零件的个数与所花费的时间呈正线性相关关系. 拓展提升 以下是某地搜集到的新房屋的销售价格 y 和房屋的面积 x 的数据: 房屋面积(m2) 销售价格(万元) 115 24.8 110 21.6 80 18.4 135 29.2 105 22

(1)画出数据对应的散点图; (2)指出是正相关还是负相关; (3)关于销售价格 y 和房屋的面积 x,你能得出什么结论? 解: (1)数据对应的散点图如下图所示:

(2)散点图中的点散分布在从左下角到右上角的区域内,所以是正相关. (3)关于销售价格 y 和房屋的面积 x,房屋的面积越大,价格越高,它们呈正线性相关的关系. 课堂小结 通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系. 作业 习题 2.3A 组 3、4(1). 设计感想 本节课学习了变量之间的相关关系和两个变量的线性相关的部分内容,通过身边的具体实例说明了两 个变量的相关关系,并学会了利用散点图及其分布来说明两个变量的相关关系的种类,为下一节课作了铺垫, 思路 1 和思路 2 的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学 生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度和学习方法,树立时间观,培养勤
第 63 页 共 89 页

奋、刻苦耐劳的精神.

第 64 页 共 89 页

第三章

概率

3.1 随机事件的概率 3.1.1 随机事件的概率
教学目标: 1.通过在抛硬币等试验获取数据,了解随机事件、必然事件、不可能事件的概念. 2.通过获取数据,归纳总结试验结果,发现规律,正确理解事件 A 出现的频率的意义,真正做到在探索 中学习,在探索中提高. 3.通过数学活动,即自己动手、动脑和亲身试验来理解概率的概念,明确事件 A 发生的频率 fn(A)与 事件 A 发生的概率 P(A)的区别与联系,体会数学知识与现实世界的联系. 教学重点: 理解随机事件发生的不确定性和频率的稳定性. 教学难点: 理解频率与概率的关系. 教学方法: 讲授法 课时安排 1 课时 教学过程 一、导入新课: 在第二次世界大战中,美国曾经宣布:一名优秀数学家的作用超过 10 个师的兵力.这句话有一个非同 寻常的来历.(故事略) 在自然界和实际生活中,我们会遇到各种各样的现象.如果从结果能否预知的角度来看,可以分为两大 类:一类现象的结果总是确定的,即在一定的条件下,它所出现的结果是可以预知的,这类现象称为确定性 现象;另一类现象的结果是无法预知的,即在一定的条件下,出现那种结果是无法预先确定的,这类现象称 为随机现象.随机现象是我们研究概率的基础,为此我们学习随机事件的概率. 二、新课讲解: 1、提出问题 (1)什么是必然事件?请举例说明. (2)什么是不可能事件?请举例说明. (3)什么是确定事件?请举例说明. 注:以上 3 问初中已经学习了. (4)什么是随机事件?请举例说明. (5)什么是事件 A 的频数与频率?什么是事件 A 的概率? (6)频率与概率的区别与联系有哪些? 观察: (1)掷一枚硬币,出现正面; (2)某人射击一次,中靶; (3)从分别标有号数 1,2,3,4,5 的 5 张标签中任取一张,得到 4 号签; 这三个事件在一定的条件下是或者发生或不一定发生的,是模棱两可的. 2、活动 做抛掷一枚硬币的试验,观察它落地时哪一个面朝上.通过学生亲自动手试验,突破学生理解的难点: “随机事件发生的随机性和随机性中的规律性”.通过试验,观察随机事件发生的频率,可以发现随着实验 次数的增加,频率稳定在某个常数附近,然后再给出概率的定义.在这个过程中,重视了掌握知识的过程,体 现了试验、观察、探究、归纳和总结的思想方法 具体如下:
第 65 页 共 89 页

第一步每个人各取一枚硬币,做 10 次掷硬币试验,记录正面向上的次数和比例,填在下表: 姓名 试验次数 正面朝上总次数 正面朝上的比例

思考: 试验结果与其他同学比较,你的结果和他们一致吗?为什么? 第二步 由组长把本小组同学的试验结果统计一下,填入下表. 组次 试验总次数 正面朝上总次数 正面朝上的比例

思考: 与其他小组试验结果比较,正面朝上的比例一致吗?为什么? 通过学生的实验,比较他们实验结果,让他们发现每个人实验的结果、组与组之间实验的结果不完全相 同,从而说明实验结果的随机性,但组与组之间的差别会比学生与学生之间的差别小,小组的结果一般会比 学生的结果更接近 0.5. 第三步 用横轴为实验结果,仅取两个值:1(正面)和 0(反面),纵轴为实验结果出现的频率,画出 你个人和所在小组的条形图,并进行比较,发现什么? 第四步 把全班实验结果收集起来,也用条形图表示. 思考: 这个条形图有什么特点? 引导学生在每组实验结果的基础上统计全班的实验结果,一般情况下,班级的结果应比多数小组的结 果更接近 0.5,从而让学生体会随着实验次数的增加,频率会稳定在 0.5 附近.并把实验结果用条形图表示, 这样既直观易懂,又可以与第二章统计的内容相呼应,达到温故而知新的目的. 第五步 请同学们找出掷硬币时“正面朝上”这个事件发生的规律性. 思考: 如果同学们重复一次上面的实验,全班汇总结果与这一次汇总结果一致吗?为什么? 出现正面朝上的规律性:随着实验次数的增加,正面朝上的频率稳定在 0.5 附近. 由特殊事件转到一般事件,得出下面一般化的结论:随机事件 A 在每次试验中是否发生是不能预知的, 但是在大量重复实验后,随着次数的增加,事件 A 发生的频率会逐渐稳定在区间[0,1]中的某个常数上.从 而得出频率、概率的定义,以及它们的关系. 3、 讨论结果: 必然事件:在条件 S 下,一定会发生的事件,叫相对于条件 S 的必然事件 (1) (certain event) , 简称必然事件. (2) 不可能事件: 在条件 S 下,一定不会发生的事件,叫相对于条件 S 的不可能事件 (impossible event) , 简称不可能事件. (3)确定事件:必然事件和不可能事件统称为相对于条件 S 的确定事件. (4)随机事件:在条件 S 下可能发生也可能不发生的事件,叫相对于条件 S 的随机事件(random event), 简称随机事件;确定事件和随机事件统称为事件,用 A,B,C,?表示. (5)频数与频率:在相同的条件 S 下重复 n 次试验,观察某一事件 A 是否出现,称 n 次试验中事件 A 出现 的次数 na 为事件 A 出现的频数 (frequency)称事件 A 出现的比例 fn(A)= ;

nA 为事件 A 出现的频率 (relative n

frequency) ;对于给定的随机事件 A,如果随着试验次数的增加,事件 A 发生的频率 fn(A)稳定在某个常数上, 把这个常数记作 P(A),称为事件 A 的概率(probability). (6)频率与概率的区别与联系:随机事件的频率,指此事件发生的次数 n A 与试验总次数 n 的比值

nA ,它 n

具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,这种摆动幅度越来越小.我们把 这个常数叫做随机事件的概率,概率从数量上反映了随机事件发生的可能性的大小.频率在大量重复试验
第 66 页 共 89 页

的前提下可以近似地作为这个事件的概率. 频率是概率的近似值,随着试验次数的增加,频率会越来越接近概率.在实际问题中,通常事件的概率 未知,常用频率作为它的估计值. 频率本身是随机的,在试验前不能确定.做同样次数的重复实验得到事件的频率会不同. 概率是一个确定的数,是客观存在的,与每次试验无关.比如,一个硬币是质地均匀的,则掷硬币出现正 面朝上的概率就是 0.5,与做多少次实验无关. 三、课堂练习: 教材 113 页练习:1、2、3 四、课堂小结: 本节研究的是那些在相同条件下,可以进行大量重复试验的随机事件,它们都具有频率稳定性,即随机 事件 A 在每次试验中是否发生是不能预知的,但是在大量重复试验后,随着试验次数的增加,事件 A 发生的 频率逐渐稳定在区间[0,1]内的某个常数上(即事件 A 的概率),这个常数越接近于 1,事件 A 发生的概率 就越大,也就是事件 A 发生的可能性就越大.反之,概率越接近于 0,事件 A 发生的可能性就越小.因此说,概 率就是用来度量某事件发生的可能性大小的量. 五、课后作业: 全优设计

板书设计:

3.1.1 随机事件的概率

1、必然事件、不可能事件、随机事件 2、频率与概率的区别与联系: 教学反思:

第 67 页 共 89 页

3.1.2 概率的意义
教学目标: 1.正确理解概率的意义;利用概率知识正确理解现实生活中的实际问题. 2.通过对现实生活中的“掷币”、“游戏的公平性”、“彩票中奖”等问题的探究,感知应用数学知 识解决数学问题的方法,理解逻辑推理的数学方法. 3.通过对概率的实际意义的理解,体会知识来源于实践并应用于实践的辩证唯物主义观,进而体会数 学与现实世界的联系. 教学重点: 理解概率的意义. 教学难点: 用概率的知识解释现实生活中的具体问题. 教学方法: 讲授法 课时安排 1 课时 教学过程: 一、导入新课: 生活中,我们经常听到这样的议论: “天气预报说昨天降水概率为 90%,结果根本一点雨都没下,天气预 报也太不准确了.”这是真的吗?为此我们必须学习概率的意义. 二、新课讲解: 1、提出问题: (1)有人说,既然抛掷一枚硬币出现正面向上的概率为 0.5,那么连续抛掷一枚硬币两次,一定是一次正面 朝上,一次反面朝上,你认为这种想法正确吗? (2)如果某种彩票中奖的概率为

1 ,那么买 1 000 张彩票一定能中奖吗? 1000

(3)在乒乓球比赛中,裁判员有时也用数名运动员伸出手指数的和的单数与双数来决定谁先发球,其具体 规则是:让两名运动员背对背站立,规定一名运动员得单数胜,另一名运动员得双数胜,然后裁判员让两名 运动员同时伸出一只手的手指,两个人的手指数的和为单数,则指定单数的运动员得到先发球权,若两个人 的手指数的和为双数,则指定双数胜的运动员得到先发球权,你认为这个规则公平吗? (4)“天气预报说昨天降水概率为 90%,结果根本一点雨都没下,天气预报也太不准确了.”学了概率后, 你能给出解释吗? (5)阅读课本的内容了解孟德尔与遗传学. (6)如果连续 10 次掷一枚骰子,结果都是出现 1 点.你认为这枚骰子的质地均匀吗?为什么? 2、讨论结果: (1)这种想法显然是错误的,通过具体的试验可以发现有三种可能的结果:“两次正面朝上”“两次反面 朝上”“一次正面朝上,一次反面朝上”,而且其概率分别为 0.25,0.25,0.5. (2)不一定能中奖,因为买 1 000 张彩票相当于做 1 000 次试验,因为每次试验的结果都是随机的,即每张 彩票可能中奖也可能不中奖,因此,1 000 张彩票中可能没有一张中奖,也可能有一张、两张乃至多张中奖. (3)规则是公平的. (4) 天气预报的“降水”是一个随机事件,因此,“昨天没有下雨”并不说明“昨天的降水概率为 90%”的 天气预报是错误的. (5)奥地利遗传学家(G.Mendel,1822—1884)用豌豆进行杂交试验,下表为试验结果(其中 F1 为第一子 代,F2 为第二子代) : 性状 F1 的表现 F2 的表现
第 68 页 共 89 页

种子的形状 茎的高度 子叶的颜色 豆荚的形状

全部圆粒 全部高茎 全部黄色 全部饱满

圆粒 5 474 高茎 787 黄色 6 022 饱满 882

皱粒 1 850 矮茎 277 绿色 2 001 不饱满 299

圆粒∶皱粒≈2.96∶1 高茎∶矮茎≈2.84∶1 黄色∶绿色≈3.01∶1 饱满∶不饱满≈2.95∶1

孟德尔发现第一子代对于一种性状为必然事件,其可能性为 100%,另一种性状的可能性为 0,而第二子 代对于前一种性状的可能性约为 75%,后一种性状的可能性约为 25%,通过进一步研究,他发现了生物遗传的 基本规律.实际上,孟德尔是从某种性状发生的频率作出估计的. (6)利用刚学过的概率知识我们可以进行推断,如果它是均匀的,通过试验和观察,可以发现出现各个面的 可能性都应该是

1 1 10 ,从而连续 10 次出现 1 点的概率为( ) ≈0.000 000 001 653 8,这在一次试验(即连续 6 6

10 次投掷一枚骰子)中是几乎不可能发生的.而当骰子不均匀时,特别是当 6 点的那面比较重时(例如灌了铅 或水银),会使出现 1 点的概率最大,更有可能连续 10 次出现 1 点. 现在我们面临两种可能的决策:一种是这枚骰子的质地均匀,另一种是这枚骰子的质地不均匀.当连续 10 次投掷这枚骰子,结果都是出现 1 点,这时我们更愿意接受第二种情况:这枚骰子靠近 6 点的那面比较重. 原因是在第二种假设下,更有可能出现 10 个 1 点. 如果我们面临的是从多个可选答案中挑选正确答案的决策任务,那么“使得样本出现的可能性最大” 可以作为决策的准则,例如对上述思考题所作的推断.这种判断问题的方法称为极大似然法.极大似然法是 统计中重要的统计思想方法之一. 如果我们的判断结论能够使得样本出现的可能性最大,那么判断正确的可能性也最大.这种判断问题 的方法称为似然法.似然法是统计中重要的统计思想方法之一. 三、例题讲解: 例 1 为了估计水库中的鱼的尾数,可以使用以下的方法,先从水库中捕出一定数量的鱼,例如 2 000 尾,给 每尾鱼作上记号,不影响其存活,然后放回水库.经过适当的时间,让其和水库中其余的鱼充分混合,再从水 库中捕出一定数量的鱼,例如 500 尾,查看其中有记号的鱼,设有 40 尾. 试根据上述数据,估计水库内鱼的尾数. 分析:学生先思考,然后交流讨论,教师指导,这实际上是概率问题,即 2 000 尾鱼在水库中占所有鱼的百分 比,特别是 500 尾中带记号的有 40 尾,就说明捕出一定数量的鱼中带记号的概率为 解:设水库中鱼的尾数为 n,A={带有记号的鱼},则有 P(A)=

40 ,问题可解. 500
① ②

2000 . n

40 , 500 2000 40 由①②得 ,解得 n≈25 000. ? n 500
因 P(A)≈ 所以估计水库中约有鱼 25 000 尾.

四、课堂练习: 教材第 118 页练习:1、2、3、 五、课堂小结: 概率是一门研究现实世界中广泛存在的随机现象的科学,正确理解概率的意义是认识、理解现实生活 中有关概率的实例的关键,学习过程中应有意识形成概率意识,并用这种意识来理解现实世界,主动参与对 事件发生的概率的感受和探索.通过以上例题与练习可以感到,数学特别是概率正越来越多地应用到我们 的生活当中.它们已经不是数学家手中的抽象理论,而成为我们认识世界的工具.从彩票中奖,到证券分析; 从基因工程,到法律诉讼;从市场调查,到经济宏观调控;概率无处不在. 六、课后作业:
第 69 页 共 89 页

习题 3.1A 组 2、3. 板书设计:

3.1.2 概率的意义 1、提出问题: 2、讨论结果:

教学反思:

第 70 页 共 89 页

3.1.3 概率的基本性质
教学目标: (1)正确理解事件的包含、并事件、交事件、相等事件,以及互斥事件、对立事件的概念;通过事件的关 系、运算与集合的关系、运算进行类比学习,培养学生的类比与归纳的数学思想. (2)概率的几个基本性质:①必然事件概率为 1,不可能事件概率为 0,因此 0≤P(A)≤1;②当事件 A 与 B 互斥时,满足加法公式:P(A∪B)=P(A)+P(B);③若事件 A 与 B 为对立事件,则 A∪B 为必然事件,所以 P(A∪B)=P(A)+P(B)=1,于是有 P(A)=1-P(B). (3)正确理解和事件与积事件,以及互斥事件与对立事件的区别与联系,通过数学活动,了解数学与实际生 活的密切联系,感受数学知识应用于现实世界的具体情境,从而激发学习数学的情趣. 教学重点: 概率的加法公式及其应用. 教学难点: 事件的关系与运算. 教学方法: 讲授法 课时安排 1 课时 教学过程 一、导入新课: 全运会中某省派两名女乒乓球运动员参加单打比赛,她们夺取冠军的概率分别是 2/7 和 1/5,则该省夺 取该次冠军的概率是 2/7+1/5,对吗?为什么?为解决这个问题,我们学习概率的基本性质. 二、新课讲解: Ⅰ、事件的关系与运算 1、提出问题 在掷骰子试验中,可以定义许多事件如:C1={出现 1 点},C2={出现 2 点},C3={出现 3 点},C4={出现 4 点},C5={出现 5 点},C6={出现 6 点},D1={出现的点数不大于 1},D2={出现的点数大于 3},D3={出现的点数小于 5},E={出现的点数小于 7},F={出现的点数大于 6},G={出现的点数为偶数},H={出现的点数为奇数},?? 类比集合与集合的关系、运算说明这些事件的关系和运算,并定义一些新的事件. (1)如果事件 C1 发生,则一定发生的事件有哪些?反之,成立吗? (2)如果事件 C2 发生或 C4 发生或 C6 发生,就意味着哪个事件发生? (3)如果事件 D2 与事件 H 同时发生,就意味着哪个事件发生? (4)事件 D3 与事件 F 能同时发生吗? (5)事件 G 与事件 H 能同时发生吗?它们两个事件有什么关系? 2、活动:学生思考或交流,教师提示点拨,事件与事件的关系要判断准确. 3、讨论结果: (1)如果事件 C1 发生,则一定发生的事件有 D1,E,D3,H,反之,如果事件 D1,E,D3,H 分别成立,能推出事件 C1 发 生的只有 D1. (2)如果事件 C2 发生或 C4 发生或 C6 发生,就意味着事件 G 发生. (3)如果事件 D2 与事件 H 同时发生,就意味着 C5 事件发生. (4)事件 D3 与事件 F 不能同时发生. (5)事件 G 与事件 H 不能同时发生,但必有一个发生. 4、总结:由此我们得到事件 A,B 的关系和运算如下: ①如果事件 A 发生,则事件 B 一定发生,这时我们说事件 B 包含事件 A (或事件 A 包含于事件 B) ,记为 B ? A (或 A ? B),不可能事件记为 ? ,任何事件都包含不可能事件. ②如果事件 A 发生,则事件 B 一定发生,反之也成立, 若 B ? A 同时 A ? B) ( ,我们说这两个事件相等,即 A=B. 如 C1=D1.
第 71 页 共 89 页

③如果某事件发生当且仅当事件 A 发生或事件 B 发生,则称此事件为事件 A 与 B 的并事件(或和事件),记 为 A∪B 或 A+B. ④如果某事件发生当且仅当事件 A 发生且事件 B 发生,则称此事件为事件 A 与 B 的交事件(或积事件),记 为 A∩B 或 AB. ⑤如果 A∩B 为不可能事件 (A∩B= ? ),那么称事件 A 与事件 B 互斥,即事件 A 与事件 B 在任何一次试验中 不会同时发生. ⑥如果 A∩B 为不可能事件,A∪B 为必然事件,那么称事件 A 与事件 B 互为对立事件,即事件 A 与事件 B 在一 次试验中有且仅有一个发生. Ⅱ、概率的几个基本性质 1、提出以下问题: (1)概率的取值范围是多少? (2)必然事件的概率是多少? (3)不可能事件的概率是多少? (4)互斥事件的概率应怎样计算? (5)对立事件的概率应怎样计算? 2、活动: 学生根据试验的结果,结合自己对各种事件的理解,教师引导学生,根据概率的意义: (1) 由于事件的频数总是小于或等于试验的次数,所以,频率在 0—1 之间,因而概率的取值范围也在 0—1 之间. (2)必然事件是在试验中一定要发生的事件,所以频率为 1,因而概率是 1. (3)不可能事件是在试验中一定不发生的事件,所以频率为 0,因而概率是 0. (4)当事件 A 与事件 B 互斥时,A∪B 发生的频数等于事件 A 发生的频数与事件 B 发生的频数之和,互斥 事件的概率等于互斥事件分别发生的概率之和. (5) 事件 A 与事件 B 互为对立事件,A∩B 为不可能事件,A∪B 为必然事件,则 A∪B 的频率为 1,因而概率 是 1,由(4)可知事件 B 的概率是 1 与事件 A 发生的概率的差. 3、讨论结果: (1)概率的取值范围是 0—1 之间,即 0≤P(A)≤1. (2)必然事件的概率是 1.如在掷骰子试验中,E={出现的点数小于 7},因此 P(E)=1. (3)不可能事件的概率是 0,如在掷骰子试验中,F={出现的点数大于 6},因此 P(F)=0. (4)当事件 A 与事件 B 互斥时,A∪B 发生的频数等于事件 A 发生的频数与事件 B 发生的频数之和,互斥事 件的概率等于互斥事件分别发生的概率之和,即 P(A∪B)=P(A)+P(B),这就是概率的加法公式.也称互斥事 件的概率的加法公式. ( 5 ) 事 件 A 与 事 件 B 互 为 对 立 事 件 ,A∩B 为 不 可 能 事 件 ,A∪B 为 必 然 事 件 ,P(A∪B)=1. 所 以 1=P(A)+P(B),P(B)=1-P(A),P(A)=1-P(B).如在掷骰子试验中,事件 G={出现的点数为偶数}与 H={出现的点 数为奇数}互为对立事件,因此 P(G)=1-P(H). 三、例题讲解: 例: 如果从不包括大小王的 52 张扑克牌中随机抽取一张,那么取到红心(事件 A)的概率是 (事件 B)的概率是

1 ,取到方块 4

1 ,问: 4

(1)取到红色牌(事件 C)的概率是多少? (2)取到黑色牌(事件 D)的概率是多少? 活动:学生先思考或交流,教师及时指导提示,事件 C 是事件 A 与事件 B 的并,且 A 与 B 互斥,因此可用互斥 事件的概率和公式求解,事件 C 与事件 D 是对立事件,因此 P(D)=1-P(C). 解: (1)因为 C=A∪B,且 A 与 B 不会同时发生,所以事件 A 与事件 B 互斥,根据概率的加法公式得
第 72 页 共 89 页

P(C)=P(A)+P(B)=

1 . 2 1 . 2

(2)事件 C 与事件 D 互斥,且 C∪D 为必然事件,因此事件 C 与事件 D 是对立事件,P(D)=1-P(C)=

四、课堂练习: 教材第121页练习:1、2、3、4、5 五、课堂小结: 1.概率的基本性质是学习概率的基础.不可能事件一定不出现,因此其概率为 0,必然事件一定发生,因此其 概率为 1.当事件 A 与事件 B 互斥时,A∪B 发生的概率等于 A 发生的概率与 B 发生的概率的和,从而有公式 P (A∪B)=P(A)+P(B) ;对立事件是指事件 A 与事件 B 有且仅有一个发生. 2.在利用概率的性质时,一定要注意互斥事件与对立事件的区别与联系,互斥事件是指事件 A 与事件 B 在一 次试验中不会同时发生,其具体包括三种不同的情形: (1)事件 A 发生且事件 B 不发生; (2)事件 A 不发 生且事件 B 发生; (3)事件 A 与事件 B 同时不发生,而对立事件是指事件 A 与事件 B 有且仅有一个发生,其 包括两种情形:①事件 A 发生 B 不发生;②事件 B 发生事件 A 不发生,对立事件是互斥事件的特殊情形. 六、课后作业: 习题 3.1A 组 5,B 组 1、2. 预习教材3.2.1 板书设计 3.1.3 概率的基本性质

Ⅰ、事件的关系与运算 Ⅱ、概率的几个基本性质

第 73 页 共 89 页

3.2.1 古典概型
教学目标: 1.根据本节课的内容和学生的实际水平,通过模拟试验让学生理解古典概型的特征:试验结果的有限 性和每一个试验结果出现的等可能性,观察类比各个试验,正确理解古典概型的两大特点;树立从具体到抽 象、从特殊到一般的辩证唯物主义观点,培养学生用随机的观点来理性地理解世界,使得学生在体会概率意 义 2.鼓励学生通过观察、类比,提高发现问题、分析问题、解决问题的能力,归纳总结出古典概型的概率 计算公式,掌握古典概型的概率计算公式;注意公式:P(A)=

A包含的基本事件个数 的使用条件—— 总的基本事件个数

古典概型,体现了化归的重要思想.掌握列举法,学会运用分类讨论的思想解决概率的计算问题,增强学生 数学思维情趣. 教学重点: 理解古典概型的概念及利用古典概型求解随机事件的概率. 教学难点: 如何判断一个试验是否是古典概型,分清在一个古典概型中某随机事件包含的基本事件的个数和试验 中基本事件的总数. 教学方法: 讲授法 课时安排: 1 课时 教学过程: 一、导入新课: (1)掷一枚质地均匀的硬币,结果只有 2 个,即“正面朝上”或“反面朝上”,它们都是随机事件. (2)一个盒子中有 10 个完全相同的球,分别标以号码 1,2,3,?,10,从中任取一球,只有 10 种不同的结果, 即标号为 1,2,3,?,10. 思考讨论根据上述情况,你能发现它们有什么共同特点? 二、新课讲解: 1、提出问题: 试验一:抛掷一枚质地均匀的硬币,分别记录“正面朝上”和“反面朝上”的次数,要求每个数学小组至 少完成 20 次(最好是整十数),最后由学科代表汇总; 试验二: 抛掷一枚质地均匀的骰子,分别记录“1 点”“2 点”“3 点”“4 点”“5 点”和“6 点”的次数, 要求每个数学小组至少完成 60 次(最好是整十数),最后由学科代表汇总. (1)用模拟试验的方法来求某一随机事件的概率好不好?为什么? (2)根据以前的学习,上述两个模拟试验的每个结果之间都有什么特点? (3)什么是基本事件?基本事件具有什么特点? (4)什么是古典概型?它具有什么特点? (5)对于古典概型,应怎样计算事件的概率? 2、活动:学生展示模拟试验的操作方法和试验结果,并与同学交流活动感受,讨论可能出现的情况,师生共 同汇总方法、结果和感受. 3、讨论结果: (1)用模拟试验的方法来求某一随机事件的概率不好,因为需要进行大量的试验,同时我们 只是把随机事件出现的频率近似地认为随机事件的概率,存在一定的误差. (2)上述试验一的两个结果是“正面朝上”和“反面朝上”,它们都是随机事件,出现的概率是相等的,都 是 0.5.上述试验二的 6 个结果是“1 点”“2 点”“3 点”“4 点”“5 点”和“6 点”,它们也都是随机事 件,出现的概率是相等的,都是

1 . 6
第 74 页 共 89 页

(3)根据以前的学习,上述试验一的两个结果“正面朝上”和“反面朝上”,它们都是随机事件;上述试 验二的 6 个结果“1 点”“2 点”“3 点”“4 点”“5 点”和“6 点”,它们都是随机事件,像这类随机事 件我们称为基本事件(elementary event) ;它是试验的每一个可能结果. 基本事件具有如下的两个特点: ①任何两个基本事件是互斥的; ②任何事件(除不可能事件)都可以表示成基本事件的和. (4)在一个试验中如果 ①试验中所有可能出现的基本事件只有有限个; (有限性) ②每个基本事件出现的可能性相等.(等可能性) 我们将具有这两个特点的概率模型称为古典概率模型(classical models of probability),简称古典概 型. 向一个圆面内随机地投射一个点,如果该点落在圆内任意一点都是等可能的,你认为这是古典概型吗?为什 么?

因为试验的所有可能结果是圆面内所有的点,试验的所有可能结果数是无限的,虽然每一个试验结果 出现的“可能性相同”,但这个试验不满足古典概型的第一个条件. 如下图,某同学随机地向一靶心进行射击,这一试验的结果只有有限个:命中 10 环、命中 9 环??命 中 5 环和不中环.你认为这是古典概型吗?为什么?

不是古典概型,因为试验的所有可能结果只有 7 个,而命中 10 环、命中 9 环??命中 5 环和不中环的 出现不是等可能的,即不满足古典概型的第二个条件. (5)古典概型,随机事件的概率计算 对于实验一中,出现正面朝上的概率与反面朝上的概率相等,即 P(“正面朝上”)=P(“反面朝上”) 由概率的加法公式,得 P(“正面朝上”)+P(“反面朝上”)=P(必然事件)=1. 因此 P(“正面朝上”)=P(“反面朝上”)=

1 . 2

即 P(“出现正面朝上”)=

1 "出现正面朝上" 所包含的基本事件的个数 ? . 2 基本事件的总数

试验二中,出现各个点的概率相等,即 P(“1 点”)=P(“2 点”)=P(“3 点”)=P(“4 点”)=P(“5 点”)=P(“6 点”). 反复利用概率的加法公式,我们有 P(“1 点”)+P(“2 点”)+P(“3 点”)+P(“4 点”)+P(“5
第 75 页 共 89 页

点”)+P(“6 点”)=P(必然事件)=1. 所以 P(“1 点”)=P(“2 点”)=P(“3 点”)=P(“4 点”)=P(“5 点”)=P(“6 点”)= 进一步地,利用加法公式还可以计算这个试验中任何一个事件的概率,例如, P(“出现偶数点”)=P(“2 点”)+P(“4 点”)+P(“6 点”)=

1 . 6

1 1 1 3 1 + + = = . 6 6 6 6 2

即 P(“出现偶数点”)=

3 "出现偶数点" 所包含的基本事件的个数 . ? 6 基本事件的总数

因此根据上述两则模拟试验,可以概括总结出,古典概型计算任何事件的概率计算公式为: P(A)=

A所包含的基本事件的个数 . 基本事件的总数

在使用古典概型的概率公式时,应该注意: ①要判断该概率模型是不是古典概型; ②要找出随机事件 A 包含的基本事件的个数和试验中基本事件的总数. 三、例题讲解: 例 1 从字母 a,b,c,d 中任意取出两个不同字母的试验中,有哪些基本事件? 活动:师生交流或讨论,我们可以按照字典排序的顺序,把所有可能的结果都列出来.

解:基本事件共有 6 个: A={a,b},B={a,c},C={a,d},D={b,c},E={b,d},F={c,d}. 点评:一般用列举法列出所有基本事件的结果,画树状图是列举法的基本方法. 例2 : 单选题是标准化考试中常用的题型,一般是从 A,B,C,D 四个选项中选择一个正确答案.如果考生掌握 了考查的内容,他可以选择唯一正确的答案.假设考生不会做,他随机地选择一个答案,问他答对的概率是 多少? 解: (略) 点评:古典概型解题步骤: (1)阅读题目,搜集信息; (2)判断是否是等可能事件,并用字母表示事件; (3)求出基本事件总数 n 和事件 A 所包含的结果数 m; (4)用公式 P(A)=

m 求出概率并下结论. n

变式训练 1.抛两枚均匀硬币,求出现两个正面的概率. 2.一次投掷两颗骰子,求出现的点数之和为奇数的概率. 例 3 同时掷两个骰子,计算: (1)一共有多少种不同的结果? (2)其中向上的点数之和是 5 的结果有多少种? (3)向上的点数之和是 5 的概率是多少? 解: (略) 例 4 : 假设储蓄卡的密码由 4 个数字组成,每个数字可以是 0,1,2,?,9 十个数字中的任意一个.假设一个 人完全忘记了自己的储蓄卡密码,问他到自动取款机上随机试一次密码就能取到钱的概率是多少? 解: (略) 例 5 : 某种饮料每箱装 6 听,如果其中有 2 听不合格,问质检人员从中随机抽出 2 听,检测出不合格产品的
第 76 页 共 89 页

概率有多大?

解: (略) 四、课堂练习: 教材第 130 页练习:1、2、3 五、课堂小结: 1.古典概型我们将具有 (1)试验中所有可能出现的基本事件只有有限个; (有限性) (2)每个基本事件出现的可能性相等.(等可能性) 这样两个特点的概率模型称为古典概率概型,简称古典概型. 2.古典概型计算任何事件的概率计算公式 P(A)=

A所包含的基本事件的个数 . 基本事件的总数

3.求某个随机事件 A 包含的基本事件的个数和实验中基本事件的总数的常用方法是列举法(画树状图和列 表),应做到不重不漏. 六、课后作业 习题 3.2 A 组 1、2、3、4. 板书设计

3.2.1 古典概型 1.古典概型

高一数学集体备课教案

2、 P (A) =

A所包含的基本事件的个数 . 基本事件的总数

第 77 页 共 89 页

3.2.2 (整数值)随机数(random numbers)的产生
教学目标: 1.通过对现实生活中具体的概率问题的探究,感知应用数学解决问题的方法,了解随机数的概念;体会 数学知识与现实世界的联系,培养逻辑推理能力. 2.通过模拟试验,感知应用数字解决问题的方法,自觉养成动手、动脑的良好习惯.利用计算机产生随 机数,并能直接统计出频数与频率.通过数学与探究活动,体会理论来源于实践并应用于实践的辩证唯物主 义观点. 教学重点: 学会利用随机数实验来求简单事件的概率. 教学难点: 学会利用计算器、计算机求随机数的方法. 教学方法: 讲授法 课时安排: 1 课时 教学过程: 一

更多相关文档:

人教版高中数学必修3全套教案

人教版高中数学必修3全套教案_高三数学_数学_高中教育_教育专区 暂无评价|0人阅读|0次下载|举报文档人教版高中数学必修3全套教案_高三数学_数学_高中教育_教育专区...

高中数学必修3教案完整版新课标人教A版

高中数学必修3教案完整版新课标人教A版_数学_高中教育_教育专区。2015 年人教版必修三教案 姓学 名: 号: 沈金鹏 134080303 数学学院 院、系: 专 业: 数学与...

人教版高中数学必修3全册教案

人教版高中数学必修3全教案_数学_高中教育_教育专区。教学资料 教育精品资料按住 Ctrl 键单击鼠标打开名师教学视频全册播放 教学资料 1.1 算法与程序框图(共 3...

人教版高中数学必修3全册教案

人教版高中数学必修3全教案_高二数学_数学_高中教育_教育专区 暂无评价|0人阅读|0次下载|举报文档人教版高中数学必修3全教案_高二数学_数学_高中教育_教育...

人教版高中数学必修3全册教案

人教版高中数学必修3全教案_数学_高中教育_教育专区。数学教案 教学资料 教育精品资料按住 Ctrl 键单击鼠标打开名师教学视频全册播放 教学资料 按住 Ctrl 键单击...

人教版高中数学必修3全套教案(整理后)

人教版高中数学必修3全套教案(整理后)_高一数学_数学_高中教育_教育专区。第一章 算法初步 复备记录 授课时间:第 1.1 算法与程序框图 1.1.1 算法的概念 ...

人教版高中数学必修3全册教案

人教版高中数学必修3全教案_数学_高中教育_教育专区 暂无评价|0人阅读|0次下载|举报文档人教版高中数学必修3全教案_数学_高中教育_教育专区。1.1 算法与...

人教版高中数学必修3全册教案

人教版高中数学必修3全教案_数学_高中教育_教育专区 暂无评价|0人阅读|0次下载|举报文档人教版高中数学必修3全教案_数学_高中教育_教育专区。教学资料 第一...

高中数学必修3全套教案

高中数学必修3教案完整版 71页 5财富值 新课标人教版A高中数学必修... 85页 5财富值 新课标人教版A高中数学必修... 167页 5财富值如要投诉违规内容,请到百度...
更多相关标签:
生物必修三全套教案 | 历史必修三全套教案 | 高中必修一课本全套 | 人教版历史必修一教案 | 高中教材人教版全套 | 人教版地理必修一教案 | 人教版必修一英语教案 | 人教版化学必修一教案 |
网站地图

文档资料共享网 nexoncn.com copyright ©right 2010-2020。
文档资料共享网内容来自网络,如有侵犯请联系客服。email:zhit325@126.com