失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 统计≠估计 细说简单随机抽样

统计≠估计 细说简单随机抽样

时间:2024-03-30 19:09:29

相关推荐

统计≠估计 细说简单随机抽样

二战中,盟军情报作战机构估计德军坦克的数目大约有18000辆,盟军的科学家不太相信这个数字……统计学中一个估计总数的办法是求被缴获坦克编号的平均数,并认为这个值是全部编号的中点,因此,样本平均数乘以2就是总数的一个估计,用类似的统计方法估计出的效果是:1942年德军的坦克生产量约为3400辆,这个估计与实际生产量相差不远……统计学的基本思想方法是用样本估计总体,究竟怎样从总体中抽取样本?怎样抽取的样本更能充分地反映总体的情况?

一、知识与技能目标

1、理解简单随机抽样的概念;

2、会用简单随机抽样(抽签法、随机数表法)从总体中抽取样本,并能运用这两种方法和思想解决相关实际问题;

3、灵活运用简单随机抽样的方法解释军事领域,生产、生活领域常见非数学问题的规律,加强观察问题、分析问题和解决问题的能力的培养。

4、培养收集信息和处理信息、加工信息的实际能力,分析问题、解决问题的能力。

【重点难点】

※重点:简单随机抽样的概念.抽签法、随机数表法。

※难点:进行简单随机抽样时,“每次抽取一个个体时任一个体a被抽到的概率”与“在整个抽样过程中个体a被抽到的概率”的不同。

【知识梳理】

1. 在统计学里,我们把所要考察对象的全体叫做总体,其中的每一个考察对象叫做个体,从总体中所抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本的容量.总体中所有个体的平均数叫做总体平均数,样本中所有个体的平均数叫做样本平均数.

2.简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样

3. ⑴用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时任一个体被抽到的概率为1/N;在整个抽样过程中各个个体被抽到的概率为n/N;

⑵简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等;

⑶简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.

4.抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本。

适用范围:总体的个体数不多时。

优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法。

5.随机数表法: 随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码

6.简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样;

简单随机抽样适用于总体中的个体数不多的情况。

【疑难探究】

1.抓阄公平吗?

[问题情境]

人们在分配短缺的情况下常乐于用抓阄的办法来解决问题,其合理性保证当然得归功于“概率“.事实上,抓阄的结果是一随机现象,而所谓合理性,无非是说明每个人“中阄”的可能性相等而已!果真如此吗? 我们看看下面的问题.

元旦佳节,给每个班级5张电影票,高二(2)班共有50个同学,高老师用抽签(抓阄)来决定电影票花落谁家。他制作了50张小卡片,在其中5张上写上电影票字样,让50个人轮流抽签,抽到的去看电影.小华提出了一个问题:“抽签也有先后,第一个人抽到的概率是5/50,如果第一个人抽到,第二个人抽到的概率只有4/49;如果第一人没有抽到,第二人抽到的概率就是5/49,抽签未必机会相等!”小陈听到这些话,愣住了,心想:“抽签明明是公平合理的方法,为什么还会有这个奇怪的分析结果呢?”此刻,两人不约而同地把目光转向了高老师,请他解答.

[问题探究]

高老师指出,小华的分析虽然有道理,但是,他计算出来的两个数4/49与5/49不是第二人抽到的概率,而是在第一人抽到或抽不到的条件下第二人抽到的条件概率.实际上,在抽签时不必争先恐后,先抽与后抽的概率是相等的.这可以用全概率公式计算得知.我们也可以用适当的数学语言来描述这个抓阄试验:“5张电影票,50人抓阄”,其相应的样本空间的样本点可认定是50个阄,按抓阄顺序在直线上的一次排列(5个代表有票的阄在这50个位置的某5个位置上).由于事先阄混合得充分均匀,50个阄在直线上的每种排列的可能性是相等的,因而属于古典概型.我们所关心的第k个人抓中有票的阄的概率。这一事件可如下构造:

设想从5个代表有票的阄中任取一个放在第k个位置上,然后再把剩下的阄安排在剩下的位置上作全排列,如上图(在第k个位置先安排“有票的阄△”,再安排余下的阄.)从而由乘法原理知,有票的基本事件数为,

以Pk表示第k个人抓中阄的概率,即

知此值不依赖于k,即说明每个人抓中阄的概率都等于1/10,而与抓阄顺序无关.从而“试验”结束后的“倒霉”者也就不会怨天尤人了! 可见,抽签的方法是公平合理的.

这个例子可以推广到n个人抓阄分物的情况.n个阄,其中1个“有”,(n-1)个“无”,n个人排队抓阄,每个人抓到“有”的概率都是1/n;

若n个阄中,有m(m<n)个“有”,(n-m)个“无”,则每个人抓到“有”的概率都是m/n.

[结论归纳]

抽签时不必争先恐后,先抽与后抽的概率是相等的,n个阄,其中1个“有”,(n-1)个“无”,n个人排队抓阄,每个人抓到“有”的概率都是1/n;若n个阄中,有m(m<n)个“有”,(n-m)个“无”,则每个人抓到“有”的概率都是m/n。

用数学语言表达如下:“用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时任一个体被抽到的概率为1/N;在整个抽样过程中各个个体被抽到的概率为n/N.”

2.什么叫样本空间?

[问题情境]

当我们掷一枚硬币或一个骰子时,很容易列出所有可能的试验结果.然而,当掷几个骰子时,要列出它的全部可能结果就很麻烦了,并且还有许多试验,它的可能结果是如此之多,以致于我们不可能将所有结果全部列出.因此需要建立一种描述试验结果集合的系统方法,这个系统方法怎样建立呢?

[问题探究]

如下图a所示,该图表示我们掷两个骰子的所有可能结果,即集合S,此处S={(x,y)| x和y是整数,1≤x≤6,1≤y≤6}.图b表示:“总数出现四点”这个事件;图c表示:“总数出现七点”这个事件;图1-d表示:“同时出现四点”这个事件.

上面这种类型的图在研究概率问题时用处很大,在研究概率问题的初期被普遍采用,它在描述试验结果时使用了“点”和“空间”这样的术语,并被沿用至今.一个试验的样本空间是该试验所有结果的一个集合,其中每一个试验结果正好对应这个集合的一个元素.样本点则用来指样本空间中的一个元素.事件指样本空间的子集.

对于掷一个骰子的试验来说,如果D={1,2,3,4,5,6},那么D是一个样本空间,而集合{1,2,3,4,5}就不是样本空间,因为试验结果“6”在集合中没有任何元素与之对应.同样,{1,2,3,4,5,6,7}也不是该试验的样本空间,因为集合中的元素“7”不对应试验中的任何结果.有时把一些可区别的结果归为一个样本点是有好处的.掷一个骰子的试验可以导出仅由两个样本点“奇数”和“偶数”组成的样本空间.由这两个结果组成的集合是一个样本空间,因为每次掷骰子的结果都正好对应这个集合中的一个元素.注意,这个样本空间的样本点“奇数”把可区别的结果1,3,5并成了一个样本点.我们也能把可区别的结果3和6并成一个样本点“能被3整除的数”.并用{能被3整除的数,不能被3整除的数}作为相应的样本空间.概率理论中允许这样的分组是很重要的.例如,统计学家可能希望处理仅由样本点“高中生”、“初中生”和“小学生”所组成的样本空间,而不是处理他所考察的所有不同的人所组成的样本空间.开始时,明智的作法是先不将结果分类,而是把每个样本点的可能有的特征表示出来.在掷两个骰子时,即使掷出的点数相同,我们还是设想它们之中一个是红的,一个是绿的,并且以画在图上的36个点为样本空间,不然的话就可能引起误会,误认为“二个一点”和“点数三点”出现的可能性是一样的,或者“总数三点”和“总数七点”出现的可能性是一样的.

在掷一个骰子的试验中,如果取样本空间为{1,2,3,4,5,6},且骰子是均匀的,那么,每个样本点出现的概率是1/6(这样就定义了“均匀”).当我们掷二个骰子时,一个样本空间是笛卡尔积D×D,这里D和D都等于{1,2,3,4,5,6}.正如我们已经看到的,这个样本空间有36个点,分别为{(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),…,(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)}.如果骰子是均匀的,那么每个样本点出现的概率是1/36,当掷三个骰子时,其样本空间是D×D×D,这里D、D、D都等于{1,2,3,4,5,6},那么这个样本空间就有6×6×6=216个样本点.如果骰子是均匀的,则每个样本点出现的概率是1/216.

设E表示事件“两个骰子掷出的点数之和为7”.这样,E={(6,1),(5,2),(4,3),(3,4),(2,5),(1,6)}.如果求“骰子掷出的点数之和为7”的概率是多少这个问题了.它是事件E中所包含的元素的概率之和,即6/36或1/6.

我们来研究掷三枚硬币的试验.对于这个试验,可以指出两种不同的样本空间,在样本空间{(正正正),(正正反),(正反正),(反正正),(正反反),(反正反),(反反正),(反反反)}中,每个样本点的概率是多少?如果事件E是{(正正反),(正反正),(反正正)},那么事件正的概率是多少?掷三枚硬币,得到两个正面,一个反面(不计顺序)的概率是多少?

对于上述问题,我们的答案是:(1)每个样本点都具有相同的概率;(2)每个样本点的概率为1/8;(3)事件E的概率是3/8;(4)得到两个正面,一个反面(不计顺序)的概率为3/8.如果说在一个样本空间中,所有样本点都是等可能的,那么就可以确定任何指定事件的概率了.事实上,只要用样本空间的全部样本点数去除属于该事件的样本点数即可.例如,在上面掷三枚硬币的样本空间中,8个样本点看来是等可能的.因此,为了求出两个正面,一个反面的概率,我们要算出属于此事件的样本点数,以及它被样本空间的所有样本点数除所得的商.这样求得的该事件的概率是3/8.

[结论归纳]

一个样本空间中,所有样本点都是等可能的,那么就可以确定任何指定事件的概率了.事实上,只要用样本空间的全部样本点数去除属于该事件的样本点数即可.

3、 进行简单随机抽样时,“每次抽取一个个体时任一个体a被抽到的概率”与“在整个抽样过程中个体a被抽到的概率”的有什么不同?

[问题情境]

用简单随机抽样从含有6个个体的总体中抽取一个容量为2的样本.问:

①总体中的某一个体a在第一次抽取时被抽到的概率是多少?

②个体a在第1次未被抽到,而第2次被抽到的概率是多少?

③在整个抽样过程中,个体a被抽到的概率是多少?

[问题探究]

①当从总体中抽取第一个个体时,显然他被抽取的概率P=1/6;

故总体中的某一个体a在第一次抽取时被抽到的概率是1/6;

②从总体中第2次抽取个体时正好抽到a,就是个体a第1次未抽到、第2次被抽到这两件事都发生.显然,个体a第1次未抽到的5/6, 个体a第一次未被抽到、而第二次被抽到的概率为1/5;

故个体在第1次未被抽到,而第2次被抽到的概率:

③由于个体在第一次被抽到与第2次被抽到是互斥事件,所以在整个抽样过程中,个体被抽到的概率是.

[结论归纳]

用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时任一个体被抽到的概率为1/N;在整个抽样过程中各个个体被抽到的概率为n/N;两者是不同的。

【典例探究】

典例1, 某次考试有70000名学生参加,为了了解这70000名考生的数学成绩,从中抽取1000名考生的数学成绩进行统计分析,在这个问题中,有以下四种说法:

(1) 1000名考生是总体的一个样本;

(2) 1000名考生数学成绩的平均数是总体平均数;

(3) 70000名考生是总体;

(4)样本容量是1000,其中正确的说法有:

A.1种 B.2种C.3种D.4种

[典例探究]概念判断题前提是概念要清,理解要深。

[典例研析]我们把所要考察对象的全体叫做总体,从总体中所抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本的容量.总体中所有个体的平均数叫做总体平均数,样本中所有个体的平均数叫做样本平均数.(3)(4)对,故选B

[典例感悟]本课概念多,认真理解概念的内涵与外延,准确把握各概念的特点是解判断题的关键。

典例2, 对总数为N的一批零件抽取一个容量为30的样本,若每个零件被抽到的概率为0.25,则N的值为( )(A)120(B) 200 (C) 150 (D)100

[典例探究]用简单随机抽样从含有N个个体的总体中抽取一个容量为的样本时,每次抽取一个个体时任一个体被抽到的概率为1/N;在整个抽样过程中各个个体被抽到的概率为n/N;即“每次抽取一个个体时任一个体a被抽到的概率”与“在整个抽样过程中个体a被抽到的概率”是不同的。

[典例研析]因为从含有N个个体的总体中抽取一个容量为30的样本时,每次抽取一个个体时任一个体被抽到的概率为1/N;在整个抽样过程中各个个体被抽到的概率为30/N;所以30/N=0.25,从而有N=120. 故选A

[典例感悟]“每次抽取一个个体时任一个体a被抽到的概率”与“在整个抽样过程中个体a被抽到的概率”是不同的。前者概率为,后者的概率为;理解本质,才能举一反三。

典例3, 某批零件共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请用简单随机抽样说明抽取时总体中的每个个体被取到的概率均相同.

[典例探究]要说明每个个体被取到的概率相同,只需计算出每个个体被取到的概率.

[典例研析]证明:(1)简单随机抽样法:可采取抽签法,将160个零件按1~160编号,相应地制作1~160号的160个签,从中随机抽20个.显然每个个体被抽到的概率为P=20/160=1/8.

综上可知,无论采取哪种抽样,总体的每个个体被抽到的概率都是1/8.

[典例感悟]抽样方法的特点就是每个个体被抽到的概率相同,这样样本的抽取体现了公平性和客观性.

典例4, 质量监督局为了检验某种商品的质量,决定从60件商品中抽取12件进行检查,如何利用随机数表抽取这个样本?随机数表第11行到第15行摘录如下:

………………………………………………………………………………………………………

18 18 07 92 45 44 17 16 58 09 79 83 86 19 62 06 76 50 03 10 55 23 64 05 05

26 62 38 97 75 84 16 07 44 99 83 11 46 32 24 20 14 85 88 45 10 93 72 88 71

23 42 40 64 74 82 97 77 77 81 07 45 32 14 08 32 98 94 07 72 93 85 79 10 75

52 36 28 19 95 50 92 26 11 97 00 56 76 31 38 80 22 02 53 53 86 60 42 04 53

37 85 94 35 12 83 39 50 08 30 42 34 07 96 88 54 42 06 87 98 35 85 29 48 39

………………………………………………………………………………………………………

[典例探究]利用随机数表读数过程中,得到一串两位数号码,去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。由于随机数表中每个位置上出现哪一个数字是等概率的,每次读到哪一个两位数号码,即从总体中抽到哪一个个体的号码也是等概率的。

[典例研析]第一步,先将60件产品编号,可以编为00,01,02,03,…,59。

第二步,在附表1随机数表中任选一个数作为开始。如从第14行第14列的数31开始。

第三步,从选定的数31开始向右读下去(第一个数31符合要求),得到第2个数字号码38符合,第三个出现的是80,由于80>59,故80舍去,继续向右读得到22,02,53,这时有两个53,前一个取,后一个删去,继续向右读下去,86,60去掉,再继续得42,04.又一个53重复再去掉,再读下去,37,………这样下去。可以得到12个数:31,38,22,02,53,42,04,37,35,12,39,50.再按这12个数对应的商品抽取样本。

[典例感悟]随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.

【训练】

一.选择题

1.(典例1变式)为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是( )

A.1000名运动员是总体 B.每个运动员是个体

C.抽取的100名运动员是样本 D.样本容量是100

[解析]这个问题我们研究的是运动员的年龄情况.因此应选D.

2.(典例2变式)一个总体中共有10个个体,用简单随机抽样的方法从中抽取一容量为3的样本,则某特定个体入样的概率是

[解析]简单随机抽样中每一个体的入样概率为n/N. 答案:C

二.填空题

3.(典例2变式)15.从一个养鱼池中捕得m条鱼,作上记号后再放入池中,数日后又捕得n条鱼,其中k条有记号,请估计池中有(m*n/k) 条鱼.

[解析]设池中有N条鱼,第一次捕得m条作上记号后放入水池中,则池中有记号的鱼占m/N;第二次捕得n条,则这n条鱼是一个样本,其中有记号的鱼占k/n. 我们用样本来估计总体分布,令m/N=k/n,∴N=m*n/k.

4.(典例4变式)假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第8行第18列的数开始向右读,请你依次写出最先检测的5袋牛奶的编号719,050,717,512,358.(下面摘取了一随机数表的第7行至第9行)

…………………………………………………………………………………………………

84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76

63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 62 58 79

73 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54

………………………………………………………………………………………

[解析]从随机数表第8行第18列的数7开始向右读时,大于799的数舍去,则可得如下最先检测的样本719 981 050 717 512 867 358 其中981 867舍去,于是得答案719,050,717,512,358.

三.解答题

5.某高校有甲、乙两个数学建模兴趣班. 其中甲班有40人,乙班50人. 现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是多少分?

[解析]由已知可得该班级的总分为 40×90+50×81,

故得该建模兴趣班的平均成绩为

6.如果从有3000个元素的总体中抽取100个元素的样本,用抽签法有没有困难?

[解析]抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.而现在总体的个体数为3000,用抽签法费时、费力,况且,如果写有标签的纸片或小球,搅拌不均匀,可能导致抽样的不公平。故如果从有3000个元素的总体中抽取100个元素的样本,用抽签法有困难,应改为用随机数表法。

[理解感悟]

一.选择题

1.在简单随机抽样中,某一个个体被抽到的可能性是( )

(A) 与第几次抽样有关,第一次抽的可能性最大。

(B) 与第几次抽样有关,第一次抽的可能性最小。

(C) 与第几次抽样无关,每次抽到的可能性相等。

(D) 与第几次抽样无关,与抽取几个样本有关。

[解析]在简单随机抽样中,某一个个体被抽到的可能性相等,故选C。

2.某体育彩票规定:从01到36共36个号中抽出7个号为一注,每注2元.某人想从01至10中选3个连续的号,从11至20中选2个连续的号,从21至30中选1个号,从31至36中选1个号,组成一注,则这人把这种特征的号买全,至少要花

A3360元B6720元C4320元D8640元

[解析]这种特殊要求的号共有8×9×10×6=4320(注), 每注2元,至少要花8640元,故选D。

3.某学院有四个饲养房,分别养有18,24,54,48只白鼠供实验用,某项实验需抽取24只,你认为最合适的抽样方法为

A.在每个饲养房各抽取6只

B.把所有白鼠都加上编有不同号码的项圈,用随机取样法确定24只

C.在四个饲养房分别随手提出3,9,4,8只

D.先确定这四个饲养房应分别抽取3,4,9,8样品,再由各饲养房自己加上号码项圈,用简单随机抽样法确定各自的捕捉对象

[解析]先按18:24:54:48的比例,分别抽取3,4,9,8样品,再由各饲养房自己加上号码项圈,用简单随机抽样法确定各自的捕捉对象,故选D。

4.对总数为N的一批零件抽取一个容量为30的样本,若每个零件被抽取的概率为0.25,则N等于

A.150 B.200 C.120 D.100

[解析]∵30/N=0.25,∴N=120.故选C。

二.填空题

5.要检查某厂的产品合格率,检查人员从1000件产品中任意抽取了50件,问这种抽样的方法是(简单随机抽样法 )。

[解析]检查人员从1000件产品中任意抽取了50件,且每次抽取时各个个体被抽到的概率相等,这样的抽样方法为简单随机抽样。

6. 某公司在在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,这项调查宜采用的抽样方法是( 简单随机抽样法) 。

[解析]当总体中个体较少时,宜采用随机抽样.

三.解答题

7.车间工人已加工一种轴100件,为了了解这种轴的直径,要从中抽出10件在同一条件下测量(轴的直径要求为20±0.5毫米).

(1)采用简单随机抽样方法抽取上述样本.

(2)根据样本,对总体平均数与总体标准差作出估计.

[解析](1)考虑100件轴的直径的全体这一总体,将其中的100个个体编号1,2,…,100,利用随机数表来抽取样本的10个号码.这里从表中的第20行第1列的数开始,往右读数,得到10个号码如下:16,93,32,43,50,27,89,87,19,20,将上述10个号码的轴在同一条件下测量直径,得到如下样本数据(单位:毫米)

20.1, 20.3, 20.0, 20.2, 19.9, 19.9, 19.7, 20.1, 20.0, 19.8

(2)利用科学计算器算得:

根据所得结果,可以估计总体平均数约为20毫米,总体标准差约为0.173毫米.

[探究拓展]

解答题

8.为了了解中年知识分子在知识分子中的比例,对某科研单位全体知识分子的年龄进行了登记,结果如下(单位:岁)

42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58

列出样本的频率分布图,绘制频率分布直方图.

[解析] (1)最大值为67,最小值为28,全距为67-28=39.

(2)分组为8组,组距为5. 频率分布表如下:

9.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间为多少?

[解析]一天平均每人的课外阅读时间应为一天的总阅读时间与学生数的比,即

=0.9 h.

[思考运用]

解答题

10.下表表示上一赛季10个篮球队获胜的场数,利用随机数表将这些队在下一赛季的第一轮比赛进行分组,在每一组中指定一个队为“主队”或“客队”,使得成绩较差的队比战绩较好的队成为主队的可能性比较大,叙述你所采用的分组及指定“主队”和“客队”的方法.比赛结果见下表.

[解析]先将10个球队A、B、C、D、E、F、G、H、I、J从0到9编号.即A队编为0号,B队编为1号,C队编为2号,依此类推,J队被编为第9号.利用上面提供的随机数表,对这10个球队进行分组.从表的第一行第一列开始,得到5个数对,分别为:9和5;8和3;2和7;6和1;4和5;在上述五个数对中,将对应的数字换成表示球队的字母就得到了一种对10个球队随机分组的方法,即J队和F队为一组,I队和D队为一组,C队和H队分为一组,G队和B队分为一组,剩下的E队和A队分成一组,注意最后一组数中重复出现了数字5,我们将其直接去掉,又因为前4组已分好,故这样做不会影响我们对各组的划分.在每组中指定主队和客队的方法为:以第一组J队和F队为例,因为F队在上一赛季赢了5场而J队则一场也没赢,故我们希望J队获得主场的机会比F队获得主场的机会大.我们用数字0到4表示“J队成为主队”,那么从随机数表的第2行开始,前三个数字9,9,8不在0到4之间,我们跳过这三个数字,第四个数字为1,在0到4之间,故让J队成为主队.再以第2组即I队和D队这一组为例:因为I队在第一赛季中赢了3场而D队在第一赛季中赢了7场,故划分时用数字0到数字6代表“1队成为主队”,而以数字7到数字9代表“D队成为主队”.从随机数表的第2行第5列(即上面用到的数字1后的数字)开始选数字,选到的数字为3.在0到6之间,故令I队成为主队.其他组的主队与客队的划分方法类似.

[专题小结]

简单随机抽样二例

一、用例子说明有些调查不适宜做普查,只适宜做抽样调查

例1:妈妈为了知道饼熟了没有,从刚出锅的饼上切下一小块尝尝,如果这一小块熟了,那么可以估计整张饼熟了。

例2:环境检测中心为了了解一个城市的空气质量情况,会在这个城市中分散地选择几个点,从各地采集数据。

例3:农科站要了解农田中某种病虫害的灾情,会随意地选定几块地,仔细地检查虫卵数,然后估计一公顷农田大约平均有多少虫卵,会不会发生病虫害。

例4:某部队要想知道一批炮弹的杀伤半径,会随意地从中选取一些炮弹进行发射实验,以考察这一批炮弹的杀伤半径。

以上的例子都不适宜做普查,而适宜做抽样调查。

二、用简单的随机抽样方法来选取一些样本。

假设总体是某年级300名学生的数学考试成绩,我们已经按照学号顺序排列如下:

97 92 89 86 93 73 74 72 60 98 70 90 89 90 91 80 69 92 70 64 92 83 89 93 72 77 79 75 80 93 93 72 87 76 86 82 85 82 87 86 81 88 74 87 92 88 75 92 89 82 88 86 85 76 79 92 89 84 93 75 93 84 87 90 88 90 80 89 72 78 73 79 85 78 77 91 92 82 77 86 90 78 86 90 83 73 75 67 76 55 70 76 77 91 70 84 87 62 91 67 88 78 82 77 87 75 84 70 80 66 80 87 60 78 76 89 81 88 73 75 95 68 80 70 78 71 80 65 82 83 62 72 80 70 83 68 74 67 67 80 90 70 82 85 96 70 73 86 87 81 70 69 76 68 70 68 71 79 71 87 60 64 62 81 69 63 66 63 64 53 61 41 58 60 84 62 63 76 82 76 61 72 66 80 90 93 87 60 82 85 77 84 78 65 62 75 64 70 68 66 99 81 65 98 87 100 64 68 82 73 66 72 96 78 74 52 92 83 85 60 67 94 88 86 89 93 99 100 79 85 68 60 74 70 78 65 68 68 79 77 90 55 80 77 67 65 87 81 67 75 57 75 90 86 66 83 68 84 68 85 74 98 89 67 79 77 69 89 68 55 58 63 77 78 69 67 80 82 83 98 94 96 80 79 68 70 57 74 96 70 78 80 87 85 93 80 88 67 70 93。

用简单抽样的方法选取三个样本,每个样本含有5个个体,老师示范完成了第一个样本的选取,请同学们继续完成第二和第三个样本的选取。

第一个样本:

第二个样本:

第三个样本:

课堂活动:用简单的随机抽样方法从300名学生的数学成绩的总体中选取两个样本,每个样本含有20个个体。

第一个样本:

第二个样本:

同学们从刚才的活动中可以体会到,抽样之前,同学们不能预测到哪些个体会被抽中,像这样不能够预先预测结果的特性叫做随机性。所以统计学家把这种抽样的方法叫做随机抽样。

[题库]

典例1,某商场买来一车苹果,从中随机抽取了10个苹果,其重量(单位:克)分别为:150,152,153,149,148,146,151,150,152,147,由此估计这车苹果单个重量的期望值是( )

(A)150.2克 (B)149.8克(C)149.4克(D)147.8克

[典例研析]这车苹果单个重量的期望值是,

故选B。

[典例感悟]统计的基本思想方法是用样本估计总体,即通常不是直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况。在有限取值离散型随机变量ξ的概率分布中,令p1=p2=p3…=pn,则有p1=p2=p3…=pn=1/n,

所以ξ的数学期望又称为平均数、均值

典例2

某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;第六组,成绩大于等于18秒且小于等于19秒.右图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为( )

A.0.9,35 B.0.9,45

C.0.1,35 D.0.1,45

[典例研析]

故成绩小于17秒的学生人数占全班总人数的百分比x=0.02*1+0.18*1+0.36*1+0.34*1=0.9;成绩大于等于15秒且小于17秒的学生人数:y=50*(0.36*1+0.34*1)=35,故选A。

[典例感悟]首先要学会看直方图,理解其意义,再次要搞清数轴上的单位长度,比如本题的每个单位长度组距为1。

典例3一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为 ( )。

[典例研析]用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,在整个抽样过程中各个个体被抽到的概率为n/N=5/100=1/20;故答案为1/20。

如果觉得《统计≠估计 细说简单随机抽样》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。