范文一:抽样检查方法的分类
抽样检查方法的分类
作者:佚名 来源:不详 发布时间:2007-11-19 14:19:02 发布人:duoduo
减小字体增大字体
这些抽样方法标准分别对企业的抽样检验与国家行业与地方的质量监督抽样检验方法作出明确的规定。
本节将以计数和计量抽样检查方法国家标准为主,介绍在质量检验中常用的几种抽样检查方法标准。
一、抽样检查方法的分类
目前,已经形成了很多具有不同特性的抽样检查方案和体系,大致可按下列几个方面进行分类。
1.按产品质量指标特性分类
衡量产品质量的特征量称为产品的质量指标。质量指标可以按其测量特性分为计量指标和计数指标两类。计量指标是指如材料的纯度、加工件的尺寸、钢的化学成分、产品的寿命等定量数据指标。计数指标又可分为计件指标和计点指标两种,前者以不合格品的件数来衡量,后者则指产品中的缺陷数,如一平方米布料上的外观疵点个数,一个铸件上的气泡和砂眼个数等等。
按质量指标分类,产品质量检验的抽样检查方法也分成计数抽检和计量抽检方法两类。
(1)计数抽检方法 是从批量产品中抽取一定数量的样品(样本),检验该样本中每个样品的质量,确定其合格或不合格,然后统计合格品数,与规定的“合格判定数”比较,决定该批产品是否合格的方法。
(2)计量抽检方法 是从批量产品中抽取一定数量的样品数(样本),检验该样本中每个样品的质量,然后与规定的标准值或技术要求进行比较,以决定该批产品是否合格的方法。 有时,也可混合运用计数抽样检查方法和计量抽样检查方法。如选择产品某一个质量参数或较少的质量参数进行计量抽检,其余多数质量参数则实施计数抽检方法,以减少计算工作量,又能获取所需质量信息。
2.按抽样检查的次数分类
按抽样检查次数可分为一次、二次、多次和序贯抽样检查方法。
(1)一次抽检方法 该方法最简单,它只需要抽检一个样本就可以作出一批产品是否合格的判断。
(2)二次抽检方法 先抽第一个样本进行检验,若能据此作出该批产品合格与否的判断、检验则终止。如不能作出判断,就再抽取第二个样本,然后再次检验后作出是否合格的判断。
(3)多次抽检方法 其原理与二次抽检方法一样,每次抽样的样本大小相同,即n1=n2=n3?=n7,但抽检次数多,合格判定数和不合格判定数亦多。ISO2859标准提供了7次抽检方案。而我国GB2828、GB2829都实施5次抽检方案。
(4)序贯抽检方法 相当于多次抽检方法的极限,每次仅随机抽取一个单位产品进行检验,检验后即按判定规则作出合格、不合格或再抽下个单位产品的判断,一旦能作出该批合格或不合格的判定时,就终止检验。
3.按抽检方法型式分类
抽检方法首先可以分为调整型与非调整型两大类。
调整型是由几个不同的抽检方案与转移规则联系在一起,组成一个完整的抽检体系,然
后根据各批产品质量变化情况,按转移规则更换抽检方案即正常、加严或放宽抽检方案的转换,ISO2859、ISO3951和GB2828标准都属于这种类型,调整型抽检方法适用于各批质量有联系的连续批产品的质量检验。
非调整型的单个抽样检查方案不考虑产品批的质量历史,使用中也没有转移规则,因此它比较容易为质检人员所掌握,但只对孤立批的质量检验较为适宜。
无论哪种抽样方法,它们都具有以下三个共同的特点:
(1)产品必须以“检查批”(简称“批”)形式出现,检查批分连续批和孤立批,连续批是指批与批之间产品质量关系密切或连续生产并连续提交验收的批。如:
①产品设计、结构、工艺、材料无变化;
②制造场所无变化;
③中间停产时间不超过一个月。
单个提交检查批或待捡批不能利用最近已检批提供的质量信息的连续提交检查批,称为孤立批。
(2)批合格不等于批中每个产品都合格,批不合格也不等于批中每个产品都不合格。抽样检查只是保证产品整体的质量,而不是保证每个产品的质量。也就是说在抽样检查中,可能出现两种“错误”或“风险。
一种是把合格批误判为不合格批的错误,又称为“生产方风险”,常记作α,一般α值控制在1%、5%或10%。
另一种是把不合格批误判为合格批的错误,又称为“使用方风险”,常记作β,一般β控制在5%、10%。
(3)样本的不合格品率不等于提交批的不合格率。
样本是从提交检查批中随机抽取的。所谓随机抽取是指每次抽取时,批中所有单位产品被抽取可能性都均等,不受任何人的意志支配。样本抽取时间可以在批的形成过程中,也可以在批形成之后,随机抽样数可以按随机数表查取,也可以按GB10lll等标准确定。 抽样检查中的基本术语
作者:佚名 来源:不详 发布时间:2007-11-19 14:21:35 发布人:duoduo
减小字体增大字体
1.单位产品
为实施抽样检查的需要而划分的基本单位称为单位产品。例如一个齿轮,一台电视机,一双鞋,一个发电机组等。它与采购、销售、生产和装运所规定的单位产品可以一致,也可以不一致。
2.样本和样本单位
从检查批中抽取用于检查的单位产品称为样本单位。而样本单位的全体则称为样本。而样本大小则是指样本中所包含的样本单位数量。
3.合格质量水平(AQL)和不合格质量水平(RQL)
在抽样检查中,认为可以接受的连续提交检查批的过程平均上限值,称为合格质量水平。而过程平均是指一系列初次提交检查批的平均质量,它用每百单位产品不合格品数或每百单位产品不合格数表示。具体数值由产需双方协商确定,一般由AQL符号表示。
在抽样检查中,认为不可接受的批质量下限值,称为不合格质量水平,用RQL符号表示。
4.检查和检查水平(IL)
用测量、试验或其它方法,把单位产品与技术要求对比的过程称为检查。检查有正常检查、加严检查和放宽检查等。
当过程平均接近合格质量水平时所进行的检查,称为正常检查。
当过程平均显著劣于合格质量水平时所进行的检查,称为加严检查。
当过程平均显著优于合格质量水平时所进行的检查,称为放宽检查。
由放宽检查判为不合格的批,重新进行判断时所进行的检查称为特宽检查。
5.抽样检查方案
样本大小或样本大小系列和判定数组结合在一起,称为抽样方案。而判定数组是指由合格判定数系列和不合格判定数或合格判定数系列和不合格判定数系列结合在一起。
抽样方案有一次、二次和五次抽样方案。人次抽样方案是指由样本大小n和判定数组(Ac、Re)结合在一起组成的抽样方案。
Ac为合格判定数。判定批合格时,样本中所含不合格品(d)的最大数称为合格判定数,又称接收数(d≤Ac)。
Re为不合格判定数,是判定批不合格时,样本中所含不合格品的最小数,又称拒收数(d≥Re)。
二次抽样方案是指由第一样本大小n1,第二样本大小n2,?和判定数组(Ac1;Ac2,Re1;Re2)结合在一起组成的抽样方案。
五次抽样方案则是指由第一样本大小n1,第二样本大小n2,?第五样本大小n5和判定数组(A1,A2,A3,A4,A5,R1,R2,R3,R4,R5)结合在一起组成的抽样方案。 计数抽样方法
作者:佚名 来源:不详 发布时间:2007-11-19 14:24:52 发布人:duoduo
减小字体增大字体
1.计数抽样方法概述
按抽样次数,分为一次、二次和多次计数抽样检查方法。
(1)计数一次抽样检查方法 这是一种最基本和最简单的抽样检查方法,它对总体N中抽取n个样品进行检验,根据n中的不合格品数d和预先规定的允许不合格品数C对比,从而判断该批产品是否合格。下图表示了其基本内容。
(2)计数二次抽样检查方法 这种抽检方法是在一次抽检方法的基础上发展起来的。它是对交验批抽取两个样本n1,n2(GB2828中规定n1=n2)对应也有二个合格判定数c1和c2,不合格判定数为γ1,γ2,两次样本中的不合格数分别为d1和d2,其抽检和判断过程如下:
①先抽取第一个样本n1,检验后如不合格品数是d1≤c1,判为合格,如d1≥γ1,判为不合格,当c1≤d1≤γ1,则需由第二个样本来判定。
②n2中的不合格品数d2,由d2和d1加在一起与c2的γ2进行比较,如d1+d2≤c2,判为合格,当d1+d2≥γ2判为不合格。如下图所示:
(3)计数多次抽样检查
计数多次抽样检查的程序与计数二次抽检相似,但抽检次数多,合格判定数和不合格判定数亦多,因每次抽取样本大小相同,因此抽检次数多的样本小。我国 GB 2828 和GB 2829 规定是五次抽检方案,而MIL-STD-105D和ISO2859标准原规定的却是七次。但到1987年9月通过了中国提案后,也改为五次。
范文二:分类抽样
湖南)某学校有男、女学生各500名,为了解男、女学1.(2013·
生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查 ,则宜采用的抽样方法是( )
A.抽签法 B.随机数法
C.系统抽样法 D.分层抽样法
解:由题意,男、女生需要按比例抽样,所以需要分层抽样.故选D.
2.现要完成下列3项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查.
②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈.
③东方中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.
较为合理的抽样方法是( )
A.①简单随机抽样;②系统抽样;③分层抽样
B.①简单随机抽样;②分层抽样;③系统抽样
C.①系统抽样;②简单随机抽样;③分层抽样
D.①分层抽样;②系统抽样;③简单随机抽样
解:由各抽样方法的适用范围可知较为合理的抽样方法是:①用简单随机抽样,②用系统抽样,③用分层抽样.故选A.
3.从2006名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从2006人中剔除6人,剩下的2000人再按系统抽样的方法进行,则每人入选的概率( )
A.不全相等 B.均不相等
251C.都相等,且为1003 D.都相等,且为40解:抽样过程中每个个体被抽取的机会均等,概率相等,题中的抽取过程与从2006人中抽取50人,每人入选的概率相同,其概率为502520061003故选C.
4.要从10名女生和5名男生中选出6名学生组成课外兴趣小组,如果按性别依比例分层随机抽样,则不同的抽样方法的种数为( )
433642A.C10C2 B.CC C.C D.AA510515105
解:依题意得从10名女生和5名男生中选出6名学生,按性别
2分层抽样时,女生选4名,男生选2名,因此所求种数为C410C5.故选
A.
江西)总体由编号为01,02,…,19,20的20个个体5.(2013·
组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第
解:从选定的两位数字开始向右读,剔除不合题意及与前面重复的编号,得到符合题意的编号分别为08,02,14,07,01,…,因此选出来的第5个个体的编号为01.故选D.
6.将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区.三个营区被抽中的人数依次为( )
A.25,17,8 B.25,16,9
C.26,16,8 D.24,17,9
解:依题意及系统抽样的意义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N*)组抽中的号码是3+
10312(k-1).令3+12(k-1)≤300得k≤4因此第Ⅰ营区被抽中的人数
103是25;令300<3+12(k-1)≤495得4k≤42,因此第Ⅱ营区被抽中
的人数是42-25=17;同理可知第Ⅲ营区被抽中的人数是8.故选A.
湖北)一支田径运动队有男运动员56人,女运动员427.(2012·
人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有________人.
解:设抽取的女运动员的人数为a,则根据分层抽样的规则,有a8
4256,解得a=6.故抽取的女运动员为6人.故填6.
8.将参加数学竞赛的1000名学生编号如下:0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,…,0020,从第一部分随机抽取一个号码0015,则第40个号码为________.
解:系统抽样号码构成一个等差数列,公差为每组编号个数,所
1000以第40个号码为0015+(40-50=0795.故填0795.
9.为了考察某校的教学水平,将抽查该校高三年级部分学生本学年的考试成绩进行考察.为了全面地反映实际情况,采用以下三种方式进行抽样(已知该校高三年级共有20个教学班,并且每个班内的学生已经按随机方式编好了学号,假定该校每班学生人数都相同):①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的学习成绩;②每个班都抽取1人,共计20人,考察这20个学生的成绩;③把学生按成绩分成优秀、良好、普通三个级别,从中抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人).根据上面的叙述,回答下列问题:
(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?
(2)上面三种抽取方式中各自采用了何种抽取样本的方法?
解:(1)这三种抽取方式中,其总体都是指该校高三全体学生本学年的考试成绩,个体都是指高三年级每个学生本学年的考试成绩.其中第一种抽取方式中样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第二种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第三种抽取方式中,样本为所抽取的100名学生本学年的考试成绩,样本容量为100.
(2)第一种采用简单随机抽样法;第二种采用系统抽样法和简单随机抽样法;第三种采用分层抽样法和简单随机抽样法.
10.某公司有1000名员工,其中:高层管理人员为50名,属于高收入者;中层管理人员为150名,属于中等收入者;一般员工为800名,属于低收入者.要对这个公司员工的收入情况进行调查,欲抽取100名员工,应当怎样进行抽样?
解:可以采用分层抽样的方法,按照收入水平分成三层:高收入者、中等收入者、低收入者.从题中数据可以看出,高收入者为50
50名,占所有员工的比例为1000=5%,为保证样本的代表性,在所抽
取的100名员工中,高收入者所占的比例也应为5%,数量为100×5%=5,所以应抽取5名高层管理人员.同理,抽取15名中层管理人员、80名一般员工,再对收入状况分别进行调查.
11.某大学今年有毕业生1503人,为了了解毕业生择业的意向,打算从中选50人进行询问调查,试用系统抽样法确定出这50个人.
解:总体中的每个个体都必须等可能地入样,为了实现系统抽样的平均分组且又等概率抽样,必须先剔除1503被50除的余数3,再
“分段”,定起始位置.
第一步:将1503名大学生随机编号:0001,0002,…,1503; 第二步:因为1503被50除余3,所以应从总体中剔除3人,用随机数表法确定被剔除的3位同学;
第三步:将余下的1500名学生重新编号为0001,0002,…,1500; 第四步:将上述1500个号码按顺序平均分成50段,每段30人; 第五步:在第一段0001,0002,…,0030这30个编号中随机确定一起始号i0;
第六步:取出编号为i0,i0+30,i0+60,…,i0+49×30的大学生,即得所需样本.
某电视台在一次对收看文艺节目和新闻节目观众的抽样
(1)关?
(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?
(3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率.
解:(1)因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目.所以,经直观分析,收看新闻节目的观众与年龄是有关的.
27(2)应抽取大于4045×5=3(名).
(3)用分层抽样方法抽取的5名观众中,20至40岁有2名,大于40岁有3名,设A表示随机事件“5名观众中任取2名,恰有1名观1C1C3众年龄为20至40岁”,则P(A)=C5. 5
范文三:抽样调查方法的优点_步骤和分类
教育科 学研 究
1992 4
.
抽样调查 方 法 的优 点
、
步 骤 和 分类
吴明录
中国 科技促 进发 展 研究 中心
以理 解 的
,
但 却 是 不必 要 的
,
是应 该 被 消 除
:
一
、
抽 样 调 查方 法 的 优 点
,
掉的
,
。
因为 抽样 调 查 的 重 要特 点 在 于
,
由总
我们 的 知 识
我 们 的 态度 和 我 们 的行 动 这一 点
体 中所 抽取 的 调 查 样 木 或单 位 不 是 由调 查 人
员 有 意 识 地 主观 确 定 的 的
,
在 很 大 程 度 上 都 是 以 样 本 为依据 的
也不是随便确定
,
无 论 是 在 日常生 活 中还 是在 科学研 究 中都 同 样是 正 确 的
.
而 是 根 据概 率 论 的原 理
,
在 保证 总 体 中
例如
,
一 个人对 一 个 每 天 要 处
、
每个样 本或单 位 都 有 同等 被抽 取 机会 的条 件
下 随机 地 抽取 出来 的
理 几 千 件 事 务 的 机 构 (研 究 所
政府部 门
因 而 调 查 的样 本或 单
.
等) 的 看 法 往 往 是 由他 在 几 年 的 时 间里 与 这
个 机 构联 系 中所 经 历过 的一 两件 事 情所 决 定
的;
,
位 虽 然 很少
此外
比
,
,
却可 以 取得相 当准 确 的 结果
,
,
抽 样 调 查 与 全 面 调 查 或 普查 相
这是 抽
研 究者 在 一 所 学校 走访 了 几个 班级 或 一 指 出其 成 绩 和不 足
,
还 有如 下 所 述 的一 些 主 要 优 点
1
.
些 学 生 后 就会 动 手 写 报 告 来总 结 该校 的 经 验
样 调 查 方法 之 所 以 被 普遍 使 用 的 原 因 : 费用 较低
,
.
并 建议 该 校 和 其 它
如 果 数 据是 从 总 体 的 一 个
,
学 校 应 如 何 进 一 步 提高 和 改进 它 们 的教学 质
很 小 的部分 取 得 的
那 么 它 的 费 用 就 比普 查
,
量
的
。
这 种看 似好 笑 的事 情是 我 们所 常见 熟 知
小 得多 果
。
当总 体较 大 时
则 从 只 占总 体一 小
,
,
但事 实 上这些 研究 者与 在 那个 学校生 活
,
部 分 的样 本 中就 能得 到 精 确度 足 够有 用 的 结
如 在教育 科 学 研 究 中
,
工 作 了 几 十 年 的 教师相 比
差 别仅 在 于 他们
可 能只 要 对 一 个
的 结 论所 依据 的经 验 样 本是 一 个 小 得多 的样
城 市 的 上 百 所 学校 中的 几所 学 校 甚 至 若 干 下 班级进 行 调 查
2
.
本
,
同时对 他们 自己 的 无知程 度 更 不 大 了解
。
就 能取 得 为 决定 教 育方 针 和
. 。
罢了
限制
同样
,
在 科 学 研 究和 人 类事 务 中
,
,
我
改 进教 学质 量 所 需 的 情况 了
速 度较 快
,
们由 于 缺 乏 资金
,
由于 能力
、
精力 和 时 间 的
同样 的 道 理
,
搜集和综合
,
对 能 增 进 人类 知 识 的 现 象 也 只 能 进 行
。
分 析样本 资料要 比搜 集和 综 合分 析全 面调 查
的 资 料更 快 些
当 迫切 需 要 有 关 的 信 息时
. .
部 分 的研 究
以 上 是 抽样 调查 的 例子和 背景
.
所谓抽
考 虑到 这一点 是 极 为 重要 的
3
.
样 调 查就 是根 据 概 率 论 的原 理 行调 查
,
,
按 照 随机 的 中
,
应 用范 围较广
,
在 某 些 种 类 的调 查
而 这 种人 员 或 设 备 在
原则从 总 体 中抽取 一 部分 样 本 (或单位 ) 进
必 须 使用 受过 一 定训 练 的 人 员 或 专用 设
,
并 根 据 调 查 结果进 一 步 推 断全 部总
。
备来 获得 有关 的数 据 数量 上 又 很 有 限
到的
,
体 的 特征
由于 抽样 调 查 不 是 对 这些总 体进
,
要 进 行 普 查 实际 上 是 办 不
行 全 面 调 查 或 普查
28
所 以 总 有人 对 抽样 调 查
.
在 这种 情 况 下 就 只 能通 过 抽样 调 查 来
.
结 论 的 正 确性 表 示 怀 疑 一 一
这种怀疑 虽 然 是 可
获 得 信息
因 此 就 能 取 得 的信 息 的种 类 来
说 广
,
,
抽样 调 查 可 以 发 挥 作 用 的范 围 更 为 宽
而 且具 有更大 的 灵 活 性
4
.
与 调查 目 的有 关 势
,
,
并 且 没 有 遗 漏基 本 数 据
。
,
。
这样做是很好 的
因 为时常有这样一 种趋
,
准 确 度较 高
,
.
由于 抽样 调 查 减少 了 费
。
就 是 调 查 的 问 题或 搜集 的 数据 太多
,
但 这
用 和 工 作量
所 以就 能雇 用质 量 较高 的 工 作
同 时 由于
,
。
有 些 问 题 或数 据 在 后 来 却从 未被 分 析 过
是一 种 浪 费 题是 多 余 的
。
,
人员
,
并对 他们 进行 深人 的 训 练
也 说 明 这 些 后来 未 被 分 析 的 问 特别 是 对 以 人 为 总 体 的 抽样 调
。
实 地 调 查 工 作 可 以 受 到 更 仔 细 的检 查 监 督 调 查 资料 的 处理 也 能够更 好 地 完成
因此与
查更 常 出 现 这 样 的 情 形
过 长 的 调查 表 (即
,
可 能进 行 的全 面调 查 相 比
,
抽样 调 查 可 能取
对 每一 个被 调 查 者要 调查 或要 求 答复 的 问 题
得更 准 确 的 结 果
二
、
.
过 多 ) 会降 低 回 答 的 质 量
问 题 受 到 了 影响
,
不 仅 不 太重 要 的
就 连 重 要 的问 题 也会 一样
。 。
抽 祥调 查 的主 要 步骤
,
得 不 到 良好 的 答复
4
.
尽 管不 同的 抽样 调 查 的 复杂 程 度差 别很 大
,
确 定 所 需结 果 的 精确 度
, ,
由于 只 调 查
但作 为一 种 科 学 方 法
?
抽样 调 查还 是 有
按 照 著名 的 美 国
,
了总 体 的一 部 分
并 且 由于 不可 避免 的 调查
其 自 身的 独 特 规 律 可 循 的
统 计学 家 W
1
.
.
中的误 差
所 以 抽 样 调 查 的 结果 总 是 带有 某
。
G
?
科 克 伦 的看 法
。
一次抽
些 不 确 定性
增 加 样 本 的 数量 或 使用 更 优 良
,
样 调查 的主 要 步 骤大 致 分 为如 下
1 项 :
写 出调 查 的 目 的
.
的测 量 器 具 会 降低 这 些 不 确 定性
但 这要 化
。
明 确 地 写 出调 查 的
,
费 较多 的 时 间和 费 用
。
因 此确定 调 查 结 果所
目 的是 很 有 好 处 的
如果 不这 样 做
则 在复
需 达到 的 精 确 度 是一 个 重 要 的步 骤
完 成这
杂 的 调查 中
,
当 注意 力集 中于 调 查 方 案 的 细
。
一 步 即 确定 出所需 的 精确 度是 今 后 将要 使用
这些 调 查 数 据 和 结 论 的 人 的 职 责 (调 查 人员
节时
,
就 很容 易忘 记这 些 目 的而 作 出 与调 查
.
目的 不相 一 致 的 决 定
2
则 根 据 这 一 精 确 度来 设 计 调 查 方 案 )
确定 总体
.
总体 这个 词 用 来 表示 从 中
.
抽取 样本 的那 个 集 合体
均成绩 时
,
当从 一 批 毕业 班 的
学 生 中 进行 抽样 来 估计 一 个 毕业 班 学 生 的平 总 体 的 确 定 是 没 有 什 么 问题 的 ( 是这 批 毕业 班 的 学 生 全 体) ; 但 是 从 一 个 就
但要 因 为 许 多行 政管理 人 员 (他 们是 调 查 资料 的 使 用 者 ) 并不 习 惯 于 考 虑可 以 允 许 有 多 大 的 误 差而 不 会 影 响 作
做到 这 一 点会 有些 困 难
.
,
,
出 良好 的 决策
5
.
。
选 择 计 量 (即 获 取 数 据 或 问 题 )方 法
.
.
由 身 体 健 康 的 中学 生 所 组 成 的 总 体 中抽 样 时
,
对 测 量 的 器 具 和 调 查 总 体 的 方 法可 以 根 据 实
际 需 要 加 以选 择
就 必 须 确定 一些 明 确 的 准则 来 给身体 健
,
如关 于 一 个 学 生 的 健康 情
,
康下 定义
可 的 情况
否 则 就会 发生 难 以 划 分 的 模棱 两 这些 确 定 总 体 的 原 则必 须 是 在 实
,
况 的 数据
,
可 以 从 他 本 人 的 陈述 中 取 得
。
也
。
可 以 从 体格 检查 的 结果 中取 得
调 查 方 法可
,
际调 查 中切 实 可 行 的
必 须使 得 调 查 人员 在
,
以 是发 调 查 表 由被 调 查 者 自 己 填 报
也可 以
调 查 现场 不需 怎 么 犹 疑 就 能 决定 一 个 可 疑 的
由 调 查 人 员 向被 调查 者念 一 组 事先 统 一 制订
的
、
情况 是否 属 于 被 调 查 的 总 体
调查 的 顺 利进 行
,
否 则 就会 影响
,
不 能 随意增 删
,
、
变动 的 问 题 让 被调 查 者
。
有 时 甚 至 会 影 响到 调 查 结 抽取
,
回答
或 者调 查 人 员 对 被 调 查 者进 行调 查 访
调
、
论的 正 确性 (因 为 总 体定义 得不 明 确
的样 本 可 能 不属 于 总 体 的或 想研 究的
3
.
间 时 可 以对 间 题 的 提 法 与次序 任 意安 排
即 不 是 我 们所 关 心
.
查 方 式可 采 用 邮寄 调查 表
电 话采 访或 现 场
.
,
用 由这些 样 本所 得 的 结论 去
.
访间
,
也 可 将这 几 种方 式 结合 起 来
推 断 总
体 的 特征 就可 能 出现 问 题 )
实 际 调 查 前 的主 要 准 备 工作 是设计 好一 份列 有 间题 和 要 填 人 回答 的 调查 表
。
确定 待 搜 集 的数 据
证 明所 有 数据 都
对简 单
29
一
一
的调查 表
,
有 时 可 以 把 答 案事 先 编 好 代 号
,
回答
,
就是 调 查 人 员 无 法 从 洋本 中 的 某 些 单
,
填报 时 不 需 填人 实 际 答案 而 只需 单 上 答案 的 代号
,
位 取 得 信息 (如 寄 回 的调 查 友 中
有一 些 问
这 样就 能 直接 把 调 查 数 据 输 人 计算 机
。
题 被调 查 者没 有 回 答
10
.
,
或 在 实地 访 间时 被访
。
进行 处理 与分 析
事 实上
,
要 设 计 出 良好 的
问 者 拒 绝 回 答 某 些 问题 )
填报表 格
6
.
,
就 必 须 设想 好用 于 作 出 结论 的最
。 。
数 据 的综合与 分 析
,
.
第一 步 是对 已
)
,
终 总 表 格 的 结构 前
,
经 填 报 好 的 调 查 表 进 行 编 辑 (校 订
以便
确定抽样 单位
,
在进 行 实 际抽样 之
,
订 正 填 报 的 错误
删去
.
或 长 少 把 明显 错 误 的 效据
, ,
总 休 必 须 划 分 成 为 叫 做 抽 样 单位 (或 单
这 些 单 位必 须 互 不 重 迭
如 果 被调 查 者刘 某些 问 题 陡 有 回 答
,
位 ) 的 各部 分 且 能 合成 总 体
一
并
或 在 编辑 过程 中 已 把 某 些 答复 删 去
对 计算 (机 ) 程 序 作 出 相应 的 规 定
则应当
以 把这
,
。
也 就是 说
,
,
总 体 中 的 每个 个
。
. ’ 休必 须 属 J 而 且 只 能属 于一 个单 位 当 的单 位 是 明 显 的
有 时适
.
种 情 况 考 虑进 去
.
在此 之 后
,
进 行 计算
得
如对 于 一 个 学 校 的 学 生
有
,
出 对某 些 总 体 特 征 (平均 数
、
百 分 比等 ) 的
总体
,
单 位 往往 就 是一 个 学 生 或 一 个 班
,
估计值
。
当然
。
,
对 同 样 的 数据 可 以采 用 不 同
,
时 单位 是 要 进 行 选 择 的
如 对 一 个 城市 的 所
的 估 计方 法
有在校 中学 生进行 抽样 时
需要
,
根 据 实 际情 况 和
,
在 提 出 中 间或 最终 的 调 查 结果 报 告 时
很 好 的 做法
.
单位 可 以是 一 个学 生
,
.
也 可 以是 一 个
对 最 重 要 的估 计值 说 明预 期 的误 差 的大 小是
班 级 (里 的全 部 学 生 )
( 的 全 体 学生 ) 里
7
.
也 可 以是 一 个 学 校
抽样 调 查 的优 点 之一 就是 能作
,
出 这样 的 关 于 误 差 大 小 的 说 明
.
从 而 使得 使
。
抽选 样 本
现在有 各种抽样 的 方案
,
用 者 可 以 知道 (或 自 己 判 断 出 ) 这 些 结果 在
(下 面我 们将 介 绍一些 常 用 的 抽 样方 案 )
对
.
多 大 程 度 上 或多 大 范 围 中是 准 确 有效 的 情 况下
1
,
当
每 个 要 加 以考虑 的 方 案 在 作 出 决定 之前
8
.
,
可 以 从 要 求 达到 的
然 在被 调 查 者 不 回 答 的 问 题 的 数 量 相 当多 的
精 确 度粗 略 地 估计 一 下 要 抽取样 本 的 数 量
,
作 出这 种误 差大 小 的 说 明 时应 留 有
。
还 要 对 每 个 方 案 所 需 的相
.
很 大 的余 地
.
对 费 用 和 时 间加 以 比 较 预先 试 验
,
.
为将 来 的 调 查 搜 集 信 息
,
.
我们对一
.
在小 范 围 内试 填 一 下 调 查
.
个 总 体初 步 掌 握 的 信 息越多
则 设 计一 个 能 任何 一 个
,
表 和 试 验 一 下 调 查 方 法 是 有好 处 的
这 种预
给 出 精确 估 计值 的 抽样 就 越容 易
先试 验 的结 果
改进
,
L f 乎 总能 对 调查 表 作 出 一 些
。
抽选 出来 并 已经 过 计算 的 样 本
将 来 的 抽 样起 指 导 作 用
,
都能对 改进
,
并可 能发 现 一 些 问 题
, ,
这 些 问题 如 不
因 为 它 提 供 了均 值
加 以 纠正
则 在进 行大 范 围 的调查 时 将 会 产
和 标 准差 等 主 要 测量 值 的 变 异 性 质 的 数 据
生 很 严 重 的麻烦
9
.
例如 费用 或 时间 可 能 会 大
. .
以 及 获 得 这 些 数 据 所 需 的 时 间 和 费用 等 信
大 超 过原 来 的 设想
息 在进 行范 围 广
。
.
若 能 作 出一些 规 定 来搜 集 和 记 录 这 类信
.
实地 调 查 工 作 的 组 织
,
息 则 抽样 调查 的 科学就 能更 快 地 向前 发展
三
、
,
泛 的 调 查 时会 遇 到 许多 管理 问题 必 须 接受 训 练
调 查人 员
抽样 调 查 方法 的 分 类
.
使 他们 了解 调 查 的 口 的 和要
,
抽样方 法原则 上 可 分 为 概 率 抽样 和 非 概 率抽样 两 大类
下 是 有用 的
,
使用 的 计量 方 法
的监 督
.
他们在工 作 中还要 有适 当
,
非 概 率 抽样 尽 管 在 某 些 场 合
,
对 填 报 后 寄 回 的调 查 表 的 质 量 进 行 这时 如 若发 现问 题 还
。
但它 却 经不 起 抽 样理 论 的 发 展
是 因为 这 类 方
.
早 期检 查 是很重 要 的
的 检验
.
之 所 以 经 不 起检 验
、
有 可 能采 取 补救 措 施
一 30 一
对不 回 答 的 某些 问题
.
法不包 含 任何 随 机 抽 选 的 因 素
因此 在 本 文
或 调 查 表 也 必 须有 相应 的 处理 方 案
所谓 不
中我 们 只 介绍 理 论 完 善
应 用 广 泛 的概 率 抽
样
,
并把 其等 同 于 一 般 的 抽样 或 抽样 调 查
.
先将 全 部总 体 单位 按 某 种 标 台 组 分 位
。
,
然后 再
,
抽样 调查 (即概 率抽样 ) 通 常 采 用 以 下 几 种 组 织 形 式 或方 法 :
1
.
在 侮 一 组 中 随 机 或 机 械 等 即 地 抽取 被 调 查 单
例如
,
某市 学生 的 学 习 成 绩调 查
叮先
简 单 随 机 抽 样 (或 纯 随 机 抽 样 )
n
。
从
按 (学 生 所 隶 属 的 ) 学 校 将 学 生 分 成 若
干 组
,
N 个 单位 的 总 体 中 抽 取
,
个 单 位 即一 个 样
然 后 再 在 侮 个 组 (即 学 校 ) 中 随机 或 等
,
本 若 以 个 不 同 的 样 木 中的每 一 个 被 抽 中 的
机 会 或 概 率 都 相等 机 抽样
法
,
。
距 抽 取 调 查 单位 ; 对 某校 学生 的 健 康状 况 进 行 调查 时 个 年龄 段 行 抽样
础
,
.
,
则 这 种方 法 就 是 简 单 随
。
可 先 将 该 校 个 部学 生 划分 成 若 干
这 是一 种 完 全 按 随 机原 则 从总 体 中
,
然 后 再 刘 梅 个年 龄段 中 的 学 生 进
抽取 抽样 单 位 的 抽 样 方 法
例如
,
采用 抽签
分 层 随 机 抽 样 方 法 以 分 组 法 为基
或 根 据 随 机 数 (字 ) 表 来 抽 取 抽 样 单
这 种 方 法 简便 易行
,
.
把 具 有 相 似 特 征 或 标 志 的 单位 归 为 一
位
。
,
当总 体 单位 数 口不
,
组
,
白然 就 缩小 了 组 内被 调 查 单 位 之 间的 差
,
太大
或 总 体单 位 之 间 的 差 异 较 小 时
.
可以
异 程度
再 通 过 加 权 平均 可 以 缩 小 全部 调 查
,
采 用它
2
单 位之 间 的 差异 程 度
.
因 而 其 结 果 具有 较 高
,
等 距 抽样 (或 机 械 随 机 抽 样 )
,
.
它是
,
的准 确 性
。
此外
,
分 组 往 往 是 以 客 观存 在 或
因 而 也容 易 实 施
。
事先 将 总 体单 位 按 一 定 顺 序 排 列
随机 和 等 距 的原 则 抽取 抽样单 位
然后 按 照
某 些 明 显 的 标 志 为 依据 被 广泛 地 采 用 大
、
例如
,
当
这 些 显 著 的 优 点 使 得 分层 随 机抽 样在 实践 中
,
决定 由 总 体 中抽取 5 % 的 单位 数 口 时
(即 单位 的 排 列 序 号 )
一
先按
特 别 是 当 总 体 单 位 数 口很
。 .
随 机 原 则 从 前 2 个 号 码 中 抽取 一 个 号 码 0
,
单 位 之 间 的差 异较大 时 必 须 使用 它
. 4
然 后 征 隔 2 个单 位 0
.
整 群 随机 抽 样
,
它 的 特 点在 于
,
、
每次
,
等 距 (机 械 ) 地 抽 取一 个 单位
匀
,
这 种方 法可
,
抽取 的 不 是 一 个 单 位 或 个 体
而 是一 群单
以 保证 被 抽 中 的 单位 在 总 体 中 的 分 配 比 较均
位
.
例如
对 某 市 的 教育 质 量 进 行 调 查 时
、
缩 小 各 个单 位 之 间的 差 异 程 度
,
.
提 高抽
,
以 白然 形 成 或 客 观 存 在 的 班
年 级或 学校 做 年 级或 学 校 中
。
样 调 查 结 果 的 可 靠性
并且容 易 实施
,
还能
为抽 样 对 象
,
在 被 抽 中的 班
,
、
节省 大量 的 时间
列
,
等 距 抽样 时
:
总 体 单位 的
对 全 部 学 生即 单位 或 个 休加 以 调 查 法 虽 然 比较 简 单易 行
这种 方
排 列 顺 序 通 常有 两 种方 法
志 将 总 体 单 位顺 序 排 列
。
一 是有 关标 志 排
,
但 调 查 结 果的 准 确性
一 群 单 位 中
的 个 体 往
它按 照 与所 调查 的问 题有 密切 关系 的 标
较差
.
原 因是 首 先
,
,
:
,
例如
调 查 学校 的
,
往 具 有 某 些相 似 性
如一 个班 或 年级 的 学 生
,
教育 质量
,
可 按 学 生 的平 均 成 绩 的 高低将 学
常 有某 些 共性
对 他 们进 行 全 面 调 查 即 无 必
校或学 生 顺序 排 列 ; 序排列 序排 列
. .
调查 学 生 的 健 康 状 况
,
要 又 浪 费 时 间和 费 用 查 结 果 的 准确性
。
且 往往 过 分 强 调 了这
,
可 按 学生 的 百 米 跑成 绩 或 跳 远 距 离 等标 志 顺
些 未 必 能 代 表 其 它 个 体特 征 的 共性
影响调
,
二是 无 关 标 志 排 列
它按 照 与所 调
,
其次
,
由 于 对 一 群 单位 进 因此
.
查 的间 题 没 有直 接 关 系 的 标 志 将 总 体 单位 顺
行 全面 调查要 花 费较 多的 时 间和 费用 就 不可 能 调查 较多 的 群 体单 位
查 的 结 果 出现 偏 差
, ,
例如
,
调 查 学 生 的 健康 状 况 时
.
按
从 而 会 使调
上 述 的各 种
,
学 生 姓 氏 笔 划 的 多 少 或 出生 的时 间 等无关 标 志将 学 生 顺 序 排 列 一 般 地 说 (或 直 观 上
不能 代表 总 休 的特 征
,
在进 行实 际 的 抽 样 调 查 时 确 保 调 查 结 果 的 准 确性
,
看)
,
按 有 关 标 志 排 列 能 保 证 被 抽 样单 位 在
,
方 法 也 可 以 根 据 具 体 情 况 结 合起 来 使 用
以
总 体 中的 均匀 分 配 查 结 果 的准 确性
. 3
.
缩 小 抽样误 差
,
提高 调
.
同时 又 尽 可 能地 节
省 时 间和 费用
它是
。
分 层 随机 抽 样 (或 类 型 抽样 )
一 3
1
一
范文四:抽样方法
1 1.3抽样方法(一)
教学过程:
一、复习引入:
⑴在一次考试中,考生有2万名,为了得到这些考生的数学平均成绩,将他们的成绩全部相加再除以考生总数,那将是十分麻烦的,怎样才能了解到这些考生的数学平均成绩呢?
⑵现有某灯泡厂生产的灯泡10000只,怎样才能了解到这批灯泡的使用寿命呢?
要解决这两个问题,就需要掌握一些统计学知识.在初中阶段,我们学习过一些统计学初步知识,了解了统计学的一些基本概念.学习了总体、个体、样本、样本的容量、总体平均数、样本平均数的意义:在统计学里,我们把所要考察对象的全体叫做总体,其中的每一个考察对象叫做个体,从总体中所抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本的容量.总体中所有个体的平均数叫做总体平均数,样本中所有个体的平均数叫做样本平均数.
统计学的基本思想方法是用样本估计总体,即通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.因此,样本的抽去是否得当,对于研究总体来说就十分关键.究竟怎样从总体中抽取样本?怎样抽取的样本更能充分地反映总体的情况?本节课开始,我们就来学习几种常用的抽样方法 二、讲解新课:
⒈简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.
用简单随机抽样从含有6个个体的总体中抽取一个容量为2的样本.问:
①总体中的某一个体a在第一次抽取时被抽到的概率是多少?
②个体a在第1次未被抽到,而第2次被抽到的概率是多少?
③在整个抽样过程中,个体a被抽到的概率是多少?
分析:①总体中的某一个体a在第一次抽取时被抽到的概率是P=1C11; =16C6
11C5 ②个体a在第1次未被抽到,而第2次被抽到的概率是P=C1=1; 11C6C56
③由于个体a在第一次被抽到与第2次被抽到是互斥事件,所以在整个抽样过程中,个体a被抽到的概率是P=111+=. 663
1N;在整个抽样过程中各个个体被抽到的概率为注意:⑴一般地,用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时任一个体被抽到的概率为nN;
⑵简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等;
⑶简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.
介绍:抽样方法在统计学中很多,如果按照抽取样本时总体中的每个个体被抽取的的概率是否相等来进行分类,可分为:等概率抽样和不等概率抽样 又可以分为不放回抽样和放回抽样实际应用中,打用较多的是不放回抽样,相对来说,放回抽样在理论研究中显得更为重要⒉简单随机抽样的实施方法:
⑴抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本适用范围:总体的个体数不多时 优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.
⑵随机数表法:1.制定随机数表;2.给总体中各个个体编号;3.按照一定的规则确定所要抽取的样本的号码000
随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码 3.简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样 三、讲解范例:
例1.样本4,2,1,0,-2的标准方差是:
A.1 B.2 C.4 D.2
答案:D
例2.某次考试有70000名学生参加,为了了解这70000名考生的数学成绩,从中抽取1000名考生的数学成绩进行统计分析,在这个问题中,有以下四种说法:
(1) 1000名考生是总体的一个样本;
(2) 1000名考生数学成绩的平均数是总体平均数;
(3) 70000名考生是总体;
(4)样本容量是1000,其中正确的说法有:
A.1种 B.2种 C.3种 D.4种
解:(3)(4)对,故选B
例3.对总数为N的一批零件抽取一个容量为30的样本,若每个零件被抽到的概率为0.25,则N的值为( )
(A)120 (B) 200 (C) 150 (D)100
解:因为从含有N个个体的总体中抽取一个容量为30的样本时,每次抽取一个个体时任一个体被抽到的概率为1N;在整个抽样过程中各个个体被抽到的概率为3030;所以=0.25,从而有N=120. 故选A NN
四、课堂练习:
1 . 下列说法正确的是:
(A)甲乙两个班期末考试数学平均成绩相同,这表明这两个班数学学习情况一样
(B)期末考试数学成绩的方差甲班比乙班的小,这表明甲班的数学学习情况比乙班好
(C)期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班大,则数学学习甲班比乙班好
(D)期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班小,则数学学习甲班比乙班好2. 一组数据的方差是s,将这组数据中的每一个数据都乘以2,所得到的一组数据的方差是( ) 2
s2
A. 2; B. 2s; C.4s; D.s222
3.从某鱼池中捕得1200条鱼,做了记号之后,再放回池中,经过适当的时间后,再从池中捕得1000条鱼,计算其中有记号的鱼为100条,试估计鱼池中共有鱼的条数为( )
A. 10000 B. 12000 C. 1300 D.13000
4. (1)已知一组数据1,2,1,0,-1,-2,0,-1,则这组数数据的平均数为 ;方差为 ;
(2)若5,-1,-2,x的平均数为1,则;
(3)已知n个数据的和为56,平均数为8,则
(4)某商场4月份随机抽查了6天的营业额,结果分别如下(单位:万元):2.8,3.2,3.4,3.7,3.0,
3.1,试估算该商场4月份的总营业额,大约是__万元
答案:1.D五、小结 :统计的基本思想,简单随机抽样,什么样的总体适宜用简单随机抽样,如何用抽签法或随机数表法获取样本⑴抽签法、⑵随机数表法是一种等概率抽样方法.
课 题: 1.3抽样方法(二)
一、复习引入:
1.简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为2.⑴用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时任一个体被抽到的概率为1N;在整个抽样过程中各个个体被抽到的概率为nN;
⑵简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等;
⑶简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.
3.抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本
适用范围:总体的个体数不多时 优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.
4.随机数表法: 随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码 5.简单随机抽样的特点:简单随机抽样适用于总体中的个体数不多的情况,那么当总体中的个体数比较多时,应采用什么样的抽样方法呢?这就是我们本节课所要学习的内容——系统抽样.
二、讲解新课:
1.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.
2.系统抽样的步骤: ②为将整个的编号分段(即分成几个部分),要确定分段的间隔Nn(N为总体中的个体的个数,n为样本容量)是整数时,k=Nn;当Nn不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N'能被n整除,这时k=N'. n
③在第一段用简单随机抽样确定起始的个体编号l④按照事先确定的规则抽取样本(通常是将l加上间隔k,得到第2个编号l+k,第3个编号l+2k,这样继续下去,直到获取整个样本)说明:
①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;
②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的.
③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整三、讲解范例:
例1.为了了解参加某种知识竞赛的1000名学生的成绩,应采用什么抽样方法恰当?简述抽样过程. 解:适宜选用系统抽样,抽样过程如下:
⑴随机地将这1000名学生编号为1,2,3,?,1000.
⑵将总体按编号顺序均分成50部分,每部分包括20个个体.
⑶在第一部分的个体编号1,2,3,?,20中,利用简单随机抽样抽取一个号码,比如是18.
⑷以18为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:18,38,58,?,978,998例2.为了了解参加某种知识竞赛的1003名学生的成绩,请用系统抽样抽取一个容量为50的样本.
解:⑴随机地将这1003个个体编号为1,2,3,?,1003.
⑵利用简单随机抽样,先从总体中剔除3个个体(可利用随机数表),剩下的个体数1000能被样本容量50整除,然后再按系统抽样的方法进行.
说明:总体中的每个个体被剔除的概率相等(3),也就是每个个体不被剔除的概率相等?1000 1003?1003?系统抽样时每个个体被抽取的概率都是50,所以在整个抽样过程中每个个体被抽取的概率仍然相等,
1000
都是1000?50=50
100310001003
四、课堂练习:
1 . 一条流水线生产某种产品,每天都可生产128件这种产品,我们要对一周内生产的这种产品作抽样检验,方法是抽取这一周内每天下午2点到2点半之间下线的8件产品作检验.这里采用了哪种抽取样本的方法? 2. 在534名学生中抽取一个容量为31的样本作身体素质测试,用系统抽样法进行抽取,并写出过程案:1. 系统抽样.2.(略五、小结 :(1)系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段进行抽样时,采用课 题: 1.3抽样方法(三)
一、复习引入:
1.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.
2.系统抽样的步骤: ②为将整个的编号分段(即分成几个部分),要确定分段的间隔Nn(N为总体中的个体的个数,n为样本容量)是整数时,k=Nn;当N不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的n
个数N'能被n整除,这时k=N'. n
③在第一段用简单随机抽样确定起始的个体编号l④按照事先确定的规则抽取样本(通常是将l加上间隔k,得到第2个编号l+k,第3个编号l+2k,这样继续下去,直到获取整个样本)3.①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;
②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的.
③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容二、讲解新课:
1.分层抽样: 当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总 2.不放回抽样和放回抽样:
在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样. 三、讲解范例:
例1.某单位有老年人28 人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36样本,适合的抽取样本的方法是 ( )
A. 简单的随机抽样 B. 系统抽样
C. 先从老年中排除一人,再用分层抽样 D.答案:C
例2.一个单位有500名职工,其中不到35岁的有125人,35岁~49岁的有280人,50岁以上的有95人.为了了解这个单位职工与身体状况有关的某项指标,如何从中抽取一个容量为100的样本?
解:由于职工年龄与这项指标有关,故适于用分层抽样,抽样过程如下: ⑴确定样本容量与总体的个体数之比100:500=1:5; ⑵利用抽样比确定各年龄段应抽取的个体数,依次为
125,280,95,即25,56,19.
555
⑶利用简单随机抽样或系统抽样的方法,在各年龄段分别抽取25,56,19人,然后合在一起,就是所要抽取的样本.
说明:①分层抽样适用于总体由差异比较明显的几个部分组成的情况,是等概率抽样,它也是客观的、公平的;
②分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,使样本具有较好的代表性,而且在各层抽样时可以根据情况采用不同的抽样方法,因此在实践中有着非常广泛的应用.
例3某学校有职工140人,其中教师91人,教辅行政人员28人,总务后勤人员21人. 为了解职工的某种情况,要从中抽取一个容量为20的样本.以下的抽样方法中,依简单随机抽样、系统抽样、分层抽样顺序的是 ( )
方法1:将140人从1~140编号,然后制作出有编号1~140的140个形状、大小相同的号签,并将号签放人同一箱子里进行均匀搅拌,然后从中抽取20个号签,编号与签号相同的20个人被选出;
方法2:将140人分成20组,每组7人,并将每组7人按1—7编号,在第一组采用抽签法抽出k号(1≤k≤7),则其余各组尾号也被抽到,20个人被选出;
方法3:按20:140=1:7的比例,从教师中抽取13人,从教辅行政人员中抽取4人,从总务后勤人员中抽取3人.从各类人员中抽取所需人员时,均采用随机数表法,可抽到20个人.
A.方法2,方法1,方法3 B.方法2,方法3,方法1
C.方法1,方法2,方法3 D.方法3,方法1,方法2
答案:C 四、课堂练习:
1 . 统计某区的高考成绩,在总数为3000人的考生中,省重点中学毕业生有300人,区重点中学毕业生
有900人,普通中学毕业生有1700人,其他考生有100人.从中抽取一个容量为300的样本进行分析,各类考生要分别抽取多少人? 2. 某农场在三块地种植某种试验作物,其中平地种有150亩,河沟地种有30亩,坡地种有90亩.现从中抽取一个容量为18的样本,各类地要分别抽取多少亩? 3. 一个工厂有若干车间,今采用分层抽样方法从全厂某天的2048件产品中抽取一个容量为128的样本进行质量检查.若一车间这一天生产256件产品,则从该车间抽取的产品件数为________
答案:1. 省重点中学抽取30人,区重点中学抽取90人,普通中学抽取170人,其他考生抽取102. 平地抽取10亩,河沟地抽取2亩,坡地抽取63. 16
五、小结 :三种抽样方法的比较
范文五:抽样方法
卫生服务总调查样本地区和样本个体的抽取方法
一、概 述
1. 1国家卫生服务总调查抽查的原则是既要兼顾调查设计的科学性即样本地区和样本个体 对全国和不同类型地区有足够的代表性,又不致于过多增加样本量而加大调查的工作量,即经 济有效的原则。
1. 2抽样的方法是多阶段分层整群随机抽样法。第一阶段分层是以县(市或市区)为样本 地区;第二阶段分层是以乡镇(街道)为样本地区;第三阶段分层以村为样本地区;最后是住 户为样本个体。
二、第一阶段分层整群抽样
2. 1第一阶段抽样着重解决两个基本问题:一是由于全国各县、市差异极大,如何确定第 一阶段分层的基准;二是抽样比例,多大的县、市样本量能经济有效地代表全国和不同类型的 地区。
2. 2第一阶段分层基准的确定
第一阶段分层的指标是通过专家咨询法和逐步回归法筛选的10个与卫生有关的社会经 济、文化教育、人口结构和健康指标。10个指标的主成份分析结果如表1。
表⒈ 主要社会经济和人口动力学指标的主成份因子模型
从主成份分析中可以看出主成份1与绝大多数变量有十分显著的关联,意义十分明确,而 且代表 10 个变量整体信息的 51.22%。其值的大小可以综合反映一个地区社会经济、文化 教育、人口及其健康的发展。因此,确定主成份1为分层的基准称它为分层因子。
2. 3第一阶段的聚类分层
在计算各县、市分层因子的得分后,用 K-Means聚类分析方法将总体分为组间具有异质 性和组内具有同质性的五类地区即五层。聚类分层的结果第一层有 201 个县(市或市区) ,占 整个县(市或市区)的 8.2%;第二层有 650个县(市或市区) ,占 26.5%;第三层有 698 个县 (市或市区) , 占 28.5%; 第四层有 691个县 (市或市区) , 占 28.2%; 第五层有 212, 占 8.6%。
表⒉显示了各层因子得分和选择的社会经济等变量的均值,可见各层呈明显的梯度。可以 认为,第一层所在的市县,是社会经济、 文化教育和卫生事业发展以及人群健康状况好的地区,
第二层是比较好的地区,第三层是一般性地区,第四层是比较差,第五层是差的地区。
表 2 主要社会经济和人口动力学指标的主成份因子模型
市县 因 子 得 分 社会经济和人口动力学指标
2. 4第一阶段分层等概率多种样本容量的抽样
用经济有效的样本代表总体是抽样调查的精髓。样本量的确定基于以往的经验和其他国家 抽样调查样本的设计,首先给定一个样本量大小的范围,确定抽取样本量为 120, 90, 60, 45, 30 五个大小不等的样本。为了保证各层每一个县(市或市区)都有同等被抽取为样本的 概率,必须考虑不同大小样本量的样本在各层的分配,即按比例的分层抽样。见表⒊。
表⒊ 不同大小样本量样本在各层的分配
层
数 全 国 不同大小样本量样本的分配 :
按系统随机抽样方法,每个不同大小样本量的样本抽取 6 次。同一样本量的 6 次抽样, 通过计算每次抽样样本各变量的统计量,分别与总体各变量参数进行比较,从中筛选出与总体 参数最为接近的那个样本,作为该样本量的最佳抽取样本。
2. 5第一阶段最佳样本量样本的选择与评价
⑴ 不同样本量样本各变量均值与总体均数的比较:如果将不同样本量样本各变量的均值 与总体各变量的均数绝对误差,绝对误差与总体均数之比为相对误差,同一样本各变量的相对 误差具有可加性,其均数称为该样本各变量的平均相对误差。平均相对误差可作为判断不同大 小样本量样本对总体代表性的一个尺度。同时,用“1-平均相对误差”作为精确度。
表⒋显示了不同样本量样本各变量的均数,与总体各变量比较的相对误差、平均相对误差 和精确度。从不同样本量样本来看,平均相对误差随着样本量的减少而增大。如样本量从 120减少到 60,平均相对误差由 1.4%增加到 2.7%,增加了 62%,而样本量从 60 减少到 30, 平均相对误差从 2.7%增加到 5.6%,增加了一倍以上。样本量为 120, 90, 60 的样本精 确度均大 95%,也就是说样本量大于 60 就可对总体有较好的代表性。
⑵ 不同样本量样本各变量的分布与总体分布的比较:样本变量的分布与总体分布是否吻 合也是衡量样本对总体代表性的一个尺度。表⒌列出了不同样本量各变量分布与总体分布卡方 检验的结果。从不同样本各变量分布与总体分布的结果,平均卡方值小于 9.49这一差异有显 著性水平的样本量为 120, 90 和 60。鉴于上述分析,故可认为,样本量大于 60 的样本, 各变量的分布大多与总体分布相拟合,对总体有较好的代表性。见表5。
⑶ 不同样本量样本分散度的评价:样本分散度指样本中各层的变量统计量对总体各层的 代表性。在第一层中,样本量为 120 和 90 的样本,平均每个指标的精确度均大于 95%;
样本量为 60 的样本,精确度为 89.4%。从第二层到第四层,样本量为 120 和 90 的各个 样本,平均每个指标的精确度都大于 95%;第五层样本量为 120, 90和 60的各样本,精确 都分别为 94.1%, 92.5%和 93.9%,与上述四层相比,精确度略差一些。也就是说,要对 总体各层有较好的代表性,样本量至少为 90 。详见表6。
2. 6考虑到经济有效的原则和对全国、不同类型的地区和上述每个指标的代表性,国家卫 生服务总调查的县(市或市区)样本容量取90。具体抽出的县、市或市区见附件5。
三、第二阶段整群随机抽样
3. 1在上述抽取的90个“样本县(市或市区) ”中,以乡镇(街道)为第二阶段整群系统 随机抽样单位。全国每个乡镇(街道)被抽取为“样本乡镇(街道) ”的概率是 1∶ 160。第二 阶段整群系统随机抽样全国共抽取 450个乡镇(街道) 。平均每个“样本县(市或市区) ”抽5个乡镇(街道) 。第二阶段分层整群抽样具体由各样本县(市或市区)按下述方法抽取。
3. 2第二阶段整群随机抽样的基准
由于一个县(市或市区)内社会经济、文化教育和卫生状况的差异远小于全国各县、市之 间的差异,因而确定县(市或市区)的抽样基准相对容易。根据我国各县(市或市区)的基本 特征、实际的可操作性和以往抽样调查常用的指标,确定采用人口数(或人均收入)作为分层 基准。
3. 3第二阶段整群随机抽样的的方法
① 将样本县(市或市区)所有的乡镇(街道)按人口数的多少(或人均收入的大小)由多 到少依次排序;
② 由多到少依次计算人口数(或人均收入)的累计数;
③ 计算抽样间隔,用累计的人口总数(或人均收入累计总数)除于抽取的样本数(累计总 数/5) ;
④ 用纸币法 (随便拿出一张人民币,看人民币的号码与最初累计数哪一个数接近,取这个 数为开始数) 随机确定第一个样本乡镇 (街道) , 然后加上抽样距离确定第二个样本乡镇 (街道) , 依次类推确定第三至五个样本乡镇(街道) 。
3. 4第二阶段整群随机抽样实例
某个样本县共有 18个乡、镇,要从该样本县抽取5乡镇作为样本。根据抽样方案的要求, 第一步人口数的多少由大到小排序,并计算累计数(该县人口累计数即人口总数为 210100) , 见表6;
第二步计算抽样间隔,用人口总数除于抽样的样本数, 248600/5 = 49720,该县乡镇 整群抽样的抽样间隔为 49720;
第三步确定第一个随机数,取一张人民币,其编号的为 FP59243854,取后5位数是 43854,所取的后5为数不能大于抽样间隔数,如大于再取一张人民币.该后5位随机数接近 第2编号即平湖镇后面的累计数,因此确定第2号平湖镇为第一个样本;
第四步用第一个样本的累计数加抽样间隔,即 43000 + 49720 = 92720,
该数接近第5编号即新龙乡的累计数,确定第5号新龙乡为第二个样本。
第五步用第二个样本的累计数加抽样间隔,即 100900+49720=142920,该数接近第8编号新原乡的累计数,确定第8号新原乡为第三个样本;同样的方法确定第⒔号和第⒙号即桐 连乡和四顶乡。这样,五个样本乡镇就确定了。
四、 第三阶段随机抽样
4. ⒈第三阶段随机抽样的基准和样本容量
⑴ 在同一个乡镇(街道)内,各村(居委会)的经济发展和卫生状况基本上变异不大。 因此,第三阶段不用分层,直接采用随机整群抽样的方法从“样本乡镇(街道) ”中抽取样本村 (居委会) 。 但是, 抽样时应按各村人均收入或人口数作为标识进行排序。 第三阶段随机抽样由 调查指导员负责。
⑵ 每个“样本乡镇(街道) ”整群随机抽取2个村(居委会) ,全国共抽取 900个村(居 委会) ,全国每村(居委会)被抽为样本的概率为 1:1120。
4. 2第三阶段整群随机抽样的的方法
① 将样本乡镇(街道)所有的村(居委会)按人均收入的多少(或人口数的大小)由多到 少依次排序;
② 由多到少依次计算人均收入(或人口数)的累计数;
③ 计算抽样间隔,用累计总数除于抽取的样本数(累计总数/2) ;
④ 用纸币法 (随便拿出一张人民币,看人民币的号码与最初累计数哪一个数接近,取这个 数为开始数)随机确定第一个样本村(居委会) ,然后加上抽样距离确定第二个样本村。
4. 3. 第三阶段随机整群抽样的实例
第一步将所有的村按人均收入的多少由大到小排序, 并计算累计数; 第二步计算抽样间隔: 7337/2 = 3669 ;第三步确定第一个随机数,取一张人民币,其编号的后 4 位数是 2273, 这个随机数接近第4编号的累计数,因此确定第4号村为第一个样本;第五步用第二位的累计 数加抽样间隔(2805 + 3669 =6474) ,接近第⒑编号的累计数,确定第⒑号为第二个样本。
* 为随机抽取的样本数。
五、样本个体的抽样
5. 1最终的抽样单位是住户。在每个“样本村(居委会) ”中按 20%的比例随机抽取住户, 平 均每个村抽 60户 ,全 国共抽取 54000户。 全国平均 每户被 抽取为 样本的概率为 54000/28000万,约五千户中抽一户。如果按每户四个人计算,人口抽样比为 1:5000 左右。 5. 2抽户方法是各样本乡镇(街道)的调查指导员上述抽样比例在样本村(居委会)随机 抽取,具体方法:
① 按人口普查的编码顺序,按门牌号、楼号、单元号、门号从小到大排列;
②对同一门牌号,同一个大院和楼号的,按门号从小到大排列,对同一门牌号内没有门号 的按从左到右、从外到里、从下到上的原则编码。一经编码不许变动;
③编好住户码列入住户清单表式中:
④根据抽样比例计算应抽的户数 (一般平均每个样本村60户) ,然后系统随机抽取。 方法 同上:第一步将所有住户的人口累计数、本村的平均人口数(1200/300=4)和本村应抽取的 住户数 (300*20%=60) ; 第二步计算抽样距离 (1200/60=20) ; 第三步确定第一个随机数 (如 取一张人民币,其编号的后两位数是 12,这个随机数接近第3编号的累计数,因此确定第3号住户为第一个样本;第五步用第3号的累计数加抽样距离(13 + 20 =33) ,看 33 最接近 第几编号住户,并确定这家住户为第二个样本,同理用第二个样本住户对应的累计数加抽样距 离确定第三个样本。同样确定以后各样本住户。
⑸ 抽样时可多抽取六户, 作为备用。抽取方法是在上述抽取完毕以后,按上述步骤再从未 抽取的住户中抽取6户。
国家卫生服务总调查样本容量和抽样概率
____________________________________________________
全国每一户家庭被抽群为样本的概率模型:
90/2567 * 450 * ST /<(90 567)*280000000=""> * 2/ST/280 * 60/280 = 1:5000 -------- --- ------------------------- -------- -------
↑ ↑ ↑ ↑ ↑ 在样本村每户
||||被抽取的概率
||一个乡被抽取为样本的概率 一个村被抽取为样本的概率
|样本乡镇(街道)数
一个县(市或市区)被抽取为样本的概率 ( ST: 乡镇(街道)户数的大小)
不同大小样本社会经济和人口动力学指标的均数以及与总体均数的相对误差
全 国 不 同 大 小 样 本 的 均 数
(90>