范文一:常用统计分析方法
常用统计分析方法
排列图 因果图 散布图 直方图 控制图 控制图的重要性 控制图原理 控制图种类及选用
统计质量控制是质量控制的基本方法,执行全面质量管理的基本手段,也是 CAQ 系统的基础,这 里简要介绍制造企业应用最广的统计质量控制方法。
常用统计分析方法与控制图
获得有效的质量数据之后 , 就可以利用各种统计分析方法和控制图对质量数据进行加工处理 , 从 中提取出有价值的信息成分。
常用统计分析方法
此处介绍的方法是生产现场经常使用 , 易于掌握的统计方法 , 包括排列图、因果图、散布图、直方 图等。
排列图
排列图是找出影响产品质量主要因素的图表工具 . 它是由意大利经济学家巴洛特 (Pareto) 提出的 . 巴洛特发现人类经济领域中
1. 排列图的画法
排列图制作可分为 5步 :
(1)确定分析的对象
排列图一般用来分析产品或零件的废品件数、吨数、损失金额、消耗工时及不合格项数等 . (2)确定问题分类的项目
可按废品项目、缺陷项目、零件项目、不同操作者等进行分类。
(3)收集与整理数据
列表汇总每个项目发生的数量,即频数 fi 、项目按发生的数量大小,由大到小排列。最后 一项是无法进一步细分或明确划分的项目统一称为“其它”。
(4)计算频数 fi 、频率 Pi 和累计频率 Fi
首先统计频数 fi ,然后按 (1)、 (2)式分别计算频率 Pi 和累计频率
Fi
(1)式中, f 为各项目发生频数之和。
(2)
(5)画排列图
排列图由两个纵坐标,一个横坐标,几个顺序排列的矩形和一条累计频率折线组成。如图 1所示为一排列图实例。
2. 排列图用途
(1)确定主要因素、有影响因素和次要因素
根据排列图可以确定质量问题的主要因素:累计频率 Fi 在 0-80%左右的若干因素。 是影响产 品质量的主要因素,如图中焊缝气孔和夹渣。主要因素个数一般为 1-2个,最多不超过3个。
根据排列图可以确定质量问题的有影响因素:累计频率 Fi 在 80-95%左右的若干因素。它们 对产品质量有一定影响,称为有影响因素。
根据排列图可以确定质量问题的次要因素:累计频率 Fi 在 95-100%左右的若干因素,其对 产品质量仅有轻徽影响,称为次要因素。
(2)抓主要因素解决质量问题
将质量影响因素分类之后,重点针对 1-2项主要因素进行改进提高,以解决质量问题。实 践证明,集中精力将主要因素的影响减少比消灭次要因素更加有效。
(3)检查质量改进措施的效果
采取改进措施后,为了检验其效果,可用排列图来检查。若改进后的排列图中横坐标上因 素频数矩形高度有明显降低,则说明确有效果。
因果图
在找出质量问题以后,为分析产生质量问题的原因,以确定因果关系的图表称为因果图。它 由质量问题和影响因素两部分组成。图中主干箭头所指的为质量问题,主干上的大枝表示主要原 因。中枝、小枝、细枝表示原因的依次展开。
1. 因果图的画法
(1)确定待分析的质量问题,将其写在图右侧的方框内,画出主干,箭头指向右端,见图
2(a)
(2)确定该问题中影响质量原因的分类方法。 一般对于工序质量问题, 常按其影响因素:人 (Man)、 设备 (Machine)、 原材料 (Material)、 方法 (Method)、 环境 (Environment)等进行分类, 简称为 4M1E 。 对应每一类原因画出大枝、箭头方向从左到右斜指向主干,并在箭头尾端写上原因分类项目,见 图 2(b)。
(3)将各分类项目分别展开,每个大枝上分出若干中枝表示各项目中造成质量问题的一个原因。 中枝平行于主干箭头指向大枝。见图 2(c)
(4)将中枝进一步展开成小枝。小枝是造成中枝的原因,依次展开,直至细到能采取措施为止。
(5)找出主要原因,画上方框作为质量改进的重点。
2. 因果图的用途
(1)根据质量问题逆向追溯产生原因,由粗到细找出产生质量问题的各个层次、各种各样的 原因。以及各原因的传递关系。
(2)因果图可明确原因的影响大小和主次。从而可以作为制定质量改进措施的指导依据。 散布图
在质量问题的原因分析中,常会接触到各个质量因素之间的关系。这些变量之间的关系往往不能 进行解析描述,不能由一个(成几个)变量的数值精确地求出另一个变量的值,我们称之为非确 定性关系。散布图就是将两个非确定性关系变量的数据对应列出,标记在坐标图上,来观察它们 之间的关系的图表。
1. 散布图的画法
(1)收集数据
所要研究的两个变量如果一个为原因,另一个为结果时,则一般取原因变量为自变量,取结果变 量为因变量。通过抽样检测得到两个变量的一组数据序列。
(2)在坐标上画点
在直角坐标系中,把上述对应的数据组序列以点的形式一一描出。注意,横轴与纵轴的长度 单位选取原则是使两个变量的散布范围大致相等,以便分析两变量之间的相关关系。
2. 散布图的用途
(1)确定两变量(因素)之间的相关性
两变量之间的散布图大致可分下列六种情形,如图 3所示。
1) 强正相关。 x 增大, y 也随之线性增大。 x 与 y 之间可用直线 y=a+bx(b为正数 ) 表示。 此时, 只要控制住 x , y 也随之被控制住了,图 3(a)就属这种情况。
2) 弱正相关。图 3(b)所示,点分布在一条直线附近,且 x 增大, y 基本上随之线性增大,此时除 了因素 x 外可能还有其它因素影响 y 。
3) 无关。图 3(c)所示, x 和 y 两变量之间没有任何一种明确的趋势关系。说明两因素互不相 关。
4) 弱负相关。图 3(d)所示, x 增大, y 基本上随之线性减小。此时除 x 之外,可能还有其它 因素影响 y 。
5) 强负相关。图 3(e)所示, x 与 y 之间可用直线 y=a+bx(b为负数 ) 表示。 y 随 x 的增大而减 小。此时,可以通过控制 x 而控制 y 的变化。
6) 非线性相关。图 3(f)所示, x 、 y 之间可用曲线方程进行拟合,根据两变量之间的曲线关 系,可以利用 x 的控制调整实现对 y 的控制。
(2)变量控制。通过分析各变量之间的相互关系。确定出各变量之间的关联性类型及其强弱。 当两变量之间的关联性很强时,可以通过对容易控制(操作简单、成本低)的变量的控制达到对 难控制(操作复杂、成本高)的变量的间接控制。
(3)可以把质量问题作为因变量,确定各种因素对产品质量的影响程度。当同时分析各种因 素对某一质量指标的作用关系时,或某一质量现状的引发因素包含多种因素时,应尽可能将质量 数据按照各种可能因素类型进行分层, 如:按操作人员分层、 按使用设备分层、 按工作时间分层、 按使用原材料分层、按工艺方法分层或按工作环境分层等等。图 4所示为将因素分层之后使原来 无关的数据得以进一步细分。从而提示出更准确的内在联
直方图
直方图是适用于对大量计量值数据进行整理加工、 找出其统计规律。 即分析数据分布的形态, 以便对其总体分布特征进行推断的方法。主要图形为直角坐标系中若干顺序排列的矩形。各矩形 底边相等,为数据区间。矩形的高为数据落入各相应区间的频数。
1. 直方图画法
(1)收集数据。数据个数一般在 100个左右,至少不少于 50个。理论上讲数据越多越好,但 因收集数据需要耗费时间和人力、费用,所以收集的数据有限。
(2)找出最大值 L , 最小值 S 和极差 R 。 找出全体数据的最大值 L 和最小值 S , 计算出极差 R=L-S。
(3)确定数据分组数 k 及组矩 h 。通常分组数 k 取 4-20。设数据个数为 n ,可近似取 。通常 取等组距, h=R/k。
(4)确定各组上、下界 . 只需确定第一组下界值即可根据组距 h 确定出各组的上、下界取值。 注意一个原则:应使数据的全体落在第一组的下界值与最后一组(第 k 组)的上界值所组成的开 区间之内。
(5)累计频率画直方图。累计各组中数据频数 fi ,并以组距为底边, fi 为高,画出一系列矩 形,得到直方图。见图 5所示。
图 5 直方图
2. 直方图用途
(1)计算均值和标准差 S
均值表示样本数据的“质量中心”,可以按下式计算,
(3)
式中, n 为数据个数。
样本数据的分散或变异程度可用下列样本标准差进行度量:
(4)
(2)从直方图可以直观地看出产品质量特性的分布形态,便于判断工序是否处于统计控制状 态,以决定是否采取相应处理措施。
至此为止,我们介绍了质量控制中常用的统计分析方法。这些方法都是现场中经常用到的, 实现方便、简单有效的统计质量控制方法。各种方法可以单独使用,也可以综合使用,如何结合 生产实际情况,选择一种合适的方法,达到预期的控制效果,仍需要广大工程技术人员在实践中 不断摸索并总结经验。
控制图
现在将介绍过程控制中常用的控制图方法。包括控制图的重要性,控制图原理,控制图种类 及选用。
控制图的重要性
控制图是对生产过程或服务过程质量加以测定、记录从而进行控制管理的一种图形方法。图 9-6所示为一控制图图例。图上有中心线 CL 、上控制界限 UCL 和下控制界限 LCL ,并有按时间顺 序抽取的样本统计量数值的描点序列。
统计过程控制 (SPC)作为统计质量控制 (SQC)的核心技术受到普遍的重视。目前,工业发达国 家都将统计过程控制列为高技术项目,认为 SPC 是实现以预测为主的质量控制的有效手段。
控制图所以能获得广泛应用,主要是由于它能起到下列作用:
1. 贯彻预防为主的原则。应用控制图有助于保持过程处于控制状态,从而起到保证质量防患 于未然的作用。
2. 改进生产率。应用控制图可以减少废品和返工,从而提高生产率、降低成本和增加生产能 力。
3. 防止不必要的过程调整。控制图可用以区分质量的偶然波动与异常波动,从而使操作者减 少不必要的过程调整。
4. 提供有关工序能力的信息。控制图可以提供重要的过程参数数据以及它们的时间稳定性, 这些对于产品设计和过程设计都是十分重要的。
控制图原理
1. 统计控制状态
任何一个生产过程,不论它是如何精确设计和精心维护,总存在着一定量的固有的或自然的 变化。它是由许多偶然因素形成的偶然波动的累积效果。由于这种波动比较小,所以我们认为这 时生产过程处于受控状态或称为稳态。
此外,在生产过程中有时也发生由异常因素造成的异常波动。如:由于设备调整不当、人为 差错或原材料的缺陷而导致的质量波动。与偶然波动相比这种异常变化要大得多,而且往往表现 一定的趋势和规律,此时,我们认为生产过程处于失控状态。
受控状态是生产过程追求的目标,此时,对产品的质量是有把握的。控制图即是用来监测生 产过程状态的一种有效工具。 2. 控制图的统计学原理
令W为度量某个质量特性的统计样本。假定W的均值为 , 而W的标准差为。于是,中心线、 上控制限和下控制限分别为
(5)
(6)
(7)
式中,K为中心线与控制界限之间的用标准差为单位所表示的间隔宽度。
图 7说明了控制图的控制原理。对于每一个控制点来讲,只要点子是在控制界限之间,我们 就认为过程处于控制状态,不需要任何措施;但如果点子落在控制界限之外,就认为过程失控, 必须找出异常因素。采取措施加以消除。
正常情况下点子分布是正态的,落在控制界限之内的概率远大于落在控制界限之外的概率。 反之,若点子落在控制界限之外,可能是属于正常情况下的小概率事件发生,也可能是过程异常 发生,相对来讲,后者发生的概率要大得多。因此,我们宁可以为后者情况发生,这正是控制图 的统计学原理。
点子落在控制界限之内是否一定处于稳态?点子落在控制界线之外是否一定出现异常?这 两个问题的因答都是否定的。
更为科学的判断应根据概率统计方法对过程进行定量分析, 精确计算出状态的概率值之后再 进行过程状态判断。
以 K 取 3为例 (上、 下界限距中心线距离为 3倍的标准差 ) 可计算出各种模式控制图的概率值, 如表 1所示。
模 式
实 例 情 况
概率水平
有点出界
连续 35点中出界点数小于等于 1
0.0041
连续 100点中出界点数小于等于 2
0.0026
集中分层
连续 3点中在区间()中的点数大于等于 2 0.0053
连续 7点中在区间()中的点数大于等于 3 0.0024
连续 10点中在区间()中的点数大于等于 4 0.0006
连续 10点集中在区间()中
0.022
连续 11点集中在区间()中
0.015
连续 12点集中在区间()中
0.0102
链模式
连续出现在中心线一侧的点数大于等于 7
0.0153
连续 11点中出现在中心线一侧的点数大于等于 10
0.0114
连续 14点中出现在中心线一侧的点数大于等于 12
0.0125
趋势分布
连续上升或下降的点数大于等于 7
0.00039
连续上升或下降的点数大于等于 5
0.0164
连续上升或下降的点数大于等于 4
0.0824
表 1各种模式控制图的概率值
可见,根据不同的控制严格性要求应选用概率水平相应的控制图判断模式,如:当控制严格 性要求为1%时,可选用概率水平接近或略低于1%的模式实例作为判断过程异常的准则。各种 模式都应选择确定出一个恰当的实例情况作为判稳准则,所谓“恰当的”是指其概率水平在同类 模式中最接近控制严格性要求。否则,概率水平过大不能满足质量控制要求;概率水平过小会造 成误判次数增多从而降低生产效率、提高生产成本。
控制图种类及选用
控制图根据质量数据的类型可分为:计量值控制图、计件值控制图和计点值控制图。这些控 制图各有各的用途,应根据所控制质量指标的情况和数据性质分别加以选择。
数据类型
分布形态
控制图名称
简记
计量值
正态分布
均值 -极差控制图
R 控制图
均值 -标准差控制图
S 控制图
中位数 -极差控制图
-R 控制图
单值 -移动极差控制图
RS 控制图
计件值
二项分布
不合格品率控制图
P 控制图
不合格品数控制图
Pn 控制图
计点值
泊松分布
缺陷数控制图
C 控制图
单位缺陷数控制图
u 控制图
表 2常用控制图
各控制图用途:
1.-R 控制图。是最常用、最基本的控制图,它用于控制对象为长度、重量、强度、纯度、时间和 生产量等计量值的场合。
2.-S 控制图。此图与 -R 图相似,只是用标准差图 (S图 ) 代替极差图 (R图 ) 而已。极差计算简 便,故 R 图得到广泛应用,但当样本大小 n>10或 12时,应用极差估计总体标准差的效率减低, 最好应用 S 图代替 R 图。
3.-R 控制图 . 此图与 -R 图也很相似 , 只是用中位数图 (图)代替均值图(图)。由于中位数的 计算比均值简单,所以多用于现场需要把测定数据直接记入控制图进行管理的场合。
4. RS 控制图。多用于下列场合:(1)采用自动化检查和测量对每一个产品都进行检验的场 合; (2)取样费时、昂贵的场合; (3)如化工等过程,样品均匀,多抽样也无太大意义的场合。由 于它不像前三种控制图那样能取得较多的信息,所以它判断过程变化的灵敏度也要差一些。
5.P 控制图。用于控制对象为不合格品率或合格品率等计数值质量指标的场合。这里需要注 意的是,在根据多种检查项目总起来确定不合格品率的场合,当控制图显示异常后难于找出异常 的原因。因此,使用 P 图时应选择重要的检查项目作为判断不合格品的依据。
6.Pn 控制图。用于控制对象为不合格品数的场合。设 n 为样本大小, P 为不合格品率,则 Pn 为不合格品个数,所以取 Pn 为不合格品数控制图的简记记号。由于计算不合格品率需要进行除 法,比较麻烦。所以在样本大小相同的情况下,用此图比较方便。
7.c 控制图。用于控制一部机器、一个部件、一定的长度、一定的面积或任何一定的单位中 所出现的缺陷数目。例如,铸件上的砂眼数,机器设备的故障数等等。
8.u 控制图。当样品的大小变化时应换算成每单位的缺陷数并用 u 控制图。
范文二:常用统计分析方法
常用统计分析方法
第一章 绪论
目标:
本章的主要内容在于介绍统计学的定义、学科构成及历史沿革。对于掌握一门全新的课程来说,了解学科构成和历史沿革是最基础的工作。
本章重点:
本章的重点在于了解统计学的学科构成,要求学生形成对于统计学科完整框架的认识,在未来的学习中,能够有效地将相关知识置于整个学科框架中进行理解。
讲义内容:
一.统计学的定义
统计是一种具有悠久历史的社会实践活动。可以说,自从有了国家,就有了统计工作。最初的统计活动是为统治者管理国家的需要而进行的搜集资料的工作,涉及到计算国家的人力、物力和财力等活动。今天,统计已经发展成为各行各业开展活动时必不可少的一项基础工作,所有搜集信息和处理信息的活动,都可以归结为统计工作。
古往今来的统计学者对统计学给予了不同的定义。根据美国统计学家David Freedman等著的《统计学》(魏宗舒等译,中国统计出版社,1997年版)中的定义:统计学是对令人困惑的问题作出数字设想的艺术。
把统计学称为艺术显然有些夸张,但这一定义的目的正在于提示统计工作者,应当创造性地提出和解决统计问题,不应囿于某些条条框框去理解统计这门科学。
案例:
在一个水库中养着许多鱼,管理人员希望了解鱼的大致数量,这就是一个实践中的统计学问题。
由于鱼是不听从指挥,会在各处自由游动的,因此,在进行统计时,必须创造性地提出解决方案。
一种解决方法是先从水库的不同位置一共捕上来1000条鱼,在每条鱼的尾部作上一个标记,应当保证标记不会影响鱼的自由游动。然后,将鱼全部放回水库。几天后,从水库中再捕上来2000条鱼,检查其中尾巴上有标记的鱼的数量。假定在第二次捕上来的2000条鱼中,有20条尾巴上做了标记,则可以推断,水库中鱼的总数大致为
1000/(20/2000)=10万条
上述这个案例在实践中是经常见到的,对于一个统计工作者来说,作出一个10万条鱼的估计是不够的,他还应当对这一估计的精度作出判断。但这种搜集统计数据的方法,更多地是一种艺术,是很难从书本上学到的。在实践工作中,统计的应用方面是十分复杂的,只有将统计理解为一种艺术,创造性地提出新的方法去解决新的问题,才是真正地掌握了统计的精髓。
统计学的研究方法从根本上说,是从数据出发去研究自然和社会经济规律,这一点与其他科学存在着显著的区别。例如经济学,是通过对各种经济主体行为的理论分析,探讨经济规律,而统计学在研究经济现象时,是从结果出发,去探寻其中的规律。
统计学从学科分类上看,可以分为理论统计学和应用统计学两大部分。理论统计学(Theoretical Statistics)是指统计学的基本原理,主要研究统计学的一般理论问题,尤其是各种统计方法的数学理论问题。应用统计学(Applied Statictics)是研究如何应用统计方法去解决实际问题的,应用统计学一般都与特定的领域相联系。例如,统计学在教育领域的应用,称为教育统计学;在经济领域的应用,称为经济统计学;等等。
本门课程主要讲授理论统计学的一些基本概念和方法,又称为统计学原理课程。
二.统计学原理的学科构成
统计学原理是一个复杂的体系,不同的学术机构对于这门学科的构成进行了不同的阐述。
美国数学学会出版的《数学评论》中对统计学的分类:
A.基础;B.充分性和信息;C.决策理论;D.抽样理论和抽样调查;E.分布理论;F.参数推断;G.非参数推断;H.多元分析;I.线性推断;J.试验设计;K.序贯分析;L.随机过程推断;M.工程统计学;N.应用;O.统计表
从非统计专业的学生学习的角度来看,统计学原理可以分为四个大的组成部分:
1.调查与实验设计
调查与实验设计涉及到统计中获得原始数据的各种方法。调查是在社会经济统计中获得原始数据的主要手段。随着市场经济的发展,调查在经济活动中所起的作用越来越大,企业的经营,政府的决策,都离不开来自调查的第一手数据。
在科学研究过程中,获得统计数据的手段还包括实验方法。实验是在研究对象进行一定控制的情况下获得数据的方法。
2.描述统计
描述统计包括整理、显示和分析数据的一系列方法。调查或者实验中所获得的有关事物整体的原始资料,往往是零乱和不系统的,需要经过一系列的统计处理,才能转化为人们可以直接阅读和理解的信息。这种针对事物整体数据的统计处理工作,被称为描述统计。
3.推断统计
在有些情况下,人们获得的统计资料并非事物整体的状况,而是来自事物的一个局部。如果利用局部的数据去推断整体的情况,以及这种推断的有效性和可靠性如何,即是推断统计所要研究的内容。
4.多元统计分析
在统计课程设计中,多元统计分析是一个独立的部分,主要涉及到对多变量情况的研究。例如,描述一个人的能力,需要从科研能力、动手能力、组织能力等多个方面进行综合判断,如果对涉及多个变量的统计问题进行研究,即为多元统计的内容。多元统计根据掌握信息的不同,也可分为多元描述统计和多元推断统计,但基本方法大多需要涉及到矩阵等工具,属于统计学原理中要求较高的部分。
三.统计学科简史
最古老的统计可以上溯到远古时代人们对于土地和产量的测量,但这一时期的统计方法往往是粗陋的,没有形成完整的科学体系。
统计学者比较认同的现代统计学的源头大致包括三个方面。
1.1676年英国经济学家威廉·配弟发表的《政治算术》。在这本书中,配弟用大量的数字分析了英、法、荷等三国的经济实力,开创了利用统计数字进行经济学分析的先河。这一统计学分枝后来发展成了国势学派,今天的国民经济核算体系,就是源于这一学派的理论。
2.1662年英国学者约翰·格朗特发表的《关于死亡表的自然观察与政治观察》。在本书中,格朗特分析了英国伦敦的人口死亡情况,成为最早的人口统计学研究。目前,人口统计学是统计学中最有活力的分枝之一。
3.17世纪法国数学家帕斯卡尔和费尔马创立的古典概率论。在这一时期,两位数学家以通信的方式,讨论了赌博中各种具体情况的概率计算问题,发展了概率论理论。
到19世纪末,古典统计学的框架基本形成,其主要的内容主要是今天描述统计学涉及的内容。
进入20世纪以来,随着大工业生产的发展,质量检验的统计理论迅速形成。1908年,英国酒作坊学徒工戈赛特(Gosset)以“Student”的笔名在《生物统计学》杂志上发表了一篇
论文《平均数的概差》,提出了基于小样本的t统计量理论,极大地推动了推断统计理论的发展。
20世纪中叶,英国统计学家Ronald Aylmer Fisher(1890-1962)等人分别对F统计量、极大似然估计、方差分析等理论进行了大量的探讨,从而建立起了推断统计学的庞大的学科体系。
在1920年之前,由样本对总体进行估计的概念,一直是直观和模糊的,1925年,Fisher在其著名论文《研究人员用的统计方法》中,阐明和扩展了估计的概念,提出了最优估计概念,以及估计的效率和充分性等问题。在长期从事实验设计的过程中,Fisher还提出了重要的随机化原则,认为这是保证取得无偏估计的有效措施,也是进行可靠的显著性检验的必要基础。 理论界认为,在1920年之前,统计研究属于“资料整理”时期,即描述统计学时期,从Fisher开始,进行了“分析统计”时期,即推断统计学时期。
四.本门课程的学习要求
学习统计学原理课程,主要应达到三个方面的目的:
1.运用统计思想进行分析的能力。在实践工作中,要善于利用统计的思维方式进行思考,在纷繁复杂的社会实践中,要学会发现数字、分析数字,并使用数字说话。
2.掌握基本的统计方法。要掌握统计工作中涉及到基本统计概念和基本统计计算方法,能够阅读常规的统计报告,了解统计指标的含义。同时,能够自己处理常见的统计问题。
3.锻炼统计计算的能力。在掌握统计方法的基础上,要培养动手计算的能力。其中涉及到运用数学公式和使用计算机进行计算的有关技能。
其中,第一个方面是学习本课程最为重要的目的,为达此目的,在学习过程中,要积极地结合社会实践,分析统计问题。第二个方面是对课程知识的掌握问题,课程中涉及到的统计方法都是最常用的,要牢固掌握。第三个方面则涉及到日常的自我训练,要学会自己运用计算机等工具,处理统计计算问题。
小结:
统计学是对令人困惑的问题作出数字设想的艺术。
对于非专业人员而言,统计学的学科体系分为四个组成部分:
1.调查与实验设计;
2.描述统计;
3.推断统计;
4.多元统计分析。
思考题:
1.如何理解统计学是一种艺术。
2.统计学的学科体系是如何构成的。
排列图
因果图
散布图
直方图
控制图
控制图的重要性
控制图原理
控制图种类及选用
统计质量控制是质量控制的基本方法,执行全面质量管理的基本手段,也是CAQ系统的基础,这里简要介绍制造企业应用最广的统计质量控制方法。
常用统计分析方法与控制图
获得有效的质量数据之后,就可以利用各种统计分析方法和控制图对质量数据进行加工处理,从中提取出有价值的信息成分。
常用统计分析方法
此处介绍的方法是生产现场经常使用,易于掌握的统计方法,包括排列图、因果图、散布图、直方图等。
排列图
排列图是找出影响产品质量主要因素的图表工具.它是由意大利经济学家巴洛特(Pareto)提出的.巴洛特发现人类经济领域中
1.排列图的画法
排列图制作可分为5步:
(1)确定分析的对象
排列图一般用来分析产品或零件的废品件数、吨数、损失金额、消耗工时及不合格项数等.
(2)确定问题分类的项目
可按废品项目、缺陷项目、零件项目、不同操作者等进行分类。
(3)收集与整理数据
列表汇总每个项目发生的数量,即频数fi、项目按发生的数量大小,由大到小排列。最后一项是无法进一步细分或明确划分的项目统一称为“其它”。
(4)计算频数fi、频率Pi和累计频率Fi
首先统计频数fi,然后按(1)、(2)式分别计算频率Pi和累计频率Fi
(1)
式中,f为各项目发生频数之和。
(2)
(5)画排列图
排列图由两个纵坐标,一个横坐标,几个顺序排列的矩形和一条累计频率折线组成。如图1所示为一排列图实例。
2.排列图用途
(1)确定主要因素、有影响因素和次要因素
根据排列图可以确定质量问题的主要因素:累计频率Fi在0-80%左右的若干因素。是影响产品质量的主要因素,如图中焊缝气孔和夹渣。主要因素个数一般为1-2个,最多不超过3个。
根据排列图可以确定质量问题的有影响因素:累计频率Fi在80-95%左右的若干因素。它们对产品质量有一定影响,称为有影响因素。
根据排列图可以确定质量问题的次要因素:累计频率Fi在95-100%左右的若干因素,其对产品质量仅有轻徽影响,称为次要因素。
(2)抓主要因素解决质量问题
将质量影响因素分类之后,重点针对1-2项主要因素进行改进提高,以解决质量问题。实践证明,集中精力将主要因素的影响减少比消灭次要因素更加有效。
(3)检查质量改进措施的效果
采取改进措施后,为了检验其效果,可用排列图来检查。若改进后的排列图中横坐标上因素频数矩形高度有明显降低,则说明确有效果。
因果图
在找出质量问题以后,为分析产生质量问题的原因,以确定因果关系的图表称为因果图。它由质量问题和影响因素两部分组成。图中主干箭头所指的为质量问题,主干上的大枝表示主要原因。中枝、小枝、细枝表示原因的依次展开。
1.因果图的画法
(1)确定待分析的质量问题,将其写在图右侧的方框内,画出主干,箭头指向右端,见图2(a)
(2)确定该问题中影响质量原因的分类方法。一般对于工序质量问题,常按其影响因素:人(Man)、设备(Machine)、原材料(Material)、方法(Method)、环境(Environment)等进行分类,简称为4M1E。对应每一类原因画出大枝、箭头方向从左到右斜指向主干,并在箭头尾端写上原因分类项目,见图2(b)。
(3)将各分类项目分别展开,每个大枝上分出若干中枝表示各项目中造成质量问题的一个原因。中枝平行于主干箭头指向大枝。见图2(c)
(4)将中枝进一步展开成小枝。小枝是造成中枝的原因,依次展开,直至细到能采取措施为止。
(5)找出主要原因,画上方框作为质量改进的重点。
2.因果图的用途
(1)根据质量问题逆向追溯产生原因,由粗到细找出产生质量问题的各个层次、各种各样的原因。以及各原因的传递关系。
(2)因果图可明确原因的影响大小和主次。从而可以作为制定质量改进措施的指导依据。 散布图
在质量问题的原因分析中,常会接触到各个质量因素之间的关系。这些变量之间的关系往往不能进行解析描述,不能由一个(成几个)变量的数值精确地求出另一个变量的值,我们称之为非确定性关系。散布图就是将两个非确定性关系变量的数据对应列出,标记在坐标图上,来观察它们之间的关系的图表。
1.散布图的画法
(1)收集数据
所要研究的两个变量如果一个为原因,另一个为结果时,则一般取原因变量为自变量,取结果变量为因变量。通过抽样检测得到两个变量的一组数据序列。
(2)在坐标上画点
在直角坐标系中,把上述对应的数据组序列以点的形式一一描出。注意,横轴与纵轴的长度单位选取原则是使两个变量的散布范围大致相等,以便分析两变量之间的相关关系。
2.散布图的用途
(1)确定两变量(因素)之间的相关性
两变量之间的散布图大致可分下列六种情形,如图3所示。
1)强正相关。x增大,y也随之线性增大。x与y之间可用直线y=a+bx(b为正数)表示。此时,只要控制住x,y也随之被控制住了,图3(a)就属这种情况。
2)弱正相关。图3(b)所示,点分布在一条直线附近,且x增大,y基本上随之线性增大,此时除了因素x外可能还有其它因素影响y。
3)无关。图3(c)所示,x和y两变量之间没有任何一种明确的趋势关系。说明两因素互不相关。
4)弱负相关。图3(d)所示,x增大,y基本上随之线性减小。此时除x之外,可能还有其它因素影响y。
5)强负相关。图3(e)所示,x与y之间可用直线y=a+bx(b为负数)表示。y随x的增大而减小。此时,可以通过控制x而控制y的变化。
6)非线性相关。图3(f)所示,x、y之间可用曲线方程进行拟合,根据两变量之间的曲线关系,可以利用x的控制调整实现对y的控制。
(2)变量控制。通过分析各变量之间的相互关系。确定出各变量之间的关联性类型及其强弱。当两变量之间的关联性很强时,可以通过对容易控制(操作简单、成本低)的变量的控制达到对难控制(操作复杂、成本高)的变量的间接控制。
(3)可以把质量问题作为因变量,确定各种因素对产品质量的影响程度。当同时分析各种因素对某一质量指标的作用关系时,或某一质量现状的引发因素包含多种因素时,应尽可能将质量数据按照各种可能因素类型进行分层,如:按操作人员分层、按使用设备分层、按工作时间分层、按使用原材料分层、按工艺方法分层或按工作环境分层等等。图4所示为将因素分层之后使原来无关的数据得以进一步细分。从而提示出更准确的内在联系。
直方图
直方图是适用于对大量计量值数据进行整理加工、找出其统计规律。即分析数据分布的形态,以便对其总体分布特征进行推断的方法。主要图形为直角坐标系中若干顺序排列的矩形。各矩形底边相等,为数据区间。矩形的高为数据落入各相应区间的频数。
1.直方图画法
(1)收集数据。数据个数一般在100个左右,至少不少于50个。理论上讲数据越多越好,但因收集数据需要耗费时间和人力、费用,所以收集的数据有限。
(2)找出最大值L,最小值S和极差R。找出全体数据的最大值L和最小值S,计算出极差R=L-S。
(3)确定数据分组数k及组矩h。通常分组数k取4-20。设数据个数为n,可近似取 。通常取等组距,h=R/k。
(4)确定各组上、下界.只需确定第一组下界值即可根据组距h确定出各组的上、下界取值。注意一个原则:应使数据的全体落在第一组的下界值与最后一组(第k组)的上界值所组成的开区间之内。
(5)累计频率画直方图。累计各组中数据频数fi,并以组距为底边,fi为高,画出一系列矩形,得到直方图。见图5所示。
图5 直方图
2.直方图用途
(1)计算均值和标准差S
均值表示样本数据的“质量中心”,可以按下式计算,
(3)
式中,n为数据个数。
样本数据的分散或变异程度可用下列样本标准差进行度量:
(4)
(2)从直方图可以直观地看出产品质量特性的分布形态,便于判断工序是否处于统计控制状态,以决定是否采取相应处理措施。
至此为止,我们介绍了质量控制中常用的统计分析方法。这些方法都是现场中经常用到的,实现方便、简单有效的统计质量控制方法。各种方法可以单独使用,也可以综合使用,
如何结合生产实际情况,选择一种合适的方法,达到预期的控制效果,仍需要广大工程技术人员在实践中不断摸索并总结经验。
控制图
现在将介绍过程控制中常用的控制图方法。包括控制图的重要性,控制图原理,控制图种类及选用。
控制图的重要性
控制图是对生产过程或服务过程质量加以测定、记录从而进行控制管理的一种图形方法。图9-6所示为一控制图图例。图上有中心线CL、上控制界限UCL和下控制界限LCL,并有按时间顺序抽取的样本统计量数值的描点序列。
统计过程控制(SPC)作为统计质量控制(SQC)的核心技术受到普遍的重视。目前,工业发达国家都将统计过程控制列为高技术项目,认为SPC是实现以预测为主的质量控制的有效手段。
控制图所以能获得广泛应用,主要是由于它能起到下列作用:
1.贯彻预防为主的原则。应用控制图有助于保持过程处于控制状态,从而起到保证质量防患于未然的作用。
2.改进生产率。应用控制图可以减少废品和返工,从而提高生产率、降低成本和增加生产能力。
3.防止不必要的过程调整。控制图可用以区分质量的偶然波动与异常波动,从而使操作者减少不必要的过程调整。
4.提供有关工序能力的信息。控制图可以提供重要的过程参数数据以及它们的时间稳定性,这些对于产品设计和过程设计都是十分重要的。
控制图原理
1.统计控制状态
任何一个生产过程,不论它是如何精确设计和精心维护,总存在着一定量的固有的或自然的变化。它是由许多偶然因素形成的偶然波动的累积效果。由于这种波动比较小,所以我们认为这时生产过程处于受控状态或称为稳态。
此外,在生产过程中有时也发生由异常因素造成的异常波动。如:由于设备调整不当、人为差错或原材料的缺陷而导致的质量波动。与偶然波动相比这种异常变化要大得多,而且往往表现一定的趋势和规律,此时,我们认为生产过程处于失控状态。
受控状态是生产过程追求的目标,此时,对产品的质量是有把握的。控制图即是用来监测生产过程状态的一种有效工具。
2.控制图的统计学原理
令W为度量某个质量特性的统计样本。假定W的均值为,而W的标准差为。于是,中心线、上控制限和下控制限分别为
(5)
(6)
(7)
式中,K为中心线与控制界限之间的用标准差为单位所表示的间隔宽度。
图7说明了控制图的控制原理。对于每一个控制点来讲,只要点子是在控制界限之间,我们就认为过程处于控制状态,不需要任何措施;但如果点子落在控制界限之外,就认为过程失控,必须找出异常因素。采取措施加以消除。
正常情况下点子分布是正态的,落在控制界限之内的概率远大于落在控制界限之外的概率。反之,若点子落在控制界限之外,可能是属于正常情况下的小概率事件发生,也可能是过程异常发生,相对来讲,后者发生的概率要大得多。因此,我们宁可以为后者情况发生,
这正是控制图的统计学原理。
点子落在控制界限之内是否一定处于稳态?点子落在控制界线之外是否一定出现异常?这两个问题的因答都是否定的。
更为科学的判断应根据概率统计方法对过程进行定量分析,精确计算出状态的概率值之后再进行过程状态判断。
以K取3为例(上、下界限距中心线距离为3倍的标准差)可计算出各种模式控制图的概率值,如表1所示。
模 式
实 例 情 况
概率水平
有点出界
连续35点中出界点数小于等于1
0.0041
连续100点中出界点数小于等于2
0.0026
集中分层
连续3点中在区间()中的点数大于等于2
0.0053
连续7点中在区间()中的点数大于等于3
0.0024
连续10点中在区间()中的点数大于等于4
0.0006
连续10点集中在区间()中
0.022
连续11点集中在区间()中
0.015
连续12点集中在区间()中
0.0102
链模式
连续出现在中心线一侧的点数大于等于7
0.0153
连续11点中出现在中心线一侧的点数大于等于10
0.0114
连续14点中出现在中心线一侧的点数大于等于12
0.0125
趋势分布
连续上升或下降的点数大于等于7
0.00039
连续上升或下降的点数大于等于5
0.0164
连续上升或下降的点数大于等于4
0.0824
表1各种模式控制图的概率值
可见,根据不同的控制严格性要求应选用概率水平相应的控制图判断模式,如:当控制
严格性要求为1%时,可选用概率水平接近或略低于1%的模式实例作为判断过程异常的准则。各种模式都应选择确定出一个恰当的实例情况作为判稳准则,所谓“恰当的”是指其概率水平在同类模式中最接近控制严格性要求。否则,概率水平过大不能满足质量控制要求;概率水平过小会造成误判次数增多从而降低生产效率、提高生产成本。
控制图种类及选用
控制图根据质量数据的类型可分为:计量值控制图、计件值控制图和计点值控制图。这些控制图各有各的用途,应根据所控制质量指标的情况和数据性质分别加以选择。 数据类型
分布形态
控制图名称
简记
计量值
正态分布
均值-极差控制图
R 控制图
均值-标准差控制图
S 控制图
中位数-极差控制图
-R 控制图
单值-移动极差控制图
RS 控制图
计件值
二项分布
不合格品率控制图
P 控制图
不合格品数控制图
Pn 控制图
计点值
泊松分布
缺陷数控制图
C 控制图
单位缺陷数控制图
u 控制图
表2常用控制图
各控制图用途:
1.-R控制图。是最常用、最基本的控制图,它用于控制对象为长度、重量、强度、纯度、时间和生产量等计量值的场合。
2.-S控制图。此图与-R图相似,只是用标准差图(S图)代替极差图(R图)而已。极差计算简便,故R图得到广泛应用,但当样本大小n>10或12时,应用极差估计总体标准差的效率减低,最好应用S图代替R图。
3.-R控制图.此图与-R图也很相似,只是用中位数图(图)代替均值图(图)。由于中位数的计算比均值简单,所以多用于现场需要把测定数据直接记入控制图进行管理的场合。
4. RS 控制图。多用于下列场合:(1)采用自动化检查和测量对每一个产品都进行检验的场合;(2)取样费时、昂贵的场合;(3)如化工等过程,样品均匀,多抽样也无太大意义的场
合。由于它不像前三种控制图那样能取得较多的信息,所以它判断过程变化的灵敏度也要差一些。
5.P控制图。用于控制对象为不合格品率或合格品率等计数值质量指标的场合。这里需要注意的是,在根据多种检查项目总起来确定不合格品率的场合,当控制图显示异常后难于找出异常的原因。因此,使用P图时应选择重要的检查项目作为判断不合格品的依据。
6.Pn控制图。用于控制对象为不合格品数的场合。设n为样本大小,P为不合格品率,则Pn为不合格品个数,所以取Pn为不合格品数控制图的简记记号。由于计算不合格品率需要进行除法,比较麻烦。所以在样本大小相同的情况下,用此图比较方便。
7.c控制图。用于控制一部机器、一个部件、一定的长度、一定的面积或任何一定的单位中所出现的缺陷数目。例如,铸件上的砂眼数,机器设备的故障数等等。
8.u控制图。当样品的大小变化时应换算成每单位的缺陷数并用u控制图。
范文三:$$常用统计分析方法
常用统计分析方法
排列图 因果图 散布图 直方图 控制图 控制图的重要性 控制图原理 控制图种类及选用
统计质量控制是质量控制的基本方法,执行全面质量管理的基本手段,也是CAQ 系统的基础,这里简要介绍制造企业应用最广的统计质量控制方法。 常用统计分析方法与控制图
获得有效的质量数据之后, 就可以利用各种统计分析方法和控制图对质量数据进行加工处理, 从中提取出有价值的信息成分。 常用统计分析方法
此处介绍的方法是生产现场经常使用, 易于掌握的统计方法, 包括排列图、因果图、散布图、直方图等。 排列图
排列图是找出影响产品质量主要因素的图表工具. 它是由意大利经济学家巴洛特(Pareto) 提出的. 巴洛特发现人类经济领域中" 少数人占有社会上的大部分财富, 而绝大多数人处于贫困状况" 的现象是一种相当普遍的社会现象, 即所谓" 关键的少数与次要的多数" 原理. 朱兰(美国质量管理学家) 把这个原理应用到质量管理中来, 成为在质量管理中发现主要质量问题和确定质量改进方向的有力工具. 1. 排列图的画法
排列图制作可分为5步: (1)确定分析的对象
排列图一般用来分析产品或零件的废品件数、吨数、损失金额、消耗工时及不合格项数等. (2)确定问题分类的项目
可按废品项目、缺陷项目、零件项目、不同操作者等进行分类。 (3)收集与整理数据
列表汇总每个项目发生的数量,即频数fi 、项目按发生的数量大小,由大到小排列。最后一项是无法进一步细分或明确划分的项目统一称为“其它”。 (4)计算频数fi 、频率Pi 和累计频率Fi
首先统计频数fi ,然后按(1)、(2)式分别计算频率Pi 和累计频率
Fi
(1)
式中,f 为各项目发生频数之和。
(2) (5)画排列图
排列图由两个纵坐标,一个横坐标,几个顺序排列的矩形和一条累计频率折线组成。如图1所示为一排列图实例。 2. 排列图用途
(1)确定主要因素、有影响因素和次要因素
根据排列图可以确定质量问题的主要因素:累计频率Fi 在0-80%左右的若干因素。是影响产品质量的主要因素,如图中焊缝气孔和夹渣。主要因素个数一般为1-2个,最多不超过3个。 根据排列图可以确定质量问题的有影响因素:累计频率Fi 在80-95%左右的若干因素。它们对产品质量有一定影响,称为有影响因素。
根据排列图可以确定质量问题的次要因素:累计频率Fi 在95-100%左右的若干因素,其对产品质量仅有轻徽影响,称为次要因素。 (2)抓主要因素解决质量问题
将质量影响因素分类之后,重点针对1-2项主要因素进行改进提高,以解决质量问题。实践证明,集中精力将主要因素的影响减少比消灭次要因素更加有效。 (3)检查质量改进措施的效果
采取改进措施后,为了检验其效果,可用排列图来检查。若改进后的排列图中横坐标上因素频数矩形高度有明显降低,则说明确有效果。 因果图
在找出质量问题以后,为分析产生质量问题的原因,以确定因果关系的图表称为因果图。它由质量问题和影响因素两部分组成。图中主干箭头所指的为质量问题,主干上的大枝表示主要原因。中枝、小枝、细枝表示原因的依次展开。 1. 因果图的画法
(1)确定待分析的质量问题,将其写在图右侧的方框内,画出主干,箭头指向右端,见图2(a) (2)确定该问题中影响质量原因的分类方法。一般对于工序质量问题,常按其影响因素:人(Man)、设备(Machine)、原材料(Material)、方法(Method)、环境(Environment)等进行分类,简称为4M1E 。对应每一类原因画出大枝、箭头方向从左到右斜指向主干,并在箭头尾端写上原因分类项目,见图2(b)。
(3)将各分类项
目分别展开,每个大枝上分出若干中枝表示各项目中造成质量问题的一个原因。中枝平行于主干箭头指向大枝。见图2(c)
(4)将中枝进一步展开成小枝。小枝是造成中枝的原因,依次展开,直至细到能采取措施为止。
(5)找出主要原因,画上方框作为质量改进的重点。 2. 因果图的用途
(1)根据质量问题逆向追溯产生原因,由粗到细找出产生质量问题的各个层次、各种各样的原因。以及各原因的传递关系。
(2)因果图可明确原因的影响大小和主次。从而可以作为制定质量改进措施的指导依据。 散布图
在质量问题的原因分析中,常会接触到各个质量因素之间的关系。这些变量之间的关系往往不能进行解析描述,不能由一个(成几个)变量的数值精确地求出另一个变量的值,我们称之为非确定性关系。散布图就是将两个非确定性关系变量的数据对应列出,标记在坐标图上,来观察它们之间的关系的图表。 1. 散布图的画法 (1)收集数据
所要研究的两个变量如果一个为原因,另一个为结果时,则一般取原因变量为自变量,取结果变量为因变量。通过抽样检测得到两个变量的一组数据序列。 (2)在坐标上画点
在直角坐标系中,把上述对应的数据组序列以点的形式一一描出。注意,横轴与纵轴的长度单位选取原则是使两个变量的散布范围大致相等,以便分析两变量之间的相关关系。
2. 散布图的用途
(1)确定两变量(因素)之间的相关性
两变量之间的散布图大致可分下列六种情形,如图3所示。
1) 强正相关。x 增大,y 也随之线性增大。x 与y 之间可用直线y=a+bx(b为正数) 表示。此时,只要控制住x ,y 也随之被控制住了,图3(a)就属这种情况。
2) 弱正相关。图3(b)所示,点分布在一条直线附近,且x 增大,y 基本上随之线性增大,此时除了因素x 外可能还有其它因素影响y 。
3) 无关。图3(c)所示,x 和y 两变量之间没有任何一种明确的趋势关系。说明两因素互不相关。
4) 弱负相关。图3(d)所示,x 增大,y 基本上随之线性减小。此时除x 之外,可能还有其它因素影响y 。
5) 强负相关。图3(e)所示,x 与y 之间可用直线y=a+bx(b为负数) 表示。y 随x 的增大而减小。此时,可以通过控制x 而控制y 的变化。
6) 非线性相关。图3(f)所示,x 、y 之间可用曲线方程进行拟合,根据两变量之间的曲线关系,可以利用x 的控制调整实现对y 的控制。
(2)变量控制。通过分析各变量之间的相互关系。确定出各变量之间的关联性类型及其强弱。当两变量之间的关联性很强时,可以通过对容易控制(操作简单、成本低)的变量的控制达到对难控制(操作复杂、成本高)的变量的间接控制。
(3)可以把质量问题作为因变量,确定各种因素对产品质量的影响程度。当同时分析各种因素对某一质量指标的作用关系时,或某一质量现状的引发因素包含多种因素时,应尽可能将质量数据按照各种可能因素类型进行分层,如:按操作人员分层、按使用设备分层、按工作时间分层、
按使用原材料分层、按工艺方法分层或按工作环境分层等等。图4所示为将因素分层之后使原来无关的数据得以进一步细分。从而提示出更准确的内在联系。 直方图
直方图是适用于对大量计量值数据进行整理加工、找出其统计规律。即分析数据分布的形态,以便对其总体分布特征进行推断的方法。主要图形为直角坐标系中若干顺序排列的矩形。各矩形底边相等,为数据区间。矩形的高为数据落入各相应区间的频数。 1. 直方图画法
(1)收集数据。数据个数一般在100个左右,至少不少于50个。理论上讲数据越多越好,但因收集数据需要耗费时间和人力、费用,所以收集的数据有限。
(2)找出最大值L ,最小值S 和极差R 。找出全体数据的最大值L 和最小值S ,计算出极差R=L-S。 (3)确定数据分组数k 及组矩h 。通常分组数k 取4-20。设数据个数为n ,可近似取 。通常取等组距,h=R/k。
(4)确定各组上、下界. 只需确定第一组下界值即可根据组距h 确定出各组的上、下界取值。注意一个原则:应使数据的全体落在第一组的下界值与最后一组(第k 组)的上界值所组成的开区间之内。
(5)累计频率画直方图。累计各组中数据频数fi ,并以组距为底边,fi 为高,画出一系列矩形,得到直方图。见图5所示。
图5 直方图 2. 直方图用途
(1)计算均值和标准差S
均值表示样本数据的“质量中心”,可以按下式计算,
(3)
式中,n 为数据个数。
样本数据的分散或变异程度可用下列样本标准差进行度量:
(4)
(2)从直方图可以直观地看出产品质量特性的分布形态,便于判断工序是否处于统计控制状态,以决定是否采取相应处理措施。
至此为止,我们介绍了质量控制中常用的统计分析方法。这些方法都是现场中经常用到的,实现方便、简单有效的统计质量控制方法。各种方法可以单独使用,也可以综合使用,如何结合生产实际情况,选择一种合适的方法,达到预期的控制效果,仍需要广大工程技术人员在实践中不断摸索并总结经验。
控制图
现在将介绍过程控制中常用的控制图方法。包括控制图的重要性,控制图原理,控制图种类及选用。 控制图的重要性
控制图是对生产过程或服务过程质量加以测定、记录从而进行控制管理的一种图形方法。图9-6所示为一控制图图例。图上有中心线CL 、上控制界限UCL 和下控制界限LCL ,并有按时间顺序抽取的样本统计量数值的描点序列。
统计过程控制(SPC)作为统计质量控制(SQC)的核心技术受到普遍的重视。目前,工业发达国家都将统计过程控制列为高技术项目,认为SPC 是实现以预测为主的质量控制的有效手段。 控制图所以能获得广泛应用,主要是由于它能起到下列作用:
1. 贯彻预防为主的原则。应用控制图有助于保持过程处于控制状态,从而起到保证质量防患于未然的作用。
2. 改进生产率。应用控制图可以减少废品和返工,从而提高生产率、降低成本和增加生产能力。
3. 防止不必要的过程调整。控制图可用以区分质量的偶然波动与异常波动,从而使操作者减少不必要的过程调整。
4. 提供有关工序能力的信息。控制图可以提供重要的过程参数数据以及它们的时间稳定性,这些对于产品设计和过程设计都是十分重要的。 控制图原理
1. 统计控制状态
任何一个生产过程,不论它是如何精确设计和精心维护,总存在着一定量的固有的或自然的变化。它是由许多偶然因素形成的偶然波动的累积效果。由于这种波动比较小,所以我们认为这时生产过程处于受控状态或称为稳态。
此外,在生产过程中有时也发生由异常因素造成的异常波动。如:由于设备调整不当、人为差错或原材料的缺陷而导致的质量波动。与偶然波动相比这种异常变化要大得多,而且往往表现一定的趋势和规律,此时,我们认为生产过程处于失控状态。
受控状态是生产过程追求的目标,此时,对产品的质量是有把握的。控制图即是用来监测生产过程状态的一种有效工具。 2. 控制图的统计学原理
令W为度量某个质量特性的统计样本。假定W的均值为, 而W的标准差为。于是,中心线、上控制限和下控制限分别为
(5)
(6)
(7)
式中,K为中心线与控制界限之间的用标准差为单位所表示的间隔宽度。
图7说明了控制图的控制原理。对于每一个控制点来讲,只要点子是在控制界限之间,我们就认为过程处于控制状态,不需要任何措施;但如果点子落在控制界限之外,就认为过程失控,必须找出异常因素。采取措施加以消除。
正常情况下点子分布是正态的,落在控制界限之内的概率远大于落在控制界限之外的概率。反之,若点子落在控制界限之外,可能是属于正常情况下的小概率事件发生,也可能是过程异常发生,相对来讲,后者发生的概率要大得多。因此,我们宁可以为后者情况发生,这正是控制图的统计学原理。
点子落在控制界限之内是否一定处于稳态?点子落在控制界线之外是否一定出现异常?这两个问题的因答都是否定的。
更为科学的判断应根据概率统计方法对过程进行定量分析,精确计算出状态的概率值之后再进行过程状态判断。
以K 取3为例(上、下界限距中心线距离为3倍的标准差) 可计算出各种模式控制图的概率值,如表1所示。
模 式 实 例 情 况 概率水平 有点出界
连续35点中出界点数小于等于1 0.0041
连续100点中出界点数小于等于2 0.0026 集中分层
连续3点中在区间()中的点数大于等于2 0.0053
连续7点中在区间()中的点数大于等于3 0.0024
连续10点中在区间()中的点数大于等于4 0.0006
连续10点集中在区间()中 0.022
连续11点集中在区间()中
0.015
连续12点集中在区间()中
0.0102
链模式
连续出现在中心线一侧的点数大于等于7
0.0153
连续11点中出现在中心线一侧的点数大于等于10
0.0114
连续14点中出现在中心线一侧的点数大于等于12
0.0125
趋势分布
连续上升或下降的点数大于等于7
0.00039
连续上升或下降的点数大于等于5
0.0164
连续上升或下降的点数大于等于4
0.0824
表1各种模式控制图的概率值
可见,根据不同的控制严格性要求应选用概率水平相应的控制图判断模式,如:当控制严格性要求为1%时,可选用概率水平接近或略低于1%的模式实例作为判断过程异常的准则。各种模式都应选择确定出一个恰当的实例情况作为判稳准则,所谓“恰当的”是指其概率水平在同类模式中最接近控制严格性要求。否则,概率水平过大不能满足质量控制要求;概率水平过小会造成误判次数增多从而降低生产效率、提高生产成本。
控制图种类及选用
控制图根据质量数据的类型可分为:计量值控制图、计件值控制图和计点值控制图。这些控制图各有各的用途,应根据所控制质量指标的情况和数据性质分别加以选择。
数据类型
分布形态
控制图名称
简记
计量值
正态分布
均值-极差控制图
R 控制图
均值-标准差控制图
S 控制图
中位数-极差控制图
-R 控制图
单值-移动极差控制图
RS 控制图
计件值
二项分布
不合格品率控制图
P 控制图
不合格品数控制图
Pn 控制图
计点值
泊松分布
缺陷数控制图
C 控制图
单位缺陷数控制图
u 控制图
表2常用控制图
各控制图用途:
1.-R 控制图。是最常用、最基本的控制图,它用于控制对象为长度、重量、强度、纯度、时间和生产量等计量值的场合。
2.-S 控制图。此图与-R 图相似,只是用标准差图(S图) 代替极差图(R图) 而已。极差计算简便,故R 图得到广泛应用,但当样本大小n>10或12时,应用极差估计总体标准差的效率减低,最好应用S 图代替R 图。
3.-R 控制图. 此图与-R 图也很相似, 只是用中位数图(图)代替均值图(图)。由于中位数的计算比均值简单,所以多用于现场需要把测定数据直接记入控制图进行管理的场合。
4. RS 控制图。多用于下列场合:(1)采用自动化检查和测量对每一个产品都进行检验的场合;(2)取样费时、昂贵的场合;(3)如化工等过程,样品均匀,多抽样也无太大意义的场合。由于它不像前三种控制图那样能取得较多的信息,所以它判断过程变化的灵敏度也要差一些。
5.P 控制图。用于控制对象为不合格品率或合格品率等计数值质量指标的场合。这里需要注意的是,在根据多种检查项目总起来确定不合格品率的场合,当控制图显示异常后难于找出异常的原因。因此,使用P 图时应选择重要的检查项目作为判断不合格品的依据。
6.Pn 控制图。用于控制对象为不合格品数的场合。设n 为样本大小,P 为不合格品率,则Pn 为不合格品个数,所以取Pn 为不合格品数控制图的简记记号。由于计算不合格品率需要进行除法,比较麻烦。所以在样本大小相同的情况下,用此图比较方便。
7.c 控制图。用于控制一部机器、一个部件、一定的长度、一定的面积或任何一定的单位中所出现的缺陷数目。例如,铸件上的砂眼数,机器设备的故障数等等。
8.u 控制图。当样品的大小变化时应换算成每单位的缺陷数并用u 控制图。
范文四:常用统计分析方法小结
常用统计分析方法小结
1. 连续性资料
1.1 两组独立样本比较
1.1.1 资料符合正态分布 , 且两组方差齐性 , 直接采用 t 检验。
1.1.2 资料不符合正态分布,( 1 )可进行数据转换 , 如对数转换等 , 使之服从
正态分布 , 然后对转换后的数据采用 t 检验;( 2 )采用非参数检验 , 如 Wilcoxon 检验。
1.1.3 资料方差不齐,( 1 )采用 Satterthwate 的 t’ 检验;( 2 )采用非参数检
验 , 如 Wilcoxon 检验。
1.2 两组配对样本的比较
1.2.1 两组差值服从正态分布,采用配对 t 检验。
1.2.2 两组差值不服从正态分布,采用 wilcoxon 的符号配对秩和检验。
1.3 多组完全随机样本比较
1.3.1 资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如
果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有 LSD 检验, Bonferroni 法, tukey 法, Scheffe 法, SNK 法等。
1.3.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的 Kruscal -
Wallis 法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用 Bonferroni 法校正 P 值,然后用成组的 Wilcoxon 检验。
1.4 多组随机区组样本比较
1.4.1 资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如
果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有 LSD 检验, Bonferroni 法, tukey 法, Scheffe 法, SNK 法等。
1.4.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的 Fridman 检
验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用 Bonferroni 法校正 P 值,然后用符号配对的 Wilcoxon 检验。
**** 需要注意的问题:
(1) 一般来说,如果是大样本,比如各组例数大于 50 ,可以不作正态性
检验,直接采用 t 检验或方差分析。因为统计学上有中心极限定理,假
定大样本是服从正态分布的。
(2) 当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其
他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的 LSD 检验, Bonferroni 法, tukey 法, Scheffe 法, SNK 法等。 ** 绝不能对其中的两组直接采用 t 检验,这样即使得出结果也未必正确 **
(3) 关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但
不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。
2 .分类资料
2.1 四格表资料
2.1.1 例数大于 40 ,且所有理论数大于 5 ,则用普通的 Pearson 检验。
2.1.2 例数大于 40 ,所有理论数大于 1 ,且至少一个理论数小于 5 ,则用校
正的 检验或 Fisher’s 确切概率法检验。
2.1.3 例数小于 40 ,或有理论数小于 2 ,则用 Fisher’s 确切概率法检验。
2.2 2 × C 表或 R × 2 表资料的统计分析
2.2.1 列变量&行变量均为无序分类变量,则( 1 )例数大于 40 ,且理论数小
于 5 的格子数目 总格子数目的 25 %,则用 Fisher’s 确切概率法检验。
2.2.2 列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的
Pearson 检验只说明组间构成比不同,如要说明疗效,则可用行平均分差检验或成组的 Wilcoxon 秩和检验。
2.2.3 列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采
用普通的 Pearson 检验比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
2.3 R × C 表资料的统计分析
2.2.1 列变量&行变量均为无序分类变量,则( 1 )例数大于 40 ,且理论数小
于 5 的格子数目 总格子数目的 25 %,则用 Fisher’s 确切概率法检验。( 3 )如果要作相关性分析,可采用 Pearson 相关系数。
2.2.2 列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的
Pearson 检验只说明组间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组的 Wilcoxon 秩和检验或 Ridit 分析。
2.2.3 列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则
可采用普通的 Pearson 检验比较各组之间有无差别,如果有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
2.2.4 列变量&行变量均为有序多分类变量,( 1 )如要做组间差别分析,则可
用行平均分差检验或成组的 Wilcoxon 秩和检验或 Ridit 分析。如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。( 2 )如果要做两变量之间的相关性,可采用 Spearson 相关分析。
2.4 配对分类资料的统计分析
2.4.1 四格表配对资料,( 1 ) b + c>40 ,则用 McNemar 配对
b + c
检验。( 2 )一致检验。( 2 ) 2.4.1 C × C 资料,( 1 )配对比较:用 McNemar 配对
性检验,用 Kappa 检验。
范文五:医学论文中常用统计分析方法的合理选择
医学论文中常用统计分析方法的合理选择
检验医学与临床2011年6月第8卷第11期IabMedClin,June20】1,Vo1.8,No.1l
医学论文中常用统计分析方法的合理选择
张知洪,莫建坤,雷达,李丽华(广东省第二人民医院检验科,广州510317)
?
1387?
?
教学与管理?
【关键词】医学论文;统计分析方法;合理选择
DOI:10.3969/j.issn.1672—9455.2011.11.070文献标志码:C文章编号:1672—
9455(2011)11-138702
医学统计是进行医学研究的重要工具,被广泛地应用于实 验设计,资料收集及数据分析等方面,正确应用统计学方法对 有效开展科学研究和提高医学科技论文学术质量有着极其重 要的意义和作用.统计学的基本方法一般不难掌握,但是能 否正确运用仍是较普遍的问题.为帮助广大医务工作者提高 统计分析水平,本文将介绍医学论文中常用统计分析方法的选 择原则及应用过程中的注意事项.
1t检验
t检验是英国统计学家w.S.Gosset1908年根据t分布原 理建立起来的一种假设检验方法,常用于计量资料中2个小标 本均数的比较.理论上,t检验的应用条件是要求标本来自正 态分布的总体,两标本均数比较时,还要求两总体方差相等. 但在实际工作中,与上述条件略有偏离,只要其分布为单峰且 近似正态分布,也可应用l2].
常用的t检验有如下3类:(1)单个标本t检验:用于推断 标本均数代表的总体均数和已知总体均数有无统计学意义.
当标本例数较少(n<C60)且总体标准差未知时,选用t检验;反 之当标本例数较多或标本例数较少,总体标准差已知时,则可 选用检验].(2)配对标本t检验:适用于配对设计的两标 本均数的比较,在选用时应注意两标本是否为配对设计资料. 常用的配对设计资料主要有如下3种情况:两种同质受试对象 分别接受两种不同的处理;同一受试对象或同一标本的2个部 分,分别接受不同的处理;同一受试对象处理前后的结果比较. (3)两独立标本t检验:又称成组t检验,适用于完全随机设计 的两标本均数的比较.与配对t检验不同的是,在进行两独立 标本t检验之前,还必须对两组资料进行方差齐性检验.若为 小标本且方差齐,则选用t检验;反之若方差不齐,则选用校正 t检验(,检验),或采用数据变换的方法(如取对数,开方,倒数 等)使两组资料具有方差齐性后再进行t检验,或采用非参数 检验[4].此外,当两组标本例数较多(nl,n2~>50)时,这时应用 t检验的计算比较繁琐,可选用U检验].
2方差分析
方差分析适用于两组以上计量资料均数的比较,其应用条 件是各组资料取自正态分布的总体且各组资料具有方差齐性. 因此,在应用方差分析之前,同样和成组t检验一样需要对各 组资料进行正态性检验,方差齐性检验.
常用的方差分析有如下几类:(1)完全随机设计的方差分 析:主要用于推断完全随机设计的多个标本均数所代表的总体 均数之间有无显着性差别.完全随机设计是将观察对象随机 分为两组或多组,每组接受一种处理,形成2个或多个标本. (2)随机区组设计的方差分析:随机区组设计首先是将全部受 试对象按某种或某些特性分为若干区组,然后区组内的每个研 究对象接受不同的处理,通过这种设计,既可以推断处理因素 又可以推断区组因素是否对试验效应产生作用.此外,由于这 种没计还使每个区组内研究对象的水平尽可能地相近,减少了
个体间差异对研究结果的影响,比成组设计更容易检验出处理 因素间的差别.(3)析因设计的方差分析:将2个或2个以上 处理因素的各种浓度水平进行排列组合,交叉分组的试验设 计.它不仅可以检验每个因素各水平之间是否有差异,还可以 检验各因素之间是否有交互作用,同时还可以找到处理因素的 各种浓度水平之间的最佳组合.此外,还有正交设计,拉丁方 设计等多种方差分析法.实验者在应用时可以参考相关的统计 学着作.
目前,某些医学论文中有这样的情况,就是用t检验代替 方差分析对实验数据进行统计学处理,这是不可取的.t检验 只适用于推断2个小标本均数之间有无显着性差别,而采用t 检验对多组均数进行两两比较,会增加犯I型错误的概率,即 可能把本来无差别的2个总体均数判为有差别,使结论的可信 度降低[=6].对多个标本均数进行比较时,正确的方法是先进行 方差分析,若检验统计量有显着性意义时,再进行多个标本均 数的两两(多重)比较.
3X检验
检验是一种用途比较广泛的假设检验方法,但是在医 学论文中常用于分类计数资料的假设检验,即用于2个标本 率,多个标本率,标本内部构成情况的比较,标本率与总体率的 比较,某现象的实际分布与其理论分布的比较.但是当标本满 足正态近似条件时,如标本例数与标本率P满足条件与 7"/(1一p)均大于5,则可以计算假设检验统计量"值来进行 判断嘲.
常用的检验分为如下几类:(1)2×2表x检验.适用 于2个标本率或构成比的比较,在应用时,当整个试验的标本 例数?40且某个理论频数1?T<5时,需对值进行连续 性校正.因为T值太小,会导致Y值增大,易出现假阳性结 论.此外,若标本例数<4O,或有某个T值小于l,此时即使
采用校正公式计算的值也有偏差,需要用2×2表检验 的确切概率检验法(Fisher确切检验法).(2)配对资料Y检 验.适用于配对设计的2个标本率或构成比的比较,即通过单 一
标本的数据推断两种处理结果有无显着性差别.在应用时, 如果甲处理结果为阳性而乙处理结果为阴性的标本例数1与 甲处理结果为阴性而乙处理结果为阳性的标本例数n2之和< 4O,需要对计算的.值进行校正.(3)RxC表.检验.适用 于多个标本率或构成比的比较.在R×C表Y检验中,若检 验统计量有显着性意义时,还需要对多个标本率或构成比进行 两两比较,即分割R×C表,使之成为非独立的四格表,并对每 两个率之问有无显着性差别作出结论.
2×2表资料在应用时可分为如下几种类型:横断面研究 设计的2×2表资料,队列研究设计的2×2表资料,病例一对照 研究设计的2×2表资料,配对研究设计的2x2表资料.研究 检验医学与临床2011年6月第8卷第1l期LabMedClin,June2011,Vo1.8,No.11
者应注意不同类型的2×2表资料的统计分析方法略有差别, 比如在分析队列研究设计的2×2表资料时,如果用Y公式计 算得到P<O.05,研究者则应再计算相对危险度(RR)并检验 总体RR与1之间的差异是否具有统计学意义.
此外,在进行R×C表Y检验时,还有如下2个主要的注 意事项:首先,T值最好不要小于5,若有1/5的T值小于5,Y 检验结论是不可靠的,解决的办法有3种:增大标本量;删去T 值太小的行和列;将T值太小的行或列与性质相近的邻行或 邻列的实际频数合并].其次,不同类型的R×C表资料选 择的统计分析方法是不一样的.(1)双向无序的R×C表资 料:可以选用一般的Y公式计算.(2)单向有序的R×C表资 料:如果是原因变量为有序变量的单向有序R×c表资料,可 以将其视为双向无序的RxC表资料而选用一般的Y.检验公
式计算,但如果是结果变量为有序变量的单向有序R×C表资 料,选用的统计分析方法有秩和检验,Radit分析和有序变量的 logistic回归分析等.(3)双向有序且属性不同的R×C表资 料:对于这类资料采用的统计分析方法不能一概而论,应根据 研究者的分析目而合理选择.如果研究者只关心原因变量与 结果变量之问的差异是否具有统计学意义时,此时,原因变量 的有序性就显得无关紧要了,可将其视为结果变量为有序变量 的单向有序R×c表资料进行分析.如果研究者希望考察原 因变量与结果变量之间是否存在线性相关关系,此时需要选用 处理定性资料的相关分析方法如Spearman秩相关分析方法 等.如果两个有序变量之间的相关关系具有统计学意义,研究 者希望进一步了解这两个有序变量之间的线性关系,此时宜选 用线性趋势检验.如果研究者希望考察列联表中各行上的频 数分布是否相同,此时宜选用一般的Y.公式计算.(4)双向有 序且属性相同的R×c表资料:这类资料实际上就是配对设计 2×2表资料的延伸,在分析这类资料时,实验者的目的主要是 研究两种处理方法检测结果之间是否具有一致性,因此常用的 统计分析方法为一致性检验或Kappa检验.
4非参数检验
非参数检验可不考虑总体的参数,分布而对总体的分布或 分布位置进行检验.它通常适用于下述资料]:(1)总体分布 为偏态或分布形式未知的计量资料(尤其标本例数<3O时); (2)等级资料;(3)个别数据偏大或数据的某一端无确定的数 值;(4)各组离散程度相差悬殊,即各总体方差不齐.该方法具 有适应性强等优点,但同时也损失了部分信息,使得检验效率 降低.即当资料服从正态分布时,选用非参数检验法代替参数 检验法会增大犯?类错误的概率.因此,对于适用参数检验的 资料,最好还是用参数检验.
秩和检验是最常用的非参数检验,它包括以下几类【:
(1)配对资料的符号秩和检验(Wilcoxon配对法):是配对设计 的非参数检验.当?25时,可通过秩和检验对实验资料进行 分析;当n~>25时,标本例数超出T界值表的范围,可按近似 正态分布用"检验对实验资料进行分析.(2)两标本比较的秩 和检验(WilcoxonMann-Whitney检验):适用于比较两标本分 别代表的总体分布位置有无差异.如果标本甲的例数为,z1, 标本乙的例数为2,且n1<n2;当1?1O,n2一"1?1O时,可通 过两标本比较的秩和检验对实验资料进行分析;当"l,2超出 T界值表的范围时,同样可按近似正态分布用"检验对实验资 料进行分析.(3)多个标本比较的秩和检验(Wilcoxon KruskalWallis检验):适用于比较各标本分别代表的总体的位 置有无差别,它相当于单因素方差分析的非参数检验,计算方 法主要有直接法和频数表法等.此外,在进行上述3类秩和检 验(前两类秩和检验实际上已经被"检验替代)时,如果相同秩 次较多,则需要对计算的检验统计量进行校正.
参考文献
Eli杨树勤.卫生统计学[M].3版.北京:人民卫生出版社, 1992:138.
[2]马斌荣.医学统计学[M].3版.北京:人民卫生出版社, 2003:30.
[3]胡良平,高辉.如何正确运用t检验[J].中西医结合, 2008,6(2):2092l2.
[4]曹明芹,薛茜等.正态分布两样本均数比较方法的评价 [J].新疆医科大学,2004,27(4):357,360.
[5]唐军.医学统计学[M].2版.北京:人民军医出版礼, 2007:48.
[6]孙维权.浅议医学研究中t检验与方差分析的正确应用 [J].湖北预防医学杂志,2002,13(3):12—13.
[7]胡良平.如何合理选择统计分析方法处理实验资料(IV)
rJ].中国医药生物技术,2007,2(54):317—319.
[8]王金桃,周利锋.卡方检验[J].上海实验动物科学,2000, 20(4):251—254.
(收稿日期:2010-1214)
临床生物化学自主设计性实验教学方法的实践与探索 王良宏,黄海,蒋红梅,张小蕾,黄健(贵州省贵阳医学院医学检验系550004) 【关键词】医学检验;临床生物化学;自主设计;实验教学方法 DOI:10.3969/i.issn.1672—9455.2011.11.071文献标志码:C文章编
号:16729455(2011)111388—02
临床生物化学和生物化学检验是医学检验专业的核心课 程,又是一门以临床病理诊断为主要目标的实践性强,应用性 强的专业课程.临床生化和生化检验的实验教学在整个过程 中占有十分重要的地位,对教学质量有至关重要的影响,因为 *基金项目:贵州省贵阳医学院教学改革课题(贵医教改2008—32). 实验操作技能将是医学检验毕业生立足社会的基本能力.因 此,加强实践性环节的教学和学生实验操作技能的培训已成为 医学检验专业教学的重点m.传统的临床生化实验教学以验 证性和演示性实验为主,在课前由教师布置实验内容,技术室