范文一:什么是正态分布?
题目,什么是正态分布,
了解正态分布很重要,这将是所有我们做均值估计的基础。 百度经验:jingyan.baidu.com
方法/步骤
对于正态分布,我们只需要知道三件事,1,它长什么样的就是下图,2,他的两个参数,平均数和标准差,3,对于这个图的解释是什么,也就是平均数周围的得分在总体上占到大多数,平均数上下1.96个标准差的得分占到95%的总体,
首先,假如我们拿一个省的人口进行身高测量,那么我们可以将所有人的平均数和标准差求出,假如平均数为1.70,标准差为0.05。我们发现在平均数附近的人特别多,比如说在1.70-1.96*0.05到1.70+1.96*0.05的人占到了总人数的95%,这个时候我们大概能够判断出这个省的身高服从正态分布。 当然这只是举例方便大家好理解,那要得出身高为正态分布的这个结论,必须将数据与正态分布的概率密度函数进行拟合。这里对于一般采用spss进行数据分析的人来说,大可不必去纠缠于这
些算法。我们只需要知道正态分布有什么特点,如何利用正态分布的特点进行参数的估计。
实际上大多数的牵涉到很大样本的数据都被证明是正态分布的,比如体重,学习成绩等。拿学习成绩来说,中等得分的学生占大多数,非常拔尖的以及非常差的占很少的一部分,这就是正态分布的特点。
范文二:什么是正态分布
1、什么是正态分布,正态分布有哪些性质,
22、正态分布(,)中的两个参数 和 ,的统计意义是,,,N
2什么,分别称为什么参数,记号,(,),,(0,1),X,NUN各表示什么意思,
3、设,(0,1)求: UN
(1)P(u?-1.96);
(2)P(u,-0.58);
(3)P(0.54,u,2.12)。
2x4、设,(6.3,),求P(4.9??7.5)。 1.7XN
5、、在某县初一男生中随机抽测立位体前屈的cm,x,6.16
cm。若该县初一男生共有5000人,试估计立位体前屈超过6 cmS,4.18
的人数。
6、现有10000名成年男子,假定身高服从正态分布,其均数,,175cm,标准差cm. ,,15
(1)试估计其中有多少人身高在177厘米以下;
(2)试估计其中有多少人身高至少是183厘米;
(3)估计这些人中,以均数为中心,概率为75,的身高区间是多少,
s7、测得某校初三女生的800m跑成绩的=236.36(即x
s3min56.36),,规定优秀、良好、及格人数的百分比分别是S,20.08s
15%,30%(不含优),45%(不含优、良),问标准各为多少,
8、已知某地区女生台阶试验结果服从正态分布,其中台阶指数
,。若规定10,的学生达到优秀标准,30,的学生达到x,54S,3.67
良好标准,55,的学生达到及格标准,另有5,的学生不及格,试问各等级的评分标准是多少,
9、某年级男生跳高成绩的m,m。若要求15% 的x,1.40S,0.1
人达到优秀,25% 的人达良好(不含优),7% 的人不及格,问优秀、良好、及格的标准各是什么,
10、已知铅球成绩m,m,试估计成绩在7.5m_8m之x,7.4S,0.92
间的百分比。
11、在某市区初三女生中随机抽测立定跳远的成绩得 x,158.6cm,cm。若该区初三女生共有850人,试估计立定跳远成绩分S,18.3
别超过150cm,185cm,200cm的人数百分比及人数。
12、某年龄组180人100m跑 ,,若优秀定为x,15.24sS,0.53s
sss14,良好定为14.68,及格定为16,试分别求成绩到达优秀、良好、及格和不及格的人数及百分比。
13、某校初中男生立定跳远成绩服从正态分布,其cm,x,221
cm。现该校初中男生中有立定跳远成绩为250cm,270cm,问这S,14
两个数据是不是可疑数据(用法判断),。 x,3S
范文三:正态分布为什么常见
正态分布为什么常见?
统计学里面,正态分布,normal distribution,最常见。男女身高、寿命、血压、
考试成绩、测量误差等等,都属于正态分布。
>>>>
作者: 阮一峰
以前,我认为中间状态是事物的常态,过高和过低都属于少数,这导致了正态分布的普遍性。最近,读到了 John D. Cook 的文章,才知道我的这种想法是错的。 正态分布为什么常见?真正原因是中心极限定理,central limit theorem,。
"多个独立统计量的和的平均值,符合正态分布。"
上图中,随着统计量个数的增加,它们和的平均值越来越符合正态分布。
根据中心极限定理,如果一个事物受到多种因素的影响,不管每个因素本身是什么分布,它们加总后,结果的平均值就是正态分布。
举例来说,人的身高既有先天因素,基因,,也有后天因素,营养,。每一种因素对身高的影响都是一个统计量,不管这些统计量本身是什么分布,它们和的平均值
符合正态分布。,注意:男性身高和女性身高都是正态分布,但男女混合人群的身高不是正态分布。,
许多事物都受到多种因素的影响,这导致了正态分布的常见。
读到这里,读者可能马上就会提出一个问题:正态分布是对称的,高个子与矮个子的比例相同,,但是很多真实世界的分布是不对称的。
比如,财富的分布就是不对称的,富人的有钱程度,可能比平均值高出上万倍,,远远超出穷人的贫穷程度,平均值的十分之一就是赤贫了,,即财富分布曲线有右侧的长尾。相比来说,身高的差异就小得多,最高和最矮的人与平均身高的差距,都在30%多。
这是为什么呢,财富明明也受到多种因素的影响,怎么就不是正态分布呢?
原来,正态分布只适合各种因素累加的情况,如果这些因素不是彼此独立的,会互相加强影响,那么就不是正态分布了。一个人是否能够挣大钱,由多种因素决定:
家庭
教育
运气
工作
...
这些因素都不是独立的,会彼此加强。如果出生在上层家庭,那么你就有更大的机会接受良好的教育、找到高薪的工作、遇见好机会,反之亦然。也就是说,这不是 1 + 1 = 2 的效果,而是 1 + 1 > 2。
统计学家发现,如果各种因素对结果的影响不是相加,而是相乘,那么最终结果不是正态分布,而是对数正态分布,log normal distribution,,
。
这就是说,财富的对数值满足正态分布。如果平均财富是10,000元,那么1000元~10,000元之间的穷人,比平均值低一个数量级,宽度为9000,与10,000元~100,000元之间的富人,比平均值高一个数量级,宽度为90,000,人数一样多。因此,财富曲线左侧的范围比较窄,右侧出现长尾。
http://www.wx183.com
范文四:利用SPSS检验数据是否符合正态分布
利用 SPSS 检验数据是否符合正态分布 (2011-04-24 06:30:42)
正态分布也叫常态分布, 在我们后面说的很多东西都需要数据呈正态分布。 下面的图就是正态分布曲线, 中间隆起, 对称向两边下降。 下面我们来看一组数据,并检验 “ 期初平均分 ” 数据是否呈正态分布(此数据已在 SPSS 里输入好)
在 SPSS 里执行 “ 分析 — >描述统计 — >频数统计表 ” (菜单见下图,英文版的可以找到相应位置 ) ,然后弹出左边的对话框,变量选择左边的 “ 期初平均分 ” ,再点下面的 “ 图表 ” 按钮,弹出图中右边的对话框,选择 “ 直方图 ” ,并选中 “ 包括正态曲线 ”
设置完后点 “ 确定 ” ,就后会出来一系列结果,包括 2个表格和一个图,我们先来看看最下面的图,见下图,
上图中横坐标为期初平均分,纵坐标为分数出现的频数。从图中可以看出根据直方图绘出的曲线是很像正态分布曲线。如何证明这些数 据符合正态分布呢,光看曲线还不够,还需要检验:
检验方法一:看偏度系数和峰度系数
我们把 SPSS 结果最上面的一个表格拿出来看看 (见下图 ) :
偏度系数 Skewness=-0.333;峰度系数 Kurtosis=0.886;两个系数都小于 1,可认为近似于正态分布。
检验方法二:单个样本 K-S 检验
在 SPSS 里执行 “ 分析 — >非参数检验 — >单个样本 K-S 检验 ,弹出对话框,检验变量选择 “ 期初平均分 ” ,检验分布选择 “ 正态分布 ” ,然 后点 “ 确定 ” 。
检验结果为:
从结果可以看出, K-S 检验中 , Z 值为 0.493, P 值 (sig 2-tailed)=0.968>0.05,因此数据呈近似正态分布
检验方法三:Q-Q 图检验
在 SPSS 里执行 “ 图表 — >Q-Q图 ” ,弹出对话框,见下图:
变量选择 “ 期初平均分 ” ,检验分布选择 “ 正态 ” ,其他选择默认,然后点 “ 确定 ” ,最后可以得到 Q-Q 图检验结果,结果很多,我们只需 要看最后一个图,见下图。
QQ Plot 中,各点近似围绕着直线,说明数据呈近似正态分布。
范文五:化探分析数据不符合正态分布
精品文档
化探分析数据不符合正态分布
地学数据处理-正态分布
自然界的数据,大部分服从近似正态分布或偏正态分布。在地质学中,大多数的数据处理方法均是在正态分布的基础上的。因此在数据处理的初期,均要通过一些数据处理方法对数据进行处理,使其服从正态分布。
使数据服从正态分布的意义是数据统计代表了大多数“意见”,“居中”,“不左也不右”。特别是对数据进行统计时,要对奇异值进行处理,否则会影响统计结果。
因此地质数据处理一般需要以下几个步骤:
第一步是数据观察
观察数据是否服从正态分布。可以通过频率图进行观察。一般按数据区间平分10等份,然后统计各段数据的累频。通过统计发现,标准正态分布一般是两边小中间高的钟形曲线。但由于一般采样数据均可能出现奇值点(太大或太小),使线峰偏左或偏右。于是采于一系列数学变换来进行转换。数学变换的原则是不能改变数据内部特征。
有些偏峰是数据出现了奇异值,还必须进行剔除后才能处理,一般采用2.5倍以上方差较好。
第二步是数学变换
数学变换的目的是使数据尽可能的呈现正态分布,或者统一地质变量数据水平,还有就是改变变量间的关系(非
1 / 2
精品文档
线性变为线性)。要根据不同的目的选择相应的数学变换方法。
一般最常见的数据变换是对数变换。还有就是平方根变换和正余弦变换。要根据数据情况选择相应的变换方法。化探数据处理一般采用对话变换,在数据出现负值时,可以进行数据偏移后再参与计算。
这些方法需要专用软件处理。可以在SPSS或ANSYS,MATLAB均可以,但数学变换需要进行二次开发,有些变换不是简单的公式。而要一个复杂的软件模块才能完成.。
万事皆由人的意志创造。校园招聘,上应届.毕业生网|【
2 / 2