范文一:SPSS统计描述几个重要的统计指标
均值(平均值、平均数):
表示的是某变量所有取值的集中趋势或平均水平。例如,学生某门学科的平均成绩、公司员工的平均收入、某班级学生的平均身高等。
计算公式如下。
中位数:
定义:把一组数据按递增或递减的顺序排列,处于中间位置上的变量值就是中位数。它是一种位置代表值,所以不会受到极端数值的影响,具有较高的稳健性
计算公式:一个大小为的数列,要求其中位数,首先应把该数列按大小顺序排列好,如果为奇数,那么该数列的中位数就是位置上的数;如果N为偶数,中位数则是该数列中第与第 +1位置上两个数值的平均数
众数:
定义:众数是指一组数据中,出现次数最多的那个变量值。众数在描述数据集中趋势方面有一定的意义。例如,制鞋厂可以根据消费者所需鞋的尺码的众数来安排生产。
计算公式:手工计算众数比较麻烦,需要统计数据的次数分布。
全距:
定义:全距也称为极差,是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据,全距大的一组数据要比全距小的一组数据更为分散。
计算公式:最大值-最小值。
方差(Variance)和标准差(Standard Deviation):
定义:方差是所有变量值与平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程度。方差和标准差越大,说明变量值之间的差异越大,距离平均数这个“中心”的离散趋势越大。
频数(Frequency):
定义:频数就是一个变量在各个变量值上取值的个案数。如要了解学生某次考试的成绩情况,需要计算出学生所有分数取值,以及每个分数取值有多少个人,这就需要用到频数分析。
变量的频数分析正是实现上述分析的最好手段,它可以使人们非常清楚地了解变量取值的分布情况。
峰度(Kurtosis):
定义:峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布平顶峰。具体的计算公式为
范文二:简述如何正确选用计量资料的统计描述指标
1.
(1).1
(2).2
(3).2
(4).22.
(1).31
(2).21
(3).21
3.
(1).
21
(2).
nk
k21
(3).Kk2
1
(4).K
10.5
4.
(1).2
(2).“=
nn>15
5. (H)0
(1).7
6. ()
?Y,b,bx,?,bx (1).011kk 2
H:,,,,,,?,,0012k (2). 2
(3).
H:,0,j,1,2,?k,0j 2
(4).
17.
(1).4
(2).3
8.
(1).3
(2).60560
54
21428
1.
(1).“”
41
(2).5t4
HHH10101(3).P P0.05H41“”1
2120,
42 30 72
18 30 48
60 60 120
(1)4218
2 (2)
(1).4218
“42”“18”4
2 (2).
1).H
0
H=0.052H110
2).b+c=48>4031
2(30,18)2,, ,3.00 30,18
2,,3.84 0.05,1 3).P=1
22,,3.00 ,,3.84 0.05,1 P0.05H0
31
1:
22(1)b,c,()22b,c, , ,,1b,cb,c
2222(ad,bc)n(|ad,bc|,n/2)n,,,,(a,b)(c,d)(a,c)(b,d)(a,b)(c,d)(a,c)(b,d)
222,,,,0.5,,,fefe2(ff,ff)nijij2ijij211221221,,,,,,,,PPPeennnnijij1,2,,1,2
22(ff,ff,n/2)n()f,f11221221221221, ,,,PP()f,fnnnn12211,2,,1,2
2(f,f,1)12212,,P(f,f)1221
22,,3.84,,6.630.05,10.01,1
22,,5.99,,9.210.05,20.01,2
22,,9.49,,13.280.05,40.01,4
范文三:2.2描述集中趋势的统计指标
第二章 定量资料的统计描述
二、描述集中趋势的统计指标
描述集中趋势统计指标?
1、算数均数(arithmetic?mean)?2、几何均数(geometric?mean,G)?3、中位数(median,M)?4、众数(mode)?
1、 算术均数
简称均数(mean),适合描述对称分布资料的集中位置(也称为平 均水平)。直接法,计算公式为:?
X?...?+ X?n 1?+ X?2?+ =n?
n:样本含量?
X?,X?,…,X?:观察值 1?2?n?
? X?? X?X?
= i
i?
i?=1?
i?
n
n?n?n?
?X
i?
i?
或
??X?:观察值之和
12?例 某年某医院8名女性晚期肺癌患者红细胞计数(10?/L)
为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其 算术均数。
1
= ( 4 . 20 + 6 . 43 + 2 . 08 + 3 . 45 + 2 . 26 + 4 . 04 + 5 . 42 + 3 . 38 )
8
12
= 3 . 91 ( 10 /L)
频率表法:对于样本含量较大的数据集(如例2-2),可以 在编制频率表的基础上计算均数的近似值。其计算公式为:?
fX?fX?=n?f?
0?
0?
f?:组段的频数?
X?0?:组段的中值?=(组段上限+组段下限)/2?
例 试应用频率表法近似地计算例2-2资料的算术均数
(1) 6~?8~?10~?12~?14~?16~?18~?20~?22~?24~?26~?28~30?组中值(?
0?)?
7?9?11?13?15?17?19?21?23?25?27?29?
(3)
1?3?6?8?12?20?27?18?12?8?4?1?0?
(4)=(2)(3)?
7?27?66?104?180?340?513?378?276?200?108?29?(2)
1 ′ 7?+ 3?′ 9?+ L?+ 1?′ 29?=
1?+ 3?+ L + 1?
2228?= 18?.?57?120?
2、几何均数(geometric?mean,G)
适用于原始观察值分布不对称或观察值变化范围跨越多个数量级的 资料,但经对数转换后呈对称分布的变量,如服从对数正态分布的变量。
直接法:计算公式为:
G?=?X?X?n?1 X?2?...?
或
log?X?G =?log?)?
- 1?
n?
一般采用以10为底的常用对数进行转换。?
例?7名慢性迁延性肝炎患者的HBsAg滴度资料为1:16,1:32,?1:32,1:64,1:64,1:128,1:512。试计算其几何均数。?
G?=′ 32?′ 32?′ 64?′ 64?′ 128?′ 512?= 64?
log?X?G =?log?)?
- 1?
16?+ lg?32?+ lg?32?+ lg?64?+ lg?64?+ lg?128?+ lg?512?ù é lg?= lg?ú 7?? ? = lg?- 1?1?.?8062?= 64?.?
-1?
n?
频率表法: 对于频率表资料,可以通过频率表法计算几何均数,计 算公式为:
é f log X ù é f log X ù 0 0 - 1 G = log?ú = log ú
n ê ú ê ? f ú ? ? ?
- 1
例 某年某医院52例慢性肝炎患者的HBsAg滴度数据见表2-4?第(1)和(2)列。试计算慢性肝炎患者HBsAg的平均滴度。
抗体滴度 (1) 1:16?1:32?1:64?1:128?1:256?1:512?合计?
表2-4??52例慢性肝炎患者HBsAg滴度的几何均数计算(频率表法)
lgX?f(lgX)?频数(f)?滴度倒数(X)?
(2) (3) (4) (5)=(2)×(4)?
2?16?1.20412?2.40824?7?32?1.50515?10.53605?11?64?1.80618?19.86798?13?128?2.10721?27.39373?12?256?2.40824?28.89888?7?512?2.70927?18.96489?52?108.06977?—?—?
-1?
108?.?06977?ù é
G= lg?= 119?.?74705?? 120?ú ? 52??
3、中位数(median,M)
可用于各种分布的定量资料,特别是偏峰分布资料。 直接法计算:
X 基于原始数据,将n例数据按序排列,第i个数据记为 i 当n为奇数时,中位数可表示为:
M = X n + 1
2
1
当n为偶数时,中位数表示为: M?= ( X n + X n ) + 1 2 2
2
例 某药厂观察9只小鼠口服高山红景天醇提取物(RSAE) 后在乏氧条件下的生存时间(分钟)如下:49.1,60.8,63.3,?63.6,63.6,65.6,65.8,68.6,69.0。试求其中位数。
M = X . 6 n?+ 1 = X 5 = 63
2
频率表法:对频率表资料,可通过百分位数法近似计算中位数。 百分位数(percentile)是指将n个观察值从小到大依次排 列后,对 应于x%的数值。
对频率表资料,百分位数 的计算公式为:
i?
Px? =?L?(?n?× x?%?- F?L?)?
f?x?
f?x?为该 其中L为欲求的百分位数所在组段的下限,i为该组段的组距,
F?为小于L所在组段的累计频数。?组段内的频数,n为总频数,
L?
例?50例链球菌咽颊炎患者的潜伏期(h)见表2-5第(1)~ (3)列,试计算潜伏期的中位数。
组段 (1) 12~?24~?36~?48~?60~?72~?84~?96~?108~120?合计?
表2-5?50例链球菌咽颊炎患者潜伏期(h)频率分布表
组中值(X?频数(f) 频率(%)?累计频数(F) 0?)?(2) (3) (4) (5)
18?1?2?1?30?7?14?8?42?11?22?19?54?11?22?30?66?7?14?37?78?5?10?42?90?4?8?46?102?2?4?48?114?2?4?50?—?50?—?—?
累计频率(%)?
(6)?
2?16?38?60?74?84?92?96?100?—
12?
P?50?′ 50?%?- 19?( h?)?( )?= 54?.?55?50?=?48?11?
4、众数(mode)
出现次数最多的数值。
检查次数 (1) 0?1?2?3?4?5?>5?合计?
表?2-1?某年某地?96?名妇女产前检查次数的频率分布 频数 频率(%)?累计频数 (2) (3) (4)
4?4.2?4?7?7.3?11?11?11.5?22?13?13.5?35?26?27.1?61?23?24.0?84?12?12.5?96?96?100.0
累计频率(%)?
(5)?4.2?11.5?22.9?36.5?63.5?87.5?100.0?
众数为?4(次)?
小 结
描述集中趋势指标的应用:
u 算数均数,适用于对称分布
u 几何均数,适用于观察值变化范围跨越多个数量级的资料 u 中位数,适用于各种分布的定量资料,特别是偏峰分布资料。?
范文四:第二节 集中趋势的统计描述指标
第二节 集中趋势的统计描述指标
2(频数分布的特征
由频数表可看出频数分布的两个重要特征:集中趋势(central tendency)和离散程度(dispersion)。身高有高有矮,但多数人身高集中在中间部分组段,以中等身高居多,此为集中趋势;由中等身高到较矮或较高的频数分布逐渐减少,反映了离散程度。对于数值变量资料,可从集中趋势和离散程度两个侧面去分析其规律性。
3(频数分布的类型
频数分布有对称分布和偏态分布之分。对称分布是指多数频数集中在中央位置,两端的频数分布大致对称。偏态分布是指频数分布不对称,集中位置偏向一侧,若集中位置偏向数值小的一侧,称为正偏态分布;集中位置偏向数值大的一侧,称为负偏态分布,如冠心病、大多数恶性肿瘤等慢性病患者的年龄分布为负偏态分布。临床上正偏态分布资料较多见。不同的分布类型应选用不同的统计分析方法。
(频数表的用途 4
可以揭示资料分布类型和分布特征,以便选取适当的统计方法;便于进一步计算指标和统计处理;便于发现某些特大或特小的可疑值。
第二节 集中趋势的统计描述指标
描述一组同质观察值的平均水平或中心位置的常用指标有均数、几何均数、中位数等。
1(均数(mean,average):是算术均数(arithmetic mean)的简称。常用 表示样本均数, 表示总体均数。均数用于反映一组同质观察值的平均水平,适用于正态或近似正态分布的数值变量资料。其计算方法有:
(1)直接法:用于样本含量较少时,其公式为:
(2.1)
式中,希腊字母Σ(读作sigma)表示求和;X1,X2,?,Xn为各观察值;n为样本含量,即观察值的个数。
(2)加权法(weighting method):用于频数表资料或样本中相同观察值较多时,其公式为:
(2.2)
式中,X1,X2,?,Xk与f1,f2,?,fk分别为频数表资料中各组段的组中值和相应组段的频数(或相同观察值与其对应的频数)。
2(几何均数(geometric mean)用G表示,适用于?对数正态分布,即数据经过对数变换后呈正态分布的资料;?等比级数资料,即观察值之间呈倍数或近似倍数变化的资料。如医学实践中的抗体滴度、平均效价等。其计算方法有
(1)直接法:
或 (2.3)
(2)加权法:
(2.4)
注意:计算几何均数时观察值中不能有0,因0不能取对数;一组观察值中不能同时有正或负值。
3(中位数(median) 用 表示。中位数是一组由小到大按顺序排列的观察值中位次居中的数值。中位数可用于描述?非正态分布资料(对数正态分布
除外);?频数分布的一端或两端无确切数据的资料?总体分布不清楚的资料。在全部观察中,小于和大于中位数的观察值个数相等。
(1) 直接法:将观察值由小到大排列,按式(2.6)或式(2.7)计算。
为奇数 , (1.5)
为偶数, (1.6)
式中下标 、 、 为有序数列的位次。 、 、 为相应位次的观察值。
(2)频数表法:用于频数表资料。
计算步骤是:?计算 的大小,并按所分组段由小到大计算累计频数和累计频率,如表2.1第(3)、(4)栏;?确定 所在组段。累计频数中大于 的最小数值所在的组段即为 所在的组段;或累计频率中大于50%的最小频率所在的组
所在的组段。?按式(2.7)求中位数 。 段即为
(2.7)
式中:L、i、 分别为 所在组段的下限、组距和频数; 为小于L的各组段的累计频数。
例 1.1 由表2.1计算中位数M。
表2.1 199名食物中毒患者潜伏期的M和PX的计算
潜伏期人数f 累计频数累计频率
0, 30 30 15.1 Σ(小时) f (%)
(2) 12, 71 101 50.8
(1) (3) (4)=(3)/n 24, 49 150 75.4
36, 28 178 89.4
48, 14 192 96.5
60, 6 198 99.5
72,84 1 199 100.0
合计 199
本例n=199,根据表2.3第(2)栏数据,自上而下计算累计频数及累计频率,见第(3)、(4)栏。 ,由第(3)栏知,101是累计频数中大于99.5的最小值,或由第(4)栏知50.8%是大于50%的最小的累计频率,故M在“12,”组段内,将相应的、、50、 代入(2.8),求得M。 Lif
M=P50= =12+12/71(199×50%-30)=23.75(小时)
4(百分位数(percentile)用Px表示。一个百分位数Px将一组观察值分为两部分,理论上有X%的观察值比它小,有(100-)%的观察值比它大,是一X
种位置指标。中位数是一个特定的百分位数,即=P50。百分位数的计算步骤M
与中位数类似,首先要确定x所在的组段。先计算 ,累计频数中大于 的最小P
值所在的组段就是Px所在组段。计算见公式(2.8)。
(2.8)
式中:L、i、fx分别为Px所在组段的下限、组距和频数;为小于L的各组段的累计频数。
百分位数用于描述一组数据某一百分位位置的水平,多个百分位数的结合应用时,可描述一组观察值的分布特征;百分位数可用于确定非正态分布资料的医学参考值范围。应用百分位数,样本含量要足够大,否则不宜取靠近两端的百分位数。
范文五:用Excel计算描述统计量——集中指标、变异指标分布与形状
用Excel计算描述统计量——集中指标、变异指标分布与形
状
试验目的: 熟练使用Excel进行常用统计量的计算
试验内容:
在本章中,我们介绍了测度数据集中趋势和离散程度的常用统计量,在本试验中,将展示如何用Excel来计算这些统计量。为了说明方便,假定已将50个数据输入到Excel工作表的A1:A50单元格中。下面给出用Excel计算这些数据描述统计量的具体步骤。
表1 分析用数据列表
117 122 124 129 139 107 117 130 122 125
108 131 125 117 122 133 126 122 118 108
110 118 123 126 133 134 127 123 118 112
112 134 127 123 119 113 120 123 127 135
137 114 120 128 124 115 139 128 124 121
第1步:选择“工具”下拉菜单 。
第2步:选择“数据分析”选项 。(需要从 Office 安装盘安装数据分析库)
图1 选择“数据分析”功能
第3步:在分析工具中选择“描述统计”。
第4步:当出现对话框时,在“输入区域”方框内键入A1:A50;在“输 出选项”中选择输出区域(在此选择“新工作表”);然后选择“汇总统计”(该选项给出全部描述统计量);最后选择“确定”。
图3 参数设置
下面的附表是Excel输出的描述统计量计算结果。用黑体显示的是本章中所介绍的描述统计量。
表2 结果列表及说明
Excel2002 输出名称 Excel2002 输出结果 说明 平均 122.98 标准误差 1.135149006 中值 123 中位数 模式 122 众数 标准偏差 8.026715596 样本方差 64.42816327 峰值 -0.408713596 偏斜度 9.94468E-05 偏移度 区域 32 极差 最小值 107 最大值 139 求和 6149 计数 50 最大(1) 139 最小(1) 107 置信度(95.0%) 2.281165949
转载请注明出处范文大全网 » SPSS统计描述几个重要的统