范文一:第七版 卫生统计学 重要定理证明
附录六 重要定理推导与证明
1.多个独立随机变量和或差的方差等于各变量方差的和。
设、为两个独立随机变量 XY
2VarXYEXYEXY()[()()],,,,,
2,,,,EXEXYEY{[()][()]} 22,,,,,,,EXEXEYEYEXEXYEY[()][()]2[()][()]
,,,,,VarXVarYEXEXYEY()()2[()][()]而对于独立变量, EXEXYEY[()][()]0,,,
故 VarXYVarXVarY()()(),,,
推广到多个独立变量,同样有:
VarXXXVarXVarXVarX()()()(),,,,,,,??1212nn
2(非零常数与随机变量乘积的方差等于该常数平方与变量方差之积。
c,0X设常数,随机变量的方差为 VarX()
2VarcXEcXEcX()[()],,
2,,EcXcEX[()]
2 ,,EcXEX{[()]}
22,,cEXEX[()]
2,cVarX()
122,,,3(,即。 VarXVarX()(),nXn
XXX,,,?12nX,由于 n
1VarXVarXXX,,,,?()()根据定理2, 12n2n
2X又由于各独立同分布, VarXVarXVarX()()(),,,,?,in12
2根据定理1, VarXXXn(),,,,?,n12
于是有:
1()()VarXVarXXX,,,,?12n2n
12(),n, 2n
2,,n
22,,2124(。 ,,,nn,XX1112,
222根据定理1, ,,,,,,XXXX1212,
22,,212再根据定理3, ,,,nn,XX1112,由此可以看到两样本均数比较的统计量分母由来。
n21225(为总体方差的无偏估计。 ,SXX,,,,,in,1,1i
22??,一般地,若,则称是的一个无偏估计,则需证明 ,ES(),,,,,E()由于
nn222()(2)XXXXXX,,,,,,iii,,ii11
nn22 ,,,XXXnX2,,ii,,ii11
n22,,XnX,i,1i故
n122()[()]ESEXX,,,iin,1i1,
n1n22,,EXX(),i11nn,,i1,
nn22,, EXEX()()nn,,11
n22[()()] ,, EXEXn,1
又由于
22,,,EXEX[()]
22,,,EXXEXEX[2()()] 222,,,EXEXEX()2()()
22,,EXEX()()
所以
222 EXEX()(),,,
122222EXEXEX,,,,,,()()() Xn
故有
n222ESEXEX()[()()],, n,1
n12222,,,,,, [()()]EXEX nn,1
n12,,[(1)],nn,1
2,,
n2122因此,为总体方差的无偏估计。 ,SXX,,,,,in,1,1i
6(二项分布参数的总体均数和方差。
01,,,设X服从二项分布,,其概率函数为: B;,kn,,,
kknk, (k,0,1,?,n)PXkC()(1),,,,,n
则
n
EXkPXk,,,,,,,k,0
nkn,!knk,,,(1),,,knk!!,,,k,1
nnn,1!,,,,,knk,,1,,(1),,,knk,,1!!,,,,k,1
nkknk,,,11 ,,nC(1) ,n,1,,,k,1
n,1mmnm,,1,,nC(1),n,1,,,m,0
n,1,,,n1,,,,,
,n,2VarXEXEX()[()],,
22,,,,EXXEXEX(2()()] 222 ,,,EXEXEX()2()()
22,,EXEX()()
n22EXkPXk(),,,,,k,0
2nkn,!knk,,,,,(1),knk!!,,,k,1
nkn,,11!,,knk,,,(1),,,knk,,1!!,,,,k,1
nnkn,1!,,n!knkknk,,,,,,(1)(1),,,,,,knkknk,,,,1!!1!!,,,,,,,,kk,,11
nn!knk,,,,(1)EX,,,,,knk,,2!!,,,,k,2
nn,2!,,22knk,,,,,,nnEX1(1),,,,,,,,knk,,2!!,,,,k,2
n,222mmnm,,,nnCEX,,,1(1),,,,,,,,n,2m,0
2 ,,,nnEX1,,,,,
22VarXEXEX()()(),,
22 ,,,,,,,nnnn1,,,,
,,,,n1,,
X(1)X,,,Var()E(),,推论:,, nnn
7.Poisson 分布是二项分布的极限分布。
在独立试验中,以代表阳性事件在试验中出现的概率,若试验总数为,阳性事件发生次,n
k,,,n,,,Bkne(;,),B;,kn,数服从二项分布。,如果,则当时, n,,,,,nk!
记,,,n,则 nn
nk,kkBknC(;,)1,,,,,,,nnnn
knk,nnnk,,,,,,11,,,,,,,,,,nn ,,1,,,,knn!,,,,
nk,k121k,,,,,,,,,,,nn ,,,,,,,,1111,,,,,,,,knnnn!,,,,,,,,k由于对固定有
nk,121k,,,,,,,,,,kk,,nlim,,,,, lim1e ,,,,,,,lim1111,,n,,,,,,,,n,,n,,n,,nnnn,,,,,,,,
limn,,,所以,当时有 n,,n
k,,, lim(;,)0,1,2,Bknek,,,,,,,,n,,nk!
8.Poisson 分布的总体均数和方差。 设服从Poisson分布,则 X
k,,,,,0 PXkek,,,,,,,0,1,2, ,,k!
kk,1,,,,,,,,,,,, EXkPXkkeeee,,,,,,,,,,,,,,,,!1!kk,,,kkk,,,011
,22EXkPXk(),,,,,,0k
k,,,2,,ke,k!,1k
k,,,,,,,ke11 ,,,k,1!,,,1k
,,21kk,,,,2,,,,,,ee,,,,kk,,2!1!,,,,,,21kk
2,,,,
2222 VarXEXEX()()(),,,,,,,,,,9.简单回归方程回归系数的最小二乘估计。 已知:简单线性回归方程为:
yxin,,,,,,,,,,1,2,, ,,iii01
2,,~0,,1,2,,Nin,,,,其中。求回归系数,和,的最小二乘估计。 ,,i01
根据最小二乘法的思想,即求使得误差平方和
n2 Qyx,,,,,,,,,,ii01,,,i1
,,达到最小时的和作为其估计值。 01
xy,,,,,观测已知,把看做和的函数,分别对和求一阶偏导,并令之为0Q,,ii0011
得:
n
20yx,,,,,,,,,,01ii,,,1i n
20xyx,,,,,,,,,,01iii,,,1i
整理后得:
nn
,,nxy,,,,01iiii11,, nnn2xxxy,,,,,,,01iiiiiii111,,,
消去法解关于和方程组得: ,,01
nnnnn2xynxynxynxyxxyy,,,,l,,,,,,,,,iiiiiiiixy,,,,,11111iiiii?,,,,,12nn2222nn2lnxnxxx,,,,xx,,iixnx,,,ii11,,,,ii,,ii11
nn?1,1??,,,,yxyx,,,,01iinn,,11ii
即为和的最小二乘估计值。 ,,01
10. 配对秩和检验T界值表的制作。
n,4n,4以为例说明,假定配对的有效对子数,总体秩可取值为1、2、3、4(不考虑持平值)。计算正秩和或负秩和,总秩和,,,,TTnn12,即当n固定时,TT,,,,,,
总秩和是恒定的,因此与的分布是等价的,只需计算和中任意一个。 TTTT,,,,
和均从总体秩中取值,可取0、1、2、3、4个秩,因此可得到的(或)有TTTT,,,,
01234416种()情况,可能组合及秩和值(或)见下表: TTCCCCC,,,,,2,,44444
取秩 - 1 2 3 4 1,2 1,3 1,4
0 1 2 3 4 3 4 5 T
取秩 2,3 2,4 3,4 1,2,3 1,2,4 1,3,4 2,3,4 1,2,3,4
5 6 7 6 7 8 9 10 T
1/160.0625,n,4TT每种组合情况所对应的秩和的概率为,归纳成时秩和的概率分布见下表:
0 1 2 3 4 5 6 7 8 9 10 T
PT()0.0625 0.0625 0.0625 0.125 0.125 0.125 0.125 0.125 0.0625 0.0625 0.0625 0.0625 0.125 0.1875 0.3125 0.4375 0.5625 0.4375 0.3125 0.1875 0.125 0.0625 单侧P值
TTnn,12的概率分布为对称的非连续分布,的最小值为0,最大值为,均数为,,
n,4nn,14,对于,最大值为10,均数为5。 ,,
TP根据的概率分布可计算样本值对应的单侧和双侧累计概率,得到相应单侧或双侧
n,4值如上表第三行所示。从中可见,由于的最小单侧累计概率大于0.05,按通常的检验
Tn水准得不到有统计学意义的推断结论,因此配对秩和检验界值从5开始取值。
由于正秩和与负秩和具有对应关系,因此,两者中小者小于或等于下侧界,则大者大于或等于上侧界值。计算时只需要计算其中任意一个,然后查界值表。
nn改变,重复以上步骤可得到不同对应的界值表。
11.似然函数的概念及正态分布参数的似然估计。
,设样本的概率函数为,其中为参数,在参数XXXX,,,,,,,fxxx,,,;,,,,,,,,12n12n
,,空间内取值,当固定而把看成的函数,则称为似然函数(likelihood Xfxxx,,,;,,,,,,12nfunction)。
其中,若是连续型的,则是其概率密度函数;若是离散型的,XXfxxx,,,;,,,,,,12n
,则,表示有关概率是在参数值为时计算fxxxPXxXx,,,;,,,,,,,,,,,,P,,,,1211nnn,,的。
,,xxx,,,,,,, 的极大似然估计,就是在已得样本的情况下,似然性(likelihood)X,,12n
,,,最大的那个值,即使得最大的那个值,的确定要解决一个极值问fxxx,,,;,,,,,,,12n
题。
对于简单随机样本,总体分布有概率函数fx时,有一个抽自该总体的大小为的独n,,,立同分布样本,则样本联合概率函数为fxfxfx,,,,则样本XXX,,,,,,,,,,,,,,,12n12n
XXXX,,,,,,,的似然函数为 ,,12n
n
fxfx;,,,,,,,,i,1i
fx;,这时的对数 ,,
n
ln;lnfxfx,,,,,,,,i,1i称为对数似然函数。
,,x,由于对数函数是单调递增函数,的极大似然估计,也是在已得样本的情况下,x,,
,ln;fx,使得最大的那个值。 ,,
2,,,,,,XXXN,,,~,,,,,,对于正态简单随机样本,设,参数,求的极大,,,,n12
似然估计。
XXX,,,,,,解:有联合概率密度函数 ,,12n
n11,,2fxx,,, ;,exp,,,,,,,,in2,,2,,1,,i2,,,,对数似然函数为
n112 fxnnx,,,,,,,,ln;,lnln,,,,,i2,2,2,1i
分别对和求一阶偏导并令之为0,得如下似然方程: ,,
n1 x,,,0,,,i2,,1i
nn12 ,,,,,x0,,,i2,,,1i求得唯一解:
nn2112 ??,,,, ,,XxXX,,,,,iinn,,11ii
可验证它确是极大似然估计。
12.logistic回归系数的极大似然估计 解:假设
exp,,,,,,XX,,,,,1011iimmiP,,i1exp,,,,,,,XX1exp,,,,,,,,XX,,,,,,,,,,,,011iimmi011iimmi,,
1,,P1 i,,,,,,,,,,XX1exp,,011iimmi
似然函数为:
Yinnexp,,,,,,,,,XX,,,,1,Y011iimmiY,,iiLPP,,,1 ,,,,ii1exp,,,,,,,XX,,,,,,,11ii011iimmi对数似然函数为:
n
lnln1ln1LYPYP,,,,,,,,,,,iiii,,,1i
n
,,,,,, ,,,,,,,,,,,,,,,YXXXXln1exp,,,,,,,,,011011iiimmiiimmi,,,1i
m,1分别对,,,,,,,,,求一阶偏导并令之为0,得如下个似然方程: 01m
n,,,exp,,,,,,,,,XX,,011iimmiYj,,,0, 0,,,,i1exp,,,,,,,XX,,,,,,1i011iimmi,,, ,n,,XXX,,,,,,,exp,,,,,,011jiiimmiYXjm,,,,,,0, 1,,,,,iji,1expXX,,,,,,,,,,1i,,,011iimmi,,,
m,1通常这个方程不能采用消元法或矩阵变换的方法求得精确解,只能采用数值方法
lnL求近似解。常采用Newton-Raphson迭代法计算的极大值,迭代收敛时得到的参数值
bbb,,,,,,,,,,,,,,,即为的极大似然估计值。 01m01m
(王彤)
范文二:《卫生统计学》第七版勘误内容:
《卫生统计学》第七版勘误内容:2012-11-7
序号 章节号、页码 行数 错误写法 正确写法 备注
第3章第三节、年龄别生育率 同年某年龄组活年龄别生育率 同年某年龄组活产1 27
产数 同年某年龄组平均妇女数数 同年某年龄组平均妇女数×1P41
×1年 1000‰ 强度型(近似) 年 1000‰ 相对比型 第3章第三节、因别死亡率,某病病死率和死因因别死亡率,某病病死率和死因构2 23
构成等 成比等 P42
第3章第七节、会改变各直条长短的比例图 会改变各直条长短的比例 3 9 P53
第3章中英文续表中Figure 3-5描述的第14 worker’s workers’ 结果报告,P55 行
第3章第十节、5 14 2006 a3 8792458 2006 a3 8792459 P58
第3章第十节、实验3-3 绘制线图和半对数线实验3-3 绘制线图和半对数线图 6 31
图 根据表3-10的资料?????? 根据表3-14的资料?????? P58
第3章第十节、7 8 23 vaxis=axis1 haxis=axis2 23 vaxis=axis1 haxis=axis3 P59
第3章第十节、8 14 vaxis=axis1 haxis=axis3 29 vaxis=axis2 haxis=axis3 P59
第4章P63 第14行 又,该实验为有放回的实验 该实验又为有放回的实验 9
第5章P97 表5-4合计一行的频率 漏掉频率的合计100.0 10 100.0
第6章P112 第1行和第11行 得到的F值一个是四位,一个是F的值保留两位小数 两个F值的小数点11
三位 位数不一致 第7章P138 第三行 表7-11 表7-12 12
第9章P172 这类资料的特点是……无法精确这类资料的特点是……无法精确测13 5-6
测量等特点。 量等。
第9章P172 16行 秩和 秩 14
序号 章节号、页码 行数 错误写法 正确写法 备注
第9章P174 一、两组连续性变量资料的秩和一、两组连续型变量资料的秩和检15 14
检验 验
第9章,P181 表下12,13行 三个 四个 16 第9章,P186 13行 π 删去π 在186页表9-11下17
第三行 第9章,P188 3行 18 a3 D09_03 第9章,P188 9行 19 a4 D09_04 第9章,P189 7行 20 a5 D09_05 第9章,P189 程序中的1行 DATA D09_06ab; DATA D09_06ab(drop=i n1 n2); 21 第9章,P189 程序中的19行 IF j=.THEN DELETE ; IF j=1THEN output; 22 第9章,P189 程序中的20行 ELSE IF j=2 THEN DELETE ; 删除第20行的语句 23
第9章,P189 程序中的25行 IF j=.THEN DELETE ; IF j=1THEN output; 24 第9章,P189 程序中的26行 ELSE IF j=1 THEN DELETE ; 删除第26行的语句 25
第9章,P190 小结的第二行 先天性 删去“先天性” 26
第9章,P190 32(倒数5) 。 27 .
28 ZZZZ,,,,,,,,/2/2ZZ,Z,,Z,,,,,第10章P199 第1行 ,,n,3n,3nn33,,,,,, 第10章P200 第11行 本章开头系数的拉29 pearson Pearson
丁文用的是斜体,
后面有些用的是斜
体,有的用的是正
体,建议统一。
《二、秩相关系数的假设检30 r,rrr,第10章P201 s10,0.05s0.05/2,10=0.648 =0.648 验》中第6行
《例10-7 中两分类变量关联31 第10章P209 性分析的中英文结果报告》的ADIS AIDS
英文部分第3,5, 9行
序号 章节号、页码 行数 错误写法 正确写法 备注
第11章P223 公式 根据总变异-回归得32 327219.2926 327219.2962
到残差变异应该是MSSS/v4318227.7159/1回回回F,,,,158.361MSSS/v327219.2926/12残残残 327219.2962,公式
中数值错误 第12章P240 第一点第二行 H:β=β=β=β 33 01234H:,,,,...,,012p 第12章P241 表12-3下第二行 变量名未斜体 34 X,X,X123
第12章P245 表12-5 少了自变量X3一行 见此文的下表12-5 见此文的下表12-5 35
第12章P253 公式12-9和12-10 36 VIP VIF
第13章第八节小结的第3点的第二行 统计学设计的基本内容 统计学设计的基本原则 37 P283
第13章思考与一、简答题 2.简述医学研究的统计学设计包括遗漏了,但在《实38
练习P283 哪些基本原则, 习指导》上补上了
不改的话,则需将
其他简答题作顺延
编号
第14章P289 区配 匹配 拟修改的字,是图39
14-2中居中位置的3
文字。 第14章P290 倒数第7行 第r种药物的AUC值的平均值 第r种药物的lgAUC的平均值 40 第14章P291 个体内变异 个体内误差 41 3
检验处理效应的P<0.001>0.001><0.0001 与表14-6中的p值42="" 第14章p291="" 表14-5下方文字第2行="" 统一="">0.0001>
SS-SS-SS SS= SS-SS-SS 与上方公式对齐,43 处理 处理ABABAB第14章P293 表14-8 添加“SS=” AB第14章P295 个体间误差 个体间变异 44 14 第14章P295 倒数第2 个体间误差 个体间变异 45
表14-11
序号 章节号、页码 行数 错误写法 正确写法 备注
第14章P295 个体间差异 个体间变异 46 倒数第4行 表14-12
第14章P305 随机区组设计和设计 随机区组设计和析因设计 47 20 第14章P305 个体间误差 个体间变异 48 28
第15章P328 15行 例15-7 案例 15-4 49
第16章P333 倒数第8 而且特别适用于无法采取普查而且特别适用于无法采取普查(如50
(如食品、化妆品的卫生检测)食品、化妆品的卫生检测)方式进
的方式进行研究。 行的研究。 第16章 式16-13及倒数12行的应用 公式中指数的位置太靠下 公式中指数的位置向上 51 第三节P344
第16章P345 式16-18 同上 同上 52 第16章P345 式16-15 253 2,,MH公式中MH应该为的下标 公式中中MH的位置太靠上
第16章P346 第9行 同上 同上 54 第16章P346 第6行 同上 同上 55 第16章P345 表16-8 各列数据个位、小数点未对齐 各列个位数、小数点对齐 56 第16章第三节 表16-11下第3行 表明子宫内膜癌的发生与雌激素表明子宫内膜癌的发生与雌激素服57
服用史存有关联。 用史存在关联。 P348
第16章P348 表下第5行 公式中指数的位置太靠下 公式中指数的位置向上 58 第16章第三节 公式16-23,16-25,259 2,,MHMH应该为的下标 中MH的位置太靠上 P348,349,353,16-29,16-30,16-34,
355
第16章表16-11,表16-14 同上 同上 60 P348,349
第16章P349 倒数第4行 同上 同上 61 第16章P349 倒数第7,8行 同上 同上 62 第16章P350 14行,倒数第一行 π位置太下 π与Q同行 63 111
序号 章节号、页码 行数 错误写法 正确写法 备注
第16章式(14-8)(总共有四处) 式(14-6) 64 350-P351
第16章P353 表16-17上第3行 同上 同上 65 第16章P353 表16-16下第2,4行 266 22,,MH,P的下标 公式中MH、P应该为公式中和中MH、P的位
置太靠上
第16章P353 表16-15 数据个位、小数点未对齐,发病个位数、小数点对齐,发病率往后 67
率数据太靠前
第16章P354 式16-31及第5行的应用 公式中指数的位置太靠下 公式中指数的位置向上 68 第16章P354 公式16-31及第5行的应用 公式中指数的位置太靠下 公式中指数的位置向上 69 第16章P354 表16-18 数据个位未对齐 个位数对齐 70 第16章P356 表16-21 同上 同上 71 第16章P356 第9行 同上 同上 72 第16章P361 表16-23 同上 同上 73 第16章P367 表16-28,16-29 同上 同上 74 第16章P368 表16-30 同上 同上 75 第16章P368 表16-31 同上 同上 76
2第20章p447 图20-1 误写为Chi? 77 Chi
2第20章p447 图20-1 误写为I? 78 I
中英文名词对第3行 79 Pearson product moment Pearson product moment correlation 照索引,489页 coefficient coefficient
表12-5 肺活量与各自变量的相关系数和偏相关系数
简单相关系数 偏相关系数 自变量 系数值 P值 系数值 P值
0.698 0.001 0.596 0.009 X 1
0.516 0.020 0.503 0.033 X 2
0.714 0.395 0.105 X <0.001>0.001>
范文三:卫生统计学 考研
卫生统计学
(Health Statistics)
课程编号: 学分数 5 周学时 4 课程性质:医学基础课
预修课程:
教学目的:掌握研究设计方法、基本的统计原理和方法,并能够将其应用于居民健康状况研究、医疗卫生研究和医学科研。通过本课程的教学,帮助学生培养透过偶然现象探测事物内在规律的思维能力,使学生能应用统计的思维分析方法,有效地开展各项医疗卫生工作和研究工作。
基本内容:研究设计、基本统计原理、常用的统计推断方法
基本要求:学生应按本大纲具体要求,掌握统计学基本原理、常用的统计分析方法和科学的研究设计方法。能够进行合理地研究设计,科学地搜集、整理、分析数据资料,作出合理推断,能够理论联系实际,分析解决实际问题。 教学用书:倪纵瓒主编 《卫生统计学》,人民卫生出版社,2001年1月 教学内容、要求和课时安排:
一、绪论(学时数:2)
教学内容
卫生统计学的内容,统计工作的步骤,统计资料的类型,统计中的几个基本概念,学习卫生统计学应注意的问题。
教学要求
1. 掌握:统计中的几个基本概念:随机现象,概率,总体,样本,抽样误差,统计资料的类型。
2. 熟悉:统计工作的一般步骤。
3. 了解卫生统计学的主要内容,学习过程中应该注意的问题。
二、计量资料的描述(学时数:6+2)
教学内容
1.计量资料的频数表、图
2.计量资料的统计描述指标
集中趋势:均数,几何均数,中位数,百分位数;
离散趋势:极差和四分位数间距,方差和标准差,变异系数
3.正态分布的概念和特征,正态曲线下面积分布规律,正态分布的应用,对数正态分布。
教学要求
1. 掌握:计量资料的频数表。常用集中趋势指标的意义及适用范围。正态分布曲线下的面积分配规律。
2. 熟悉:常用集中趋势、离散趋势指标的计算方法。正常值范围的意义和制定方法。
3. 了解:对数正态分布。计量资料的频数图。
三、计量资料的统计推断(学时数:12+4)
教学内容
1.抽样误差
均数的抽样误差与标准误、t 分布
2.统计推断
总体均数的估计;
假设检验的一般步骤和原理;两类错误;假设检验应注意的问题
3.t 检验和u 检验;方差不齐时两个小样本均数的比较
4.方差分析:基本思想,完全随机设计的多样本均数比较,配伍组设计的
多个样本均数的比较,多个样本均数间的两两比较。多个方差齐性检验。变量变换。
教学要求
1. 掌握:均数标准误差的概念和计算。总体均数可信限的意义和计算。假
设检验的基本思想与一般步骤。关于正态总体均数推断的t 检验,两种实验设计的方差分析。
2. 熟悉:均数的抽样误差。假设检验中的两类错误,两种检验。两个大样
本均数比较的u 检验。方差分析的基本思想方法。
3. 了解:t 分布。方差齐性检验与方差不齐时的t ’检验。方差分析后的多个
样本均数间的两两补角。变量变换。
四、计数资料的描述和推断(学时数:10+2)
教学内容
1. 统计描述:相对数的概念,常用相对数,应用相对数应注意的问题,标准化法
2222. 统计推断:四格表x 检验,行×列表x 检验。配对计算资料的x 检验,四格表的
确切概率法
教学要求
1. 掌握:相对数的种类、意义及应用时注意事项。率(构成比)的标准误概念和计
算。总体率(构成比)可信限的意义和求法。两个样本率比较的四格表x 2检验;多个样本率比较的行×列表x 2检验。
2. 熟悉:率的标准化的意义、方法(直接法、间接法)。样本率与总体率比较的u 检
验。
3. 了解:发病率、患病率、出生率、生育率、死亡率、病死率、婴儿死亡率、新生
儿死亡率等指标的计算和意义。两个样本率比较的u 检验。
五、二项分布、poisson 分布及其应用(学时数:6+2)
教学内容
二项分布、poisson 分布的概率函数、均数、标准差,图形。
二项分布的应用。poisson 分布的应用。二项分布、poisson 分布与正态分布三者关系。 教学要求
1. 掌握:二项分布、poisson 分布的概率函数、均数、标准差,样本率与总体率比较
的直接概率法。poisson 分布总体均数可信区间的意义和求法。poisson 分布样本与总体比较的直接计算概率法。poisson 分布二样本比较的u 检验。
2. 熟悉:频数分布拟合优度的x 检验。二项分布、poisson 分布与正态分布三者关系。
3. 了解:利用二项分布、poisson 分布研究疾病的集积性。 2
六、非参数统计(学时数:3+1)
教学内容
非参数统计的概念,配对比较的符号秩和检验,配伍组设计的多样本比较的秩和检验,两样本比较的秩和检验,多样本比较的秩和检验,多个样本间两两比较的秩和检验。 教学要求
1. 掌握:非参数统计方法的意义和优缺点。配对资料、两样本比较、多样本比较的
秩和检验步骤。
2. 熟悉:配对资料、两样本比较、多样本比较的秩和检验的思想方法。
3. 了解:秩和检验中各统计量计算公式。多个样本间两两比较的秩和检验。
七、直线相关和回归(学时数:3+1)
教学内容
直线相关,直线回归,直线相关与回归的区别和联系,等级相关,应用直线回归与相关的注意事项。曲线直线化。
教学要求
1. 掌握:相关的意义,用相关系数描述两个量间的直线相关关系,相关系数的假设
检验,回归方程的求法及应用。
2. 熟悉:相关图的制作和用途,相关与回归的区别和联系。回归系数的假设检验。
登记相关。
3. 了解:曲线直线化。
八、统计图表(学时数:2)
教学内容
统计表与统计图的作用,统计表,统计图。
教学要求
1. 掌握:根据资料的特征和分析目的的选用适当的统计图。条图、百分条图、线图、
直方图的制作。制作统计表的基本要求及列表原则。
2. 熟悉:半对数线图、统计地图的制作。
3. 了解:统计表的种类。多种统计图形的结合使用。
九、研究设计(学时数:6+2)
教学内容
医学研究中的调查设计:原理,调查表,整理分析计划,四种基本的抽样方法,二阶段抽样,样本含量估计,非抽样误差的控制。
医学研究中的实验设计:意义和基本要素,实验设计的基本原理和原则,常用的几种实验设计方法。
教学要求
1. 掌握:调查设计的重要性,基本内容。四种基本抽样方法。实验设计的重要性、
三要素、三条基本原则。几种常用实验设计:交叉设计、完全随机设计、配对设计、配伍组设计。
2. 熟悉:调查设计中样本容量的估计。非抽样误差的控制。实验设计的基本原理。
随机数字表、随机排列的使用。
3. 了解:二阶段抽样。拉丁方设计、正交设计、盲法设计。实验与调查的区别。
十、寿命表、生存分析(学时数:6+2)
教学要求
1. 掌握:寿命表的分析应用,寿命表中主要指标的意义及计算,全死因简略寿命表
的编制方法。生存率,生存率的计算方法。
2. 熟悉:寿命表的概念、生存分析的概念、和基本指标。
3. 了解:去某死因寿命表的编制。生存率的标准误。
教学内容
1. 寿命表的概念,寿命表的主要指标和编制方法,寿命表的分析应用,去死因寿命
表的编制。
2. 随访资料的生存分析:基本指标和意义;生存率和生存率的计算:乘积极限法和
寿命表法;生存率的比较;
编写者:邓伟(讲师) 编
范文四:考研卫生统计学习题集
第一部分:单选题
单选题
卫生统计学
1、统计学研究内容是
A 样本的统计量 B 总体的参数 C 变量变异情况 E 数据的收集、分析、解释和表达 答案: E 难度:易
考点:1.1章节 统计学研究内容,了解
2、统计学研究基本步骤是
A 设计、搜集资料、整理资料、分析资料B 设计、搜集资料、调整资料、分析资料
C 设计、搜集资料、调查资料、推断资料D 设计、整理资料、调查资料、推断资料 E 设计、整理资料、调查资料、分析资料
答案:A 难度:易
考点:1.1章节. 理解统计学研究基本步骤,尤其是设计最为关键)
3、统计学中所说的总体是指
A 根据采用的研究方法确定的研究对象的全体B 根据样本来确定的研究对象的全体
C 根据研究目的确定的同质的研究对象全体D 根据研究对象所在地区划分的研究对象的全体E 根据研究的时间划分的研究对象的全体
答案:C 难度:易
考点:1.2章节,要求是同质的全体研究对象)
4、为了减少由样本推断总体产生的偏性,样本应该是
A 总体中的突出部分B 总体中有意义的一部分C 总体中有价值的一部分
D 总体中有代表性的一部分
E 总体中任何一部分
答案:D 难度:易
考点:1.2章节,有代表性的样本才能反映总体情况)
5、测量一组5岁男孩体重的数据是属于
A 数值变量B 无序分类(两项分类)C 无序分类(多项分类)D 有序变量 E 等级变量
答案:B 难度:易
考点:1.2章节,理解统计资料分类情况) (
6、病人的疗效分级(全愈、好转、无效)
A 数值变量B 计量资料C 无序分类(两项分类)D 无充分类(多项分类) E 有充分类
答案:E 难度:较易
考点:1.2章节,有序分类资料无法准确定量,又称为等级资料)
7、概率(P ). 的取值范围是
A P≥1 B P5.0%
E. 1.0%
E. >5%
25. 说明两个有关联的同类指标的比即为
A. 率
B. 相对比
C. 构成比
D. 频率
E. 频数
26. 关于相对危险度的正确选项是
A. 无效假设值为0
B. 在调查特定病因的疾病时,比特异危险度更有用
C. 在估计公共卫生措施的影响时比特异危险度更有用
D. 不是流行病学病因调查的恰当指标
E. 上述答案都不是
27. 下面哪一个公式用于计算感染A
A. (受检者中阳性人数/受检人数)X100%
B. (受检者中阳性人数/同期暴露人数)x 100%
C. (受检者中阳性人数/同期平均人数)X 100%
D. (受检者中阴性人数/受检者人数)X100%
E. (某一时期内新病历数/同期平均人数)x 100%
28. 队列研究中D
A. 只能计算比值比,即近似相对危险度
B. 不能计算相对危险度
C. 不能计算特异危险度
D. 既可计算相对危险度,又可计算特异危险度
E. 上述都不是
29. 下列哪条不是回顾性研究的特点C
A. 相对经济
B. 根据结果可以估计相对危险性
C 、可以计算发病率
D. 选择无病者进行对照
E. 暴露因素的估计可能存在偏倚
30. 在以医院为基础进行病例对照研究时,最易出现偏倚的是D
A. 选择偏倚
B. 观察偏倚
C. 混杂偏倚
D. 信息偏倚
E. 上述都不是
31.100个患有某病的病例中,50个有暴露于A 因子的历史,而在200个未患该病的研究对象中,也有50个有A 因子的暴露史,该研究中,暴露于A 因子的相对危险性约为D
A.1. 0
B.1.5
C.2.0
D.3.0
E.5.0
32. 在有500名病例,500名对照的研究中,其中有400名病例,100名对照发现有所怀疑的病因,因此,特异危险性是E
A. 50 %
B. 60%
C. 70%
D. 80 %
E. 所给资料不能计算
33. 某地的一项关于男性膀胱癌与吸烟关系的大规模研究得出,吸烟者膀胱癌的发病率为48.0/10万,非吸烟者的膀胱癌的发病率为25.4/10万,根据以上资料,因吸烟所致的相对危险度为C
A.48
B.22.6
C.1.89
D.32
E.0.5
34. 调查一群健康学生( n> 100),发现收缩压水平呈正态分布,其均数为12-2mmHg , 标准差为13.5mmHg ,则
A. 大约有 2.5%的测量值大于 12-2mmHg
B. 大约有 5 %的测量值小于 122mmHg
C. 大约有 5%的测量值大于 122mmHg
D. 大约有 2.5%的测量值大于 149mmHg
E. 不知道样本大小,不能作出判断
35. 抽样误差的定义为
A. 个体值与样本统计量间的差异
B. 样本统计量之间的差异
C. 样本统计量与总体参数间的差异
D. 总体参数间的差异
E. 个体值与样本统计量间的差异
36. 下列哪些是实现“2000年人人享有卫生保健”的目标最关键的措施B
A. 发动整个社会广泛参与
B. 实施初级卫生保健
C. 增加政府对初级卫生保健的投入
D. 普及全民健康教育
E. 提高全民族素质
第四部分:B1型题
[B1 型题]
以下提供若干组考题,每组考题共用在考题前列出的A 、B 、C 、D 、E5个备选答案,请从中选择一个与问题关系最密切的答案,并在答题卡上将相应题号的相应字母所属方框涂黑。某个备选答案可能被选择一次、多次或不被选择。
A. 率
B. 相对比
C. 构成比
D. 算术平均数
E. 中位数
102. 反映事物发生的强度指标
103. 说明两个同类指标的比
104. 说明某一事物在总体中所占的比重
105. 说明正态分布总体的特征
A. 随机抽样
B. 机械抽样
C. 分层抽样
D. 多级抽样
E. 整群抽样
106. 对某病患病率调查,若在某市许多工厂中抽查一个大工厂,并按不同工种抽取一定比例的工人进行调查,属于E
107. 高发区与低发区各抽查一个县进行肺癌死亡回顾调查,属于D
A. 发病率
B. 患病率
C. 年龄别发病专率或患病专率
D. 年龄别死亡专率或病死专率
E. 相对危险度
108. 下面连接四个问题是美国弗明汉冠心病研究所的有关资料,每个问题,从前面五个指标中选择一个最适合的描述指标B
109. 最初检查时,45—62岁组中,每100人有31人患冠心病A
110. 在研究的头8年期间,每1000个开始时健康的人中,有45人得冠心病
111. 在研究的头8年期间,开始时健康的4500名45—62岁组中,有3人死于急性心肌梗塞。随访5年后,发现重吸烟者心绞痛的发病率是不吸烟者的1. 6倍
A.P P >0.01
C.P >0.01
D.P 0.05
112. 当t >t 0.05,v 时
113. 当t >t 0.01,v 时
114. 当t 40
B.B +c 40
E.B +c≤40
115. 什么情况下需用四格表校正公式
116. 什么情况下需用配对资料的校正公式
117. 行x 列表计算 X2 值,在何种情况下需合并
125.1980年某地2—4岁儿童急性传染病构成表如下:用上表绘制统计图,应该选
A. 直条图
B. 统计地图
C. 线图
D. 半对数线图
E. 构成图
128. 某医师测得100名新生儿童体重均数为3000g ,标准差为100g ,分布范围为2800—3200g 时,其标准正态曲线下的U 值是
A.1.96
B.2.58
C.2.00
D.1.00
E. 以上都不是
129. 在一项药物副作用发生情况的研究中
A. 对照组必须用药
B. 对照组使用安慰剂
C. 是否设立对照组取决于可能发生反映的种类
D. 是否设立对照组取决于研究对象的年龄
E. 设立对照组会使研究者得出错误结论,特别在副作用发生率很低的情况下
130. 某卫生部门设A 地和B 地两个治疗点,其降压治疗高血压的结果如下:该卫生部门没有向A 地推广B 地的经验,这是因为
A. 可能样本太小
B.P 值大小以致不能认为B 优于A
C. 两地的差异仅仅由抽样误差引起
D. 有效率 50%才有意义
E. 应将统计学显著性检验与有效率的差异的实际意义区分开
131. 在某地进行冠心病的发病危险因素的研究,开始时患冠心病的病人在30—40岁的男性中为5/1000,同年龄组的女性的患病率也相同,因此,推论此年龄组男性与女性冠心病的危险性相等,则
A. 正确
B. 不正确,因为使用了患病率而没有使用发病率
C. 不正确,因为两组人群的具体年龄结构可能不同
D. 不正确,因为没有对照组
E. 不正确,应该使用死亡率
132. 一位医师选择了100名被诊断为新生儿黄疸的儿童和同期住院的100名非黄疸儿童,然后调查他们母亲的产科记录和分娩记录,以确定各种产前和围产期的暴露情况,该研究属于B
A. 现况研究
B. 病例对照研究
C. 定群研究
D. 筛检
E. 以上都不是
A1和B1部分答案
1.C 2.A 3.D 4.C 5.D 6.D 7.C 8.E 9.B 10.B ll.B 12.B 13.E 14.A 15.D 16.D 17.E 18.B 19.B 20.D
21.E 22.D 23.E 24.E 25.B 26.B 27.A 28.D 29.C 30.A 31.D 32.E 33.C 34.D 35.C 36.B 37.B 38.B
39.C 40.C 41.A 42.A 43.B 44.C 45.B 46.C 47.D 48.C 49.A 50.A 51.D 52.A 53.B 54.C 55.E 56.B
57.A 58.C 59.B 60.E 61.E 62.B 63.D 64.C 65.C 66.C 67.B 68.A 69.E 70.E 71.C 72.E 73.C 74.E
75.A 76.A 77.D 78.B 79.A 80.A 81.C 82.E 83.A 84.D 85.C 86.B 87.B 88.B 89.E 90.D 91.E 92.E
93.D 94.C 95.B 96.D 97.B 98.A 99.C 100.B 101.E 102.E 103.B 104.C 105.D 106.E 107.D 108.B 109.A 110.D 111.E 112.A 113.D 114.E 115.A 116.E 117.C 118.C 119.D 120.E 121.A 122.C 123.B 124.E 125.E 126.C 127.D 128.C 129.B 130.E 131.B 132.B 133.B
范文五:考研统计学
统计学
统计学(statistics)是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。
统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。
编辑本段发展历程
起源
统计学的英文statistics最早是源于现代拉丁文statisticum collegium (国会统计学相关书籍)以及意大利文statista (国民或政治家)。 德文Statistik,最早是由Gottfried Achenwall(1749)
所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。
统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。
统计学的发展过程的三个阶段
“城邦政情”阶段
“城邦政情”(Matters of state)阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要,其内容包括各城邦的历史,行政,科学,艺术,人口,资源和财富等社会和经济情况的比较,分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算数”这个名词所替代,并且很快被演化为“统计学”(Statistics)。统计学依然保留了城邦(state)这个词根。 “政治算数”阶段
与“城邦政情”(Politcal arithmetic)阶段没有很明显的分界点,本质的差别也不大。
“政治算数”的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。
1690年英国威廉?配弟出版 (政治算数)一书作为这个阶段的起始标志。
威廉?配弟用数字,重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。
因此,威廉,配弟的(政治算数)被后来的学者评价为近代统计学的来源,威廉,配弟本人也被评价为近代统计学之父。
配弟在书中使用的数字有三类:
第一类是对社会经济现象进行统计调查和经验观察得到的数字.因为受历史条件的限制,书中通过严格的统计调查得到的数据少,根据经验得出的数字多;
第二类是运用某种数学方法推算出来的数字。其推算方法可分为三种:
(1)以已知数或已知量为基础,循著某种具体关系进行推算的方法;
(2)通过运用数字的理论性推理来进行推算的方法;
(3)以平均数为基础进行推算的方法”;
第三类是为了进行理论性推理而采用的例示性的数字.配弟把这种运用数字和符号进行的推理称之为“代数的算法”。从配弟使用数据的方法看,“政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点,统计实证方法和理论分析方法浑然一体,这种方法即使是现代统计学也依然继承。
“统计分析科学”阶段
在“政治算数”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。
十九世纪末,欧洲大学开设的“国情纪要”或“政治算数”等课程名称逐渐消失,代之而起的是“统计分析科学”课程。当时的“统计分析科学”(Science of statistical analysis)课程的内容仍然是分析研究社会经济问题。
“统计分析科学”课程的出现是现代统计发展阶段的开端. 1908年,“学生”氏(William Sleey Gosset的笔名Student)发表了关于t分布的论文,这是一篇在统计学发展史上划时代的文章。它创立了小样本代替大样本的方法,开创了统计学的新纪元。
现代统计学的代表人物首推比利时统计学家奎特莱(Adolphe Quelet),他将统计分析科学广泛应用于社会科学,自然科学和工程技术科学领域,因为他深信统计学是可以用于研究任何科学的一般研究方法.
现代统计学的理论基础概率论始于研究赌博的机遇问题,大约开始于1477年。数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。在概率论进一步发展的基础上,到十九世纪初,数学家们逐渐建立了观察误差理论,正态分布理论和最小平方法则。于是,现代统计方法便有了比较坚实的理论基础。 主要术语
统计学(statistics):收集、处理、分析、解释数据并从数据中得出结论的科学。
描述统计(descriptive statistics):研究数据收集、处理和描述的统计学方法。
推断统计(inferential statistics):研究如何利用样本数据来推断总体特征的统计学方法。
变量(variable):每次观察会得到不同结果的某种特征。
分类变量(categorical variable):观测结果表现为某种类别的变量。
顺序变量(rank variable):又称有序分类变量,观测结果表现为某种有序类别的变量。
数值型变量(metric variable):又称定量变量,观测结果表现为数字的变量。
编辑本段统计学的观念
为了将统计学应用到科学,工业以及社会问题上,我们由研究母体开始。这可能是一个国家的人民,石头中的水晶,或者是某家特定工厂所生产的商品。一个母体甚至可能由许多次同样的观察程序所组成;由这种资料收集所组成的母体我们称它叫时间序列。
为了实际的理由,我们选择研究母体的子集代替研究母体的每一笔资料,这个子集称做样本。以某种经验设计实验所搜集的样本叫做资料。资料是统计分析的对象,并且被用做两种相关的用途:描述和推论。
描述统计学处理有关叙述的问题:资料是否可以被有效的摘要,不论是以数学或是图片表现,以用来代表母体的性质,基础的数学描述包括了平均数和标准差。图像的摘要则包含了许多种的表和图。
推论统计学被用来将资料中的数据模型化,计算它的机率并且做出对于母体的推论。这个推论可能以对/错问题的答案所呈现(假设检定),对于数字特征量的估计(估计),对于未来观察的预测,关联性的预测(相关性),或是将关系模型化(回归)。其他的模型化技术包括变异数分析(ANOVA),时间序列,以及数据挖掘。
相关的观念特别值得被拿出来讨论。对于资料集合的统计分析可能显示两个变量(母体中的两种性质)倾向于一起变动,好像它们是相连的一样。举例来说,对于人收入和死亡年龄的研究期刊可能会发现穷人比起富人平均来说倾向拥有较短的生命。这两个变量被称做相关的。但是实际上,我们不能直接推论这两个变量中有因果关系;参见相关性推论因果关系(逻辑谬误)。
如果样本足以代表母体的,那么由样本所做的推论和结论可以被引申到整个母体之上。最大的问题在于决定样本是否足以代表 整个母体。统计学提供了许多方法来估计和修正样本和蒐集资料过程中的随机性(误差),如同上面所提到的透过经验所设计的实验。参见实验设计。
要了解随机性或是机率必须具备基本的数学观念。数理统计(通常又叫做统计理论)是应用数学的分支,它使用机率论来分析并且验证统计的理论基础。
任何统计方法是有效的只有当这个系统或是所讨论的母体满足方法论的基本假设。误用统计学可能会导致描述面或是推论面严重的错误,这个错误可能会影响社会政策,医疗实践以及桥梁或是核能发电计划结构的可靠性。
即使统计学被正确的应用,结果对于不是专家的人来说可能会难以陈述。举例来说,统计资料中显著的改变可能是由样本的随机变量所导致,但是这个显著性可能与大众的直觉相悖。人们需要一些统计的技巧(或怀疑)以面对每天日常生活中透过引用统计数据所获得的资讯。
编辑本段统计方法
1)测量的尺度
统计学一共有四种测量的尺度或是四种测量的方式。这四种测量(名目,顺序,等距,等比)在统计过程中具有不等的实用性 。等比尺度(Ratio measurements)拥有零值及资料间的距离是相等被定义的,等距尺度(Interval measurements)资料间的距离是相等被定义的但是它的零值并非绝对的无而是自行定义的(如智力或温度的测量)。( Ordinal measurements)顺序尺度的意义并非表现在其值而是在其顺序之上。名目尺度(Nominal measurements)的测量值则不具量的意义。
2)统计技术
以下列出一些有名的统计检定方法以及可供验证实验数据的程序
Fisher最小显著差异法(Fisher's Least Significant Difference test )
学生t检验(Student's t-test)
曼-惠特尼 U 检定(Mann-Whitney U)
回归分析(regression analysis)
相关性(correlation)
皮尔森积矩相关系数(Pearson product-moment correlation coefficient)
史匹曼等级相关系数(Spearman's rank correlation coefficient )
卡方分布(chi-square )
编辑本段统计学的创立时期
德国的斯勒兹曾说过:“统计是动态的历史,历史是静态的统计。”可见统计学的产生与发展是和生产的发展、社会的进步紧密相联的。
统计学的萌芽产生在欧洲。17世纪中叶至18世纪中叶是统计学的创立时期。在这一时期,统计学理论初步形成了一定的学术派别,主要有国势学派和政治算术学派。
1、国势学派
国势学派又称记述学派,产生于17世纪的德国。由于该学派主要以文字记述国家的显著事项,故称记述学派。其主要代表人物是海尔曼?康令和阿亨华尔。康令第一个在德国黑尔姆斯太特大学以“国势学”为题讲授政治活动家应具备的知识。阿亨华尔在格丁根大学开设“国家学”课程,其主要著作是《近代欧洲各国国势学纲要》,书中讲述“一国或多数国家的显著事项”,主要用对比分析的方法研究了解国家组织、领土、人口、资源财富和国情国力,比较了各国实力的强弱,为德国的君主政体服务。因在外文中“国势”与“统计”词义相通,后来正式命名为“统计学”。该学派在进行国势比较分析中,偏重事物性质的解释,而不注重数量对比和数量计算,但却为统计学的发展奠定了经济理论基础。但随着资本主义市场经济的发展,对事物量的计算和分析显得越来越重要,该学派后来发生了分裂,分化为图表学派和比较学派。
2、政治算术学派
政治算术学派产生于17世纪中叶的英国,创始人是威廉?配第(1623-1687),其代表作是他于1676年完成的《政治算术》一书。这里的“政治”是指政治经济学,“算术”是指统计方法。在这部书中,他利用实际资料,运用数字、重量和尺度等统计方法对英国、法国和荷兰三国的国情国力,作了系统的数量对比分析,从而为统计学的形成和发展奠定了方法论基础。因此马克思说:“威廉?佩第——政治经济学之父,在某种程度上也是统计学的创始人。”
政治算术学派的另一个代表人物是约翰?格朗特(1620-1674)。他以1604年伦敦教会每周一次发表的“死亡公报”为研究资料,在 1662年发表了《关于死亡公报的自然和政治观察》的论著。书中分析了60年来伦敦居民死亡的原因及人口变动的关系,首次提出通过大量观察,可以发现新生儿性别比例具有稳定性和不同死因的比例等人口规律;并且第一次编制了“生命表”,对死亡率与人口寿命作了分析,从而引起了普遍的关注。他的研究清楚地表明了统计学作为国家管理工具的重要作用。
编辑本段统计学的发展时期
18世纪末至19世纪末是统计学的发展时期。在这时期,各种学派的学术观点已经形成,
并且形成了两个主要学派,即数理统计学派和社会统计学派。 1、数理统计学派
在18世纪,由于概率理论日益成熟,为统计学的发展奠定了基础。19世纪中叶,把概率论引进统计学而形成数理学派。其奠基人是比利时的阿道夫?凯特勒(1796-1874),其主要著作有:《论人类》、《概率论书简》、《社会制度》和《社会物理学》等。他主张用研究自然科学的方法研究社会现象,正式把古典概率论引进统计学,使统计学进入一个新的发展阶段。由于历史的局限性,凯特勒在研究过程中混淆了自然现象和本质区别,对犯罪、道德等社会问题,用研究自然现象的观点和方法作出一些机械的、庸俗化的解释。但是,他把概率论引入统计学,使统计学在“政治算术”所建立的“算术”方法的基础上,在准确化道路上大大跨进了一步,为数理统计学的形成与发展奠定了基础。 2、社会统计学派
社会统计学派产生于19世纪后半叶,创始人是德国经济学家、统计学家克尼斯(1821-1889),主要代表人物主要有恩格尔(1821- 1896)、梅尔(1841-1925)等人。他们融合了国势学派与政治算术学派的观点,沿着凯特勒的“基本统计理论”向前发展,但在学科性质上认为统计学是一门社会科学,是研究社会现象变动原因和规律性的实质性科学,以此同数理统计学派通用方法相对立。社会统计学派在研究对象上认为统计学是研究体而不是个别现象,而且认为由于社会现象的复杂性和整体性,必须地总体进行大量观察和分析,研究其内在联系,才能揭示现象内在规律。这是社会统计学派的“实质性科学”的显著特点。
社会经济的发展,要求统计学提供更多的统计方法;社会科学本身也不断地向细分化和定量化发展,也要求统计学能提供更有效的调查整理、分析资料的方法。因此,社会统计学派也日益重视方法论的研究,出现了从实质性方法论转化的趋势。但是,社会统计学派仍然强调在统计研究中必须以事物的质为前提和认识事物质的重要性,这同数理统计学派的计量不计质的方法论性质是有本质区别的。
迅速发展的统计学
20世纪初以来,科学技术迅猛发展,社会发生了巨大变化,统计学进入了快速发展时期。归纳起来有以下几个方面。
1、由记述统计向推断统计发展。记述统计是对所搜集的大量数据资料进行加工整理、综合概括,通过图示、列表和数字,如编制次数分布表、绘制直方图、计算各种特征数等,对资料进行分析和描述。而推断统计,则是在搜集、整理观测的样本数据基础上,对有关总体作出推断。其特点是根据带随机性的观测样本数据以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。目前,西方国家所指的科学统计方法,主要就是指推断统计来说的。
2、由社会、经济统计向多分支学科发展。在20世纪以前,统计学的领域主要是人口统计、生命统计、社会统计和经济统计。随着社会、经济和科学技术的发展,到今天,统计的范畴已覆盖了社会生活的一切领域,几乎无所不包,成为通用的方法论科学。它被广泛用于研究社会和自然界的各个方面,并发展成为有着许多分支学科的科学。
3、统计预测和决策科学的发展。传统的统计是对已经发生和正在发生的事物进行统计,提供统计资料和数据。20世纪30年代以来,特别是第二次世界大战以来,由于经济、社会、军事等方面的客观需要,统计预测和统计决策科学有了很大发展,使统计走出了传统的领域而被赋予新的意义和使命。
4、信息论、控制论、系统论与统计学的相互渗透和结合,使统计科学进一步得到发展和日趋完善。信息论、控制论、系统论在许多基本概念、基本思想、基本方法等方面有着共
同之处,三者从不同角度、侧面提出了解决共同问题的方法和原则。三论的创立和发展,彻底改变了世界的科学图景和科学家的思维方式,也使统计科学和统计工作从中吸取了营养,拓宽了视野,丰富了内容,出现了新的发展趋势。
5、计算技术和一系列新技术、新方法在统计领域不断得到开发和应用。近几十年间,计算机技术不断发展,使统计数据的搜集、处理、分析、存贮、传递、印制等过程日益现代化,提高了统计工作的效能。计算机技术的发展,日益扩大了传统的和先进的统计技术的应用领域,促使统计科学和统计工作发生了革命性的变化。如今,计算机科学已经成为统计科学不可分割组成部分。随着科学技术的发展,统计理论和实践深度和广度方面也不断发展。
6(统计在现代化管理和社会生活中的地位日益重要。随着社会、经济和科学技术的发展,统计在现代化国家管理和企业管理中的地位,在社会生活中的地位,越来越重要了。人们的日常生活和一切社会生活都离不开统计。英国统计学家哈斯利特说:“统计方法的应用是这样普遍,在我们的生活和习惯中,统计的影响是这样巨大,以致统计的重要性无论怎样强调也不过分。”甚至有的科学有还把我们的时代叫做“统计时代”。显然,20世纪统计科学的发展及其未来,已经被赋予了划时代的意义。
编辑本段社会统计学与数理统计学的统一
据权威统计学史记载,从17世纪开始就有了“政 治 算 术”.“国势学”,既初级的社会统计学,起源于英国.德国。几乎同时在意大利出现了“赌博数学”,既初级的概率论。直到19世纪,由于概率论出现了大数法则和误差理论,才形成了初级的数理统计学。也就是说 :社会统计学的形成早于数理统计学两个世纪。由于社会统计学广泛 地用于经济和政治,所以得到了各国历届政府的极大重视,并得到系统的发展。而 数理统计学在20世纪40年代以后,由于概率论的发展,而得到飞速发展。经过近400年的变迁 ,目前世界上已形成社会统计学与数理统计学两大体系。两体系争论不休,难分伯仲。笔者经过30年的学习与研究,发现了社会统计学与数理统计学的联系和区别。它们的关系与著名的牛顿力学与相对论的关系非常相似。相对论力学在接近光速时使用,而大多数情况是远离光速的,此时使用牛顿力学既准确又方便。如果硬套相对论力学,则是杀鸡用宰牛刀,费力不讨好。社会统计学在描写变量时使用;数理统计学在描写随机变量时使用。
我们知道变量与随机变量是既有联系又有区别的,当变量取值的概率不是1时,变量就变成了随机变量;当随机变量取值 的概率为1 时,随机变量就变成了变量。
变量与随机变量的联系与区别搞清楚了,社会统计学与数理统计学的关系就搞清楚了。以后,在描述变量时,大胆地使用社会统计学;在描述随机变量时,就用数理统计学。如果在描述变量时非用数理统计学,那就是杀鸡用了宰牛刀。近70年,由于数理统计学的飞速发展,大有“吃掉”社会统计学的势头,尤其是以美国为代表的发达国家,几乎认为统计学就是数理统计学。实际上,这是一个极大的误区。笔者的研究已经说明了数理统计学永远“吃不掉”社会统计学,今后的日子,将是社会统计学与数理统计学共存与互补。社会统计学与数理统计学的争论可以结束了。
结束语 “社会统计学与数理统计学的统一”对近四百年历史的统计学进行了科学的疏理,规范了整个统计学的发展,结束了一百年来社会统计学与数理统计学之间的争论。由于经济是通过统计学进行计量和分析的,所以社会统计学与数理统计学的统一,必将从整体上提高经济学的分析水平。 作者简介:王见定.国际统计学会会员.国际著名数学家。见百度百科数学家栏目。
“社会统计学与数理统计学的统一”理论的重大意义
王见定教授指出:社会统计学描述的是变量,数理统计学描述的是随机变量,而变量和
随机变量是两个既有区别又有联系,且在一定条件下可以相互转化的数学概念。王见定教授的这一论述在数学上就是一个巨大的发现。
我们知道“变量”的概念是17世纪由著名数学家笛卡尔首先提出,而“随机变量”的概念是20世纪30年代以后由苏联学者首先提出,两个概念的提出相差3个世纪。截至到王见定教授,世界上还没有第二个人提出变量和随机变量两者的联系、区别以及相互的转化。我们知道变量的提出造就了一系列的函数论、方程论、微积分等重大数学学科的产生和发展;而随机变量的提出则奠定了概率论和数理统计等学科的理论基础和促进了它们的蓬勃发展。可见变量、随机变量概念的提出其价值何等重大,从而把王见定教授在世界上首次提出变量、随机变量的联系、区别以及相应的转化的意义称为巨大、也就不视为过。
下面我们回到“社会统计学和数理统计学的统一”理论上来。王见定教授指出社会统计学描述的是变量,数理统计学描述的是随机变量,这样王见定教授准确地界定了社会统计学与数理统计学各自研究的范围,以及在一定条件下可以相互转化的关系,这是对统计学的最大贡献。它结束了近400年来几十种甚至上百种以上五花八门种类的统计学的混战局面,使它们回到正确的轨道上来。
由于变量不断地出现且永远地继续下去,所以社会统计学不仅不会消亡,而且会不断发展状大。当然数理统计学也会由于随机变量的不断出现同样发展状大。但是,对随机变量的研究一般来说比对变量的研究复杂的多,而且直到今天数理统计的研究尚处在较低的水平,且使用起来比较复杂;再从长远的研究来看,对随机变量的研究最终会逐步转化为对变量的研究,这与我们通常研究复杂问题研究转化为若干简单问题的研究的道理是一样的。既然社会统计学描述的是变量,而变量描述的范围是极其宽广的,绝非某些数理统计学者所云:社会统计学只作简单的加、减、乘、除。从理论上讲,社会统计学应该复盖除了数理统计学之外的绝大多数学学科的运作。所以王见定教授提出的“社会统计学与数理统计学统一”理论,从根本上纠正了统计学界长期存在的低估社会统计学的错误学说,并从理论上和应用上论证了社会统计学的广阔前景。
英文版《社会统计学与数理统计学的统一》一书于2010年6月由中国经济出版社出版,并陆续向国外发行。 该书对有近四百年历史的统计学进行了科学的梳理,规范了整个统计学的发展,结束了一百多年来社会统计学与数理统计学之间的争论。由于经济是通过统计学进行计量和分析的,所以社会统计学与数理统计学的统一,必将从整体上提高经济学的分析水平。 注:该书著者王见定教授是国际统计学会会员,国际著名数学家。 The book "The Unity
of Social Statistics and Mathematical Statistics" was published by China Economic Publishing
House in June 2010 and the book will be put on sale throughout the world.
编号:342705 出版社:中国经济出版社 市场价:80 ISBN:978750179692
学科分支 一些学科大量地利用了应用统计学,以至它们自己已经各自独立成为一门学科。
分支学科
统计学史
理论统计学
统计调查分析理论
统计核算理论
统计监督理论
统计预测理论
统计逻辑学
统计法学
描述统计学
推断统计学
经济统计学
宏观经济统计学
微观经济统计学
管理统计学
科学技术统计学
农村经济调查
社会统计学
教育统计学
文化与体育统计学
卫生统计学
司法统计学
社会福利与社会保障统计学
生活质量统计学
人口统计学
环境与生态统计学
自然资源统计学
环境统计学
生态平衡统计学
国际统计学
国际标准分类统计学
国际核算体系与方法论体系
国际比较统计学 其他学科
生物统计学
商务统计学
工程统计学
心理统计学
化学统计学
档案统计学
社会经济统计学
水文统计学
统计考古学
数理统计学
统计语言学
统计物理学
化学统计学 延伸学科
有些科学广泛的应用统计的方法使得他们拥有各自的统计术语,这些学科包括:
农业科学
生物统计
商用统计
资料采矿(应用统计学以及图形从资料中获取知识)
经济统计学
电机统计
统计物理学
人口统计
心理统计学
教育统计学
社会统计(包括所有的社会科学,
文献统计分析
化学与程序分析(所有有关化学的资料分析与化工科学)
运动统计学,特别是棒球以及曲棍球
统计对于商业以及工业是一个基本的关键。他被用来了解与测量系统变异性,程序控制,对资料作出结论,并且完成资料取向的决策。在这些领域统计扮演了一个重要的角色。
编辑本段统计学在检验过程中的应用
统计学的中心问题就是如何根据样本去探求有关总体的真实情况。因此,如何从一个总体中抽取一些元素组成样本,什么样的样本最能代表总体,这直接影响着统计的准确性。如果抽取元素的方法是使总体中的元素成分不改,所观测到的数值是互相独立的随机变量,并有着和总体一样的分布,这样的样本是一个简单的随机样本,它是总体的最好代表,而取得简单随机样本的过程叫做简单随机取样。
简单随机取样就是重复进行同一随机试验,也就是指每次试验都在同一组条件下进行,因而每次试验得到什么结果,其可能程度都是固定不变的。对于有限总体,简单随机抽样意味着每次抽出一个元素后,放还再抽,若不放还,总体的成分将有所改变,那么再抽时,出现各种结果的可能程度就相对地改变了。至于无限总体则没有区分“放回”或“不放回”的必要。
[1]除以上述原则外,另一方面,获得样本的具体方法能否保证观察值是独立的,这是问题的关键,因此,一样本的随机与否还取决于获得样本的具体方法。
在具体进行取样时,必须根据研究目的的不同,选择不同的取样方法。
?单纯随机取样法先把每个个体编号,然后用抽签的方式从总体中抽取样本。这种方法适用于个体间差异较小、所需抽选的个体数较少或个体的分布比较集中的研究对象。
?分区随机取样法将总体随机地分成若干部分,然后再从每一部分随机抽选若干个体组成样本。这种抽样法可以更有组织地进行,而且中选的个体在总体的分布比单纯随机取样更均匀。
?系统取样法先有系统地将总体分成若干组,然后随机地从第一组决定一个起点,如每组15个元素,决定从第一组的第13个元素选起,那么以后选定的单位即28,43,58,73等等。
?分层取样法根据对总体特性的了解,把总体分成若干层次或类型组,然后从各个层次中按一定比例随机抽选。这种方法的代表性好,但若层次划分得不正确,也不能获得有高度
代表性的样本。
转载请注明出处范文大全网 » 第七版卫生统计学重要定理证明