范文一:统计学作业
作业一
一、单选题
1、对某市分行所辖支行职工工资水平进行调查研究,则统计总体是()。
A、市分行 B 、全部支行 C、全体职工 D、全体职工的全部工资
2、进行金融系统职工普查,则总体单位是()。
A、全部金融机构 B、金融系统的全部职工 C、每个金融机构 D、金融系 统的每个职工
3、银行的储蓄存款余额()。
A、一定是统计指标 B 、一定是数量标志
C 、可能是统计指标,也可能是数量标志 D、既不是统计指标,也不是数 量标志
4、下列标志中,属于品质标志的是()。
A、职称 B 、工资 C、年龄 D、体重
5、下列标志中,属于数量标志的是()。
A、性别 B、职称 C、文化程度 D、体重
6、某记账员的记账差错率是()。
A、数量指标 B、质量指标 C、数量标志 D、品质标志 7、统计学中的变量是指()。
A、数量标志 B、统计指标
C、可变的数量标志和统计指标的统称 D、品质标质、数量标志和指标的 统称
8、一个统计总体()。
A、只能有一个标志 B、只能有一个指标 C、可以有多个标志 D、可 以有多个指标
9、某班 60名学生统计课考试成绩依次是:81分、 92分、 65分、 75分??,这些分数值 是()。
A、指标 B、标志 C、变量 D、变 量值
10、在全国人口普查中()。
A 、“男性”是品质标志 B 、“文化程度”是品质标志 C 、“平均年龄”是数量标志 D 、“性别比”是品质标志
二、判断题(正确的记 T ,错误的记 F )
1、“女性”是品质标志。()
2、变量值是由标志值汇总得来的。()
3、以相对数或平均数表示的指标都是质量指标。()
4、标志的承担者是总体,指标的承担者是单位。()
5、变异是指各种标志(或各种指标)之间名称的差异。()
6、任何一个统计指标值,都是总体在一定时间、地点、条件下的数量表现。()
7、统计是在质与量的辩证统一中,研究社会经济现象质的方面。()
8、构成统计总体的前提条件,是各单位的差异性。()
9、一个统计总体只有一个总体单位总量指标。()
10、变量是指可变的数量标志和统计指标。()
客观题答案分数:
1:C(5分 )
2:D(5分 )
3:C(5分 )
4:A(5分 )
5:D(5分 )
6:C(5分 )
7:C(5分 )
8:D(5分 )
9:D(5分 )
10:B(5分 )
11:F(5分 )
12:F(5分 )
13:T(5分 )
14:F(5分 )
15:F(5分 )
16:T(5分 )
17:F(5分 )
18:F(5分 )
19:T(5分 )
20:T(5分 )
作业二
题目内容:
一、单选题(每小题 4分)
1、重点调查中重点单位指的是()。
A标志总量在总体中占有很大比重的单位
B具有典型意义或代表性的单位
C那些具有反映事物属性差异的品质标志的单位
D能用以推算总体标志总量的单位
2、统计调查误差中的代表性误差()。
A只在重点调查中存在B只在典型调查中存在
C只在抽样调查中存在D存在于所有的非全面调查中
3、工业企业生产设备普查中,工业企业的每一台生产设备是()。
A调查对象B调查单位 C调查项目D填报单位
4、统计调查中的调查项目是()。
A统计分组B统计标志 C统计指标D统计数值
5、统计调查的调查时间主要是指()。
A调查资料所属的时间 B调查工作的整个时限(期限)
C对调查单位的标志进行登记的时间 D以上三个方面时间概念的总称
6、某厂 2001年计划规定工业总产值比 2000年增长 12%,实际执行结果增长了 20%,则 2001年该厂工业总产值计划完成程度为()。
A 108% B 166.7% C 107.14% D 93.33%
7、抽样调查与典型调查的主要区别是()。
A灵活机动的程度不同 B涉及的调查范围不同
C对所研究总体推算方法不同 D确定所要调查的单位方法不同
8、要了解某批灯泡的平均寿命,可采用的调查组织方式是()。
A抽样调查B重点调查 C普查D全面调查
9、下列指标属于比例相对指标的是()。
A 工人出勤率 B 农轻重的比例关系
C 每百元产值利税额 D 净产值占总产值的比重
10、 9、某地区 2000年底有 1000万人口,零售商店数有 5万个,则商业网点密度指标 为()。
A 5个 /千人 B 0.2千人 /人 C 200个 /人 D 0.2个 /千人 11、 调查大庆、 胜利等几个主要油田来了解我国石油生产的基本情况, 这种调查方法属于 () 。 A普查B典型调查 C重点调查D抽样调查
12、对某工业企业的下述情况适宜于连续登记的是()。
A产品产量B厂房面积 C职工人数D生产设备数
13、 我国第五次人口普查规定的标准时间是 2000年 11月 1日零时, 下列情况不应计算人口 数的有()。
① 2000年 11月 2日出生的婴儿
② 2000年 10月 29日 21时出生, 11月 1日 8时死亡的婴儿
③ 2000年 10月 29日 23时死亡的人
④ 2000年 10月 29日 8时出生, 20时死亡的婴儿
⑤ 2000年 11月 1日 1时死亡的人
A①②③④⑤B①③⑤C①③④D①②⑤
14、按连续型变量分组,末组为开口组,下限为 2000,已知相邻组的组中值为 1750, 则末组组中值为()。
A 2500 B 2250 C 2100 D 2200
15、用组中值反映分组在该组中各单位变量值的一般水平,是因为()。
A组中值就是组内各单位变量值的平均数
B组中值比组内各单位变量值的平均数更有代表性
C组中值更有代表性
D无法计算组内值各单位变量值的平均数
二、判断题(正确的记 T ,错误的记 F )(每小题 4分)
1、调查单位与报告单位可以一致也可以不一致。()
2、复合分组就是对总体按两个或两个以上的标志进行分组。()
3、如果计划完成程度指标大于 100%,则表示完成计划任务了。()
4、某地区 2000年人均粮食产量 1600千克,这不是一个平均指标。 ()
5、重点调查和抽样调查都是非全面调查,其调查结果都可以用于推算总体指标。()
6、人口普查中规定标准时点,其主要目的是为了争取调查时效性。()
7、典型调查与重点调查的区别在于调查单位数的多少不同。()
8、如果调查对象各单位的标志值没有明显差别,则不能运用重点调查。()
9、年末人口数是时点指标,而出生人口数是时期指标。 ()
10、对于连续组距数列的交界点,一般采用“上组限不在内原则”确定所属组。() 客观题答案分数:
1:A(4分 )
2:C(4分 )
3:B(4分 )
4:B(4分 )
5:D(4分 )
6:C(4分 )
7:D(4分 )
8:A(4分 )
9:B(4分 )
10:A(4分 )
11:C(4分 )
12:A(4分 )
13:C(4分 )
14:B(4分 )
15:D(4分 )
16:T(4分 )
17:F(4分 )
18:F(4分 )
19:T(4分 )
20:F(4分 )
21:F(4分 )
22:F(4分 )
23:T(4分 )
24:T(4分 )
25:T(4分 )
作业 3
题目内容:
一、单选题(每小题 5分)
1、一组数据排序后处于 25%和 75%位置上的值称为()
A 、众数 B 、中位数 C 、四分位数 D 、均值
2、有 8名研究生的年龄分别为 21, 24, 28, 22, 26, 24, 22, 20岁,则他们的年龄中位数 为()
A 、 24 B 、 23 C 、 22 D 、 21
3、如果你的业务是提供足球运动鞋的号码,那么,哪一种平均指标对你更有用?() A 、算术平均数 B 、几何平均数 C 、中位数 D 、众数
4、某组数据呈现右偏分布时,该数据的众数、中位数、均值的大小关系是()
A 、众数>中位数>均值 B 、均值>中位数>众数
C 、中位数>众数>均值 D 、中位数>均值>众数
5、设某企业在基期老职工占 60%,而在报告期准备招收一批青年工人,估计新职工所占的 比重将比原来增加 20%。假定老职工和新职工的工资水平不变,则全厂职工的总平均工资 将如何变化()。
A 提高B降低C不变D无法判断
6、仅从数量关系上来考虑,用同一资料计算算术平均数()、调和平均数(H )和几何 平均数(G )有如下关系()。
A <> C ≥ G ≥ H D ≤ H ≤ G 7、对某一时间序列拟合的直线趋势方程为 ,如果该数列中没有趋势,则 b 的值 应该() A 、接近 1 B 、小于 1 C 、接近 0 D 、小于 0 8、某种股票的价格周二上涨了 10%,周三上涨了 5%,两天累计张幅达() A 、 15% B 、 15.5% C 、 4.8% D 、 5% 9、某月商品销售额为 84万元,该月的季节指数为 1.2,消除季节因素后该月销售额为() A 、 70万元 B 、 60万元 C 、 90.8万元 D 、 100.8万元 10、以知动态数列的数据有 50项,若采用 8项移动平均的方法进行长期趋势的预测,则修 匀后的趋势数列的项数是()。 A 42 B 43 C 44 D 40 二、判断题(正确的记 T ,错误的记 F )(每小题 5分) 1、按人口平均计算的国民收入是算术平均数。 () 2、根据组距数列计算达到的平均数,只是个近似值。() 3、若标准差系数越大,说明其平均数的代表性越好。() 4、时间数列各期的增长量相等且为正数,则各期的增长速度递减。() 5、用移动平均法测定长期趋势时,其移动平均的项数是越多越好。() 6、定基增长速度是环比增长速度的连乘积。() 7、 按几何平均法计算平均发展速度, 若基期水平等于报告期水平, 则平均发展速度为 1。 () 8、若时间数列逐期增长量的逐期增长量大致相等,可以拟合二次曲线。() 9、计算“同比增长”指标,主要是为了消除季节因素的影响。() 10、若 A 、 B 、 C 三个公司的利润计划完成程度分别为 95%、 100%和 105%,则这三个 公司平均的利润计划完成程度应为 100%。() 客观题答案分数: 1:C(5分 ) 2:B(5分 ) 3:D(5分 ) 4:B(5分 ) 5:B(5分 ) 6:C(5分 ) 7:C(5分 ) 8:B(5分 ) 9:A(5分 ) 10:A(5分 ) 11:F(5分 ) 12:T(5分 ) 13:F(5分 ) 14:T(5分 ) 15:F(5分 ) 16:F(5分 ) 17:T(5分 ) 18:T(5分 ) 19:T(5分 ) 20:F(5分 ) 作业 4 题目内容: 一、单选题(每小题 5分) 1、某企业利润总额与上年相比增长了 10%,职工人数增长了 5%,则该企业工人劳动 生产率增长了() A . 15. 5%B . 5%C . 4. 76%D . 15% 2、平均指标指数是() A .两个总量指标对比形成的指数 B .两个相对指标对比形成的指数 C .两个平均指标对比形成的指数 D .两个个体指数对比形成的指数 3、在编制综合指数时,要求指数中分子和分母的权数必须是() A 、同一时期的 B 、不同时期的 C 、基期的 D 、报告期的 4、 某商场今年与去年相比, 销售量增长了 15%, 价格增长了 10%, 则销售额增长了 () A 、 15.% B 、 26.5% C 、 24.5% D 、 14.5% 5、价格上涨后,同样多的人民币报告期所购买商品的数量比基期少 5%,因此价格上 涨了() A 、 5% B 、 5.26% C 、 4.74% D 、 105.26% 6、某企业最近几批产品的优质品率分别为 88%, 85%, 91%,为了对下一批产品的优 质品率进行抽样检验,确定必要的抽样数目时, P 应选() A 、 85% B 、 87.7% C 、 88% D 、 90% 7、在其他条件不变的情况下,要使置信区间的宽度缩小一半, 样本容量应为原来的 () A 、一半 B 、一倍 C 、三倍 D 、四倍 8、在其他条件不变时,置信度(1– α)越大,则区间估计的() A 、误差范围越大 B 、精确度越高 C 、置信区间越小 D 、可靠程度越低 9、估计量的一致性是指当样本容量足够大时,抽样指标() A、等于总体指标B、其平均数等于总体指标 C、其平均数充分靠近总体指标D、本身充分靠近总体指标 10、一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是() A 、简单随机抽样 B 、分层抽样 C 、等距抽样 D 、整群抽样 二、判断题(正确的记 T ,错误的记 F )(每小题 5分) 11、综合指数和平均指数都是总指数。() 12、每个职工的工资都增加了,则平均工资指数一定大于 100%。() 13、价格上升 20%,销售额下降 20%,则销售量指数等于 100%。() 14、编制综合指数时,同度量因素固定的时期不同,所得的计算结果也不相同。() 15、可以通过调整总体方差的方法控制抽样误差。() 16、区间估计的准确性和可靠性不能同时达到最优。() 17、抽样标准误差一定比总体标准差小。() 18、从理论上讲,样本容量确定时,抽样标准误差是一个唯一确定的值。() 19、抽样误差的产生是由于破坏了随机原则所造成的。() 20、当总体单位数很大但分布不均匀时,不宜采用抽样调查方法。() 客观题答案分数: 1:C(5分 ) 2:C(5分 ) 3:A(5分 ) 4:B(5分 ) 5:B(5分 ) 6:A(5分 ) 7:D(5分 ) 8:A(5分 ) 9:D(5分 ) 10:D(5分 ) 11:T(5分 ) 12:F(5分 ) 13:F(5分 ) 14:T(5分 ) 15:F(5分 ) 16:T(5分 ) 17:T(5分 ) 18:T(5分 ) 19:F(5分 ) 20:F(5分 ) 第一章 绪论 一、什么是教育统计学 1.什么是统计学 统计学是研究统计原理和方法的科学。它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。 统计学的分为数理统计学和应用统计学两类。 2.什么是教育统计学 教育统计学是运用数理统计的原理和方法研究教育问题的一门应用科学。 教育统计学的主要任务是研究如何搜集、整理、分析由教育调查和教育实验等途径所获得的数字资料,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律。 3.统计学和教育统计学的内容 (1)描述统计 对已获得的数据进行整理、概括,显现其分布特征的统计方法,称为描述统计。包括归组、编表、绘图等数据整理工作和计算各种特征量反映其分布特征。 (2)推断统计 根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测,这种统计方法称为推断统计。包括总体参数估计和假设检验两部分。 (3)实验设计 实验者为了揭示实验中自变量与因变量的关系,在实验之前所制订的实验计划,称为实验设计。包括抽样设计、样本容量计算、确定实验对照形式、实现实验组和对照组的等组化、安排实验因素、控制无关因素以及用什么统计方法处理及分析实验结果等等。 (4)三者的关系 描述统计是推断统计的基础,推断统计通过样本信息估计、推测总体,从已知情况估计、推测未知情况。良好的实验设计才能使我们获得真实的有价值的数据,对这样的数据进行统计处理才能得出正确的结论。 二、统计学中的几个基本概念与符号 1.随机变量 (1)随机现象与随机事件:随机现象具有以下三个特征:一次试验有多种可能结果,其所有可能结果是已知的;试验之前不能预料哪一种结果会出现;在相同的条件下可以重复试验。随机现象的每一种结果叫做一个随机事件。 (2)随机变量:这些随机事件在一次试验中,可能出现,也可能不出现,而在大量重复试验中,它们的发生却具有一定的规律性。我们把能表示随机现象各种结果的变量称为随机变量。统计处理的变量都是些随机变量。每个随机事件往往表现为一种数值。对于不是以数值表示的随机事件,可以将之数量化。 (3)变量的类型 ①离散变量/间断变量:数据的取值只能在固有的单位上计算,而不能划分更小的单位。如人数、名次、等级。 ② 连续变量:数据的取值不仅可以在固有单位上计算,而还能划分为其他若干单位。 教材23页练习2:识别下列观察值所属的变量是连续变量还是间断变量。 2.总体、样本和个体 (1)总体:具有某种共同特性的个体的总和。(人+物) (3)样本:从总体中抽取的作为观察对象的一部分个体。 (4)样本中包含的个体数目称为样本的容量,一般用n表示。样本中个体数目大于30一般称为大样本,等于或小于30称为小样本。在有些情况下对数据进行统计处理时,大样本和 小样本所用的统计方法并不相同。 3.统计量和参数 (1)统计量:样本上的数字特征。也就是说,根据实得的数据所计算出的能够描述这组数据各种特征的数量。 (2)参数:总体上的各种数字特征。也即反映总体上各种特征的数量是参数。 第二章 数据的初步整理 一、统计表 1.定义 统计表是用来表达统计指标与被说明的事物之间数量关系的表格。 2.统计表的结构 统计表一般由标题、表号、标目、线条、数字、表注等项构成。 3.编制统计表的基本原则 简单明了 (1)一表一中心;(2)层次清楚,编排合理。 4. 编制统计表的基本要求 (1)标题:简明扼要地说明表的内容,写在表的上方。 (2)表号:表的序号,写在标题的左方。 (3)标目:可分为横标目和纵标目。一般把主语(统计表叙述的对象)放在横标目上,谓语(用以叙述的统计指标)放在纵标目上。 (4)线条:线条不宜过多。 顶线、底线、隔开纵标目与数字的横线、隔开横标目与数字的纵线,是表的四种基本线条。表左上角不宜有斜线,中间不要有横线,左右两侧不要用纵线封闭。 (5)数字:数字一律用阿拉伯数字表示,位次对齐,小数位数一致。表内不应有空格。暂缺或未记录可用“?”或“??”表示,无数字用“—”表示,数字若是“0”,则应填写“0”。 (6)表注:不是表的必要组成部分,可用简短的小号字写在表的下方。 5.频数分布表列法 某一个随机事件在n次试验中出现的次数称为这个随机事件的频数。各种随机事件在n次试验中出现的次数分布称为频数分布。将其用表格形式表示出来称为频数分布表。 (1)简单频数分布表 ①间断变量的频数分布表(直接登记) ②连续变量的频数分布表(求全距→决定组数和组距→决定组限→登记频数) (2)累积频数和累积百分比分布表 ①累积频数分布表②累积百分比分布表 二、统计图 1.定义 统计图是用来表达统计指标与被说明的事物之间数量关系的图形。在运用统计图时,一般附有统计表。 2.统计图的结构 统计图由标题、图号、标目、图形、图注构成。 3.编制统计图的基本规则 (1)标题:图的名称简明扼要,图题的字体在图中为最大,自左向右写在图的下方。 (2)图号:图号写在图题的左前方。 (3)标目:对于有纵横轴的统计图,应在纵横轴上分别标明统计项目及其尺度。横轴是基线,一般表示被观察的现象,尺度要等距,自左向右,由小到大,写在横轴的下方。纵轴是 尺度线,尺度从0开始,自下而上,从小到大,写在纵轴的左侧。两个轴都要注明单位。 (4)图形:图形线条应最粗,基线和尺度线次之。图形的高与宽之比以3比5为宜。在一幅图中若有几个图形线相比较,可以用不同图形线加以区别,各种图形线的含义可用图例在适当位置加以标明。 (5)图注:图注的组成文字要简明扼要,字体要小,写在图题的下方。 4.表示间断变量的统计图 (1)直条图 直条图是用直条的长短表示统计事项数量的图形。它主要是用来比较性质相似的间断性资料。 (2)圆形图 圆形图是用来表示间断性资料构成比的图形。圆形的面积表示一组数据的整体,圆中扇形表示各组成部分所占的比重。各部分比重一般用百分比表示。 5.表示连续变量的统计图 (1)线形图 线形图用来表示连续性资料。 (2)频数分布图 ①直方图 ②多边图 ③累积频数和累积百分比多边图 附录三 英汉医学统计学词汇 abridged life table 简略寿命表coefficient of determination 决定系数accuracy actual adjusted frequency adjusted rate agreement age age _specificdeath rate alternative _specificanalysis of _forfertility variance m reliability rate arcsine (A NOVA ) arithmetic transformation average mean bar baseline chart Bernoulli hazard trial function bias binomial biostatistics distribution block blind method box plot case case control study categorical fatality cause cause eliminated data life censored _specificdeath rate table censored data central value child tendency child_womenmortality chi circular _squarevalidity test ratio under age 5class classification interval clinical cluster cluster analysis trial Cochran sampling Armitage trend test 准确度实际频数调整率 调整一致性年龄别死亡率年龄别生育率复本信度方差分析算术均数反正弦转换 平均数条图 基线风险函数贝努利试验偏倚二项分布盲法生物统计学 区组 箱式图病例对照研究病死率分类资料 去死因寿命表死因别死亡率截尾数据截尾值5集中趋势 儿童妇女比岁以下儿童死亡率χ2 检验 循环效度组距分组 临床试验聚类分析 Cochran 整群抽样 Armitage 趋势检验coefficient correlation of product_momentcoefficient coefficient of regression cohort cohort life of variation combined study table com mon munity factor /pooled variance complete com data intervention t rial complete completely life concordance randomized table correlation design concurrent validity coefficient confidence confidence confounding limit interval confounding bias construct validit factor y content content validity validity ratio continuous contraceptive life table contraceptive failure control prevalence rate convergent correction for validit continuit y covariance analysis y Cox covariance regression cross_overcriterion_relateddesign validity crude cross_sectionalbirth rate study crude cu mulative death rate mulative failure probability rate cure cu rate of survival current life table 积矩相关系数回归系数变异系数队列研究定群寿命表 合并方差公共因子完全数据 社区干预试验完全寿命表 完全随机设计同时效度一致性相关系数 可信区间可信限混杂性偏倚混杂因素结构效度内容效度 内容效度比连续寿命表避孕失败率避孕现用率对照聚合效度 连续性校正协方差分析协方差Cox 效标关联效度回归 交叉设计粗出生率横断面研究 粗死亡率累计失败率治愈率 累积生存概率现时寿命表 附录三 英汉医学统计学词汇 curve fitting 曲线拟合hazard function 风险函数 305 data cut off point death and variable degree event dependency of freedom variable ratio design dependent diagnostic diagnostic index discrete test discriminant data discriminant analysis dispersion validity double blind method effect eligibility size validit criteria equivalence empirical y error test evidence exclusion _basedmedicine experimen criteria experimen t tal design study face factor validit y factorial factorial design failure event validit y fall false safe false _negativenumber finite _positive Fisher population ’s exact probabilities correction fixed forest effect fourfold plot model frequency table frequency table funnel plot Gehan general score fertilit test geometric y rate gold gross standard mean reproduction rate 临界点资料和变量死亡事件自由度抚养比应变量设计诊断指数诊断试验判别分析离散型资料 判别效度离散程度双盲法效应尺度入选标准经验效度等效检验误差循证医学排除标准实验设计实验性研究表面效度因素析因设计因子效度失效事件假阴性失安全系数假阳性有限总体校正 固定效应模型Fisher 确切概率法森林图四格表频数表频数漏斗图总生育率Gehan 比分检验 几何均数金标准粗再生产率 health histogram statistics homogeneity hypothesis test incidence inclusion incremental criteria independent validity variable infant induced abortion rate inferential mortality rate intention interaction to statistics treat intercept internal International consistent Classification reliability inter_quarinter_ratertile reliability range of Disease interval intra _classestimation intrinsic validity correlation coefficient least least significant life square method difference t test life expectancy life_tabletable method line life_timegraph fertility rate linear correlation linear linear regression regression equation logarithmic logistic transfor log_rankregression mation lost to test lo wer limit follow_upmain maternal effect maximum mortalit likelihood y rate McNemar ’s test method mean mean length of generation measurement median survival bias time 直方图 卫生统计学方差齐性假设检验发病率纳入标准增量效度自变量人工流产率婴儿死亡率统计推断交互作用意向性分析 截距内部一致性信度国际疾病分类四分位数间距评价者信度区间估计内在效度 组内相关系数最小显著差异最小二乘法t 检验 预期寿命寿命表寿命表法线图 终生生育率直线相关直线回归直线回归方程 对数转换 logistic 对数秩检验回归失访下限主效应孕产妇死亡率极大似然法McNemar 平均世代年数检验 均数测量性偏倚 中位生存时间 306 median 中位数 附录三 英汉医学统计学词汇 percent bar chart 百分比条图 medical medical reference reference range M eta analysis value model morbidity life table mortality probability statistics mortality multiple multiple comparison rate multiple correlation coefficient multivariate linear analysis regression natural negative increase rate negative correlation negative likelihood ratio negative neonatal skew predictive value net nomenclat reproduction mortality ure of rate rate nonparametric test disease non_probabilitynormal sampling null distribution number hypothesis number of dying number of numerical of survival variable survivors person_yearsoblique observational rotation one optimum sample allocation t _teststudy ordinal ordinal categories orthogonal data orthogonal design outlier table overall survey paired paired design parallel t _test parallel test partial _formcorrelation reliability Pearl pregnancy rate coefficient per protocol analysis 医学参考值范围医学参考值模型寿命表Meta 分析 疾病统计死亡概率死亡率多重比较 复相关系数多因素分析多元线性回归 自然增长率负相关阴性似然比阴性预测值负偏态 新生儿死亡率净再生产率疾病命名非参数检验非概率抽样正态分布无效假设死亡人数尚存人数生存人年数 数值变量斜交旋转观察性研究最优分配单样本t 检验 有序分类等级资料正交设计正交表异常点普查配对设计平行试验配对t 检验 平行信度 偏相关系数 符合方案集分析 Pearl 怀孕率 percentile perfect perfect perinatal positive negative correlation correlation pie mortality placebo chart point estimation polynomial Poisson distribution population regression population pyramid positive positive correlation positive likelihood predictive ratio positive skew value precision po wer of a test predicted predictive value prevalence validit y principal probabilit component probabilit y y of analysis sampling dying probabilit product proportion _limity proportion of estimate child and adolescent proportion of proportional of lo w birth weight proportional allocation old population prospective hazard regression model publication study bias quantitative questionnaire data questionnaire survey random random effect randomized sampling model randomized allocation randomized block randomized control design randomized double blind trial control trial range response technique rank rank correlation sum test 百分位数完全负相关完全正相关圆图 围产儿死亡率安慰剂点估计泊松分布 多项式回归人口金字塔总体正相关 阳性似然比阳性预测值正偏态精确度检验效能 预测值患病率预测效度主成分分析死亡概率概率抽样概率乘积极限法 少年儿童系数老年人口系数低体重出生百分比 按比例分配前瞻性研究比例风险回归模型 发表偏倚定量资料问卷调查问卷 随机效应模型随机抽样随机分配 随机区组设计随机对照试验随机应答技术随机双盲对照试验 全距秩相关 秩和检验 附录三 英汉医学统计学词汇 rank 秩statistical map 统计地图 307 rate ratio difference ratio of ratio of birth of contraception control induced control ratio of old to young abortion and live birth receiver reciprocal operator characteristic cur ve reliabilit transformation reliabilit y repeated y coefficient research measurement residual hypothesis residual plot risk retrospective set study sample sample size sampling sampling error sampling fraction sampling frame scatter survey screening plot selection semi bias sensitive _logarithmicline graph sensitivity question series sequential t rial sex sex_specificratio test significance death random level rate specificity simple sampling split_halfsquare root reliability stability transformation standard standard deviation standard deviation of residuals standard error standardization normal distribution standardized standardized mortalit y ratio statistical graph rate 率差 节育率 计划生育率人工流产比ROC 老少比 倒数转换曲线信度系数信度重复测量研究假设残差图残差回顾性研究危险集样本样本含量抽样误差抽样比抽样框架抽样调查散点图筛检 选择性偏倚半对数线图敏感问题灵敏度序贯试验系列试验性别比性别死亡率检验水准特异度单纯随机抽样分半信度稳定性平方根转换标准差剩余标准差 标准误 标准正态分布标准化法标准化率标准化死亡比 统计图statistical statistical significance table statistics statistical validity stepwise stratified regression stratum sampling sum sum of squares for regression sum of survey of squares squares for residuals survival survival analysis survival curve survival data survival rate probability survival systematic time systematic review sampling target test population test theoretical _retestof homogeneit reliabilit y frequency y total total fertilit y rate trait truncate validity variation t w o _samplelife t table t ype Ⅰerror _testt t ype ypical Ⅱsurvey error underlying unordered death cause upper limit categories validity variance variation varimax rotation weight method Youden ’s index zero correlation 统计表统计学意义统计学 统计效度逐步回归分层抽样层 回归平方和残差平方和调查 离均差平方和生存分析生存曲线生存资料生存概率生存率生存时间系统抽样系统性综述 目标总体重测信度同质性检验 理论频数总变异 总和生育率特征效度 成组截缩寿命表 Ⅰt Ⅱ型错误检验典型调查型错误 根本死因无序分类上限效度方差变异 变异最大旋转加权法 Youden 指数零相关 第一章 概论 一、什么是生物统计学?生物统计学主要内容和作用? 1、生物统计学是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。属于生物数学的范畴 2、主要内容 基本原则对比设计 试 验 设 计方案制定随机区组设计 常用试验设计方法裂区设计 资料的搜集和整理拉丁方设计、正交设计 统 计 分 析数据特征数的计算 统计推断、方差分析 协方差分析、回归和相关分析 3、生物统计学的基本作用: (1)提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征 (2)运用显著检验,判断试验结果的可靠性或可行性 (3)提供由样本推断总体的方法 (4)提供试验设计的一些重要原则 二、解释概念:总体、个体、样本、变量、参数、统计数、效应、试验误差 总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全体; 个体:组成总体的基本单元称为个体 样本:从总体中抽出若干个体所构成的集合称为样本 变量:变量,或变数,指相同性质的事物间表现差异性或差异特征的数据 参数:描述总体特征的数量称为参数,也称参量 统计数:描述样本特征的数量称为统计数,也称统计量 效应:通过施加试验处理,引起试验差异的作用称为效应 试验误差:误差也称为实验误差,是指观测值偏离真值的差异,可分为随机误差和系统误差 三、准确性与精确性有何区别? 准确性,也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。 精确性,也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。准确性反应测量值与真值符合程度的大小,而精确性则是反映多次测定值的变异程度。(具体在课本第7页) 第二章 样本统计量与次数分布 一、算数平均数与加权平均数形式上有何不同?为什么说它们的实质是一致的? 1. 算术平均数 定义:总体或样本资料中所有观测数的总和除以观测数 的个数所得的商,简称平均数、均数或均值 直接计算法或减去(加上)常数法 加权平均数 2、实质是一样的,是因为它们都反映的一组数据的平均水平 二、为了评价两种药物对于小鼠体重的影响,随机从两组各抽出20只测定其体重(g),结果如下: 药物A处理组: 15, 15, 23, 24, 26, 25, 22, 19, 15, 17, 15, 20, 23, 21, 19, 22, 26, 21, 18, 23 药物B处理组: 31, 28, 26, 31, 28, 34, 32, 29, 32, 35, 28, 29, 33, 30, 34, 32, 36, 38, 40, 38 试从平均数、极差、标准差、变异系数几个指标评价两种药物对于小鼠体重的影响,并给出结论。详细结果略,本题考查平均数(P22)、极差(P24)、标准差(P25)、变异系数(P27)等特征数 第三章 概率与分布 一、试解释必然事件、不可能事件、随机事件、频率、概率、正态分布、抽样误差、标准误? 必然事件:在一定条件下必然出现的现象称为必然事件 不可能事件:在一定条件下必然不出现的事件称为不可能事件 随机事件:在某些确定的条件下,可能出现也可能不出现的现象,称为随机事件,简称“事件” 频率:若在相同的条件下,进行了n次试验,在这n次试验中,事件A出现的次数m称为事件A出现的频数,比值m/n称为事件A出现的频率,记为W(A)=m/n 0≤W(A) ≤1 概率:概率的统计定义:设在相同的条件下,进行大量重复试验,若事件A的频率稳定地在某一确定值p的附近摆动,则称p为事件A出现的概率。 P(A) = p 正态分布:正态分布也称为高斯分布,是一种连续型随机变量的概率分布。它的分布状态是多数变量值都围绕在平均值左右,由平均值到分布的两侧,变量数减少 抽样误差:由这些样本算得的平均数有大有小,不尽相同, 与原总体均数μ相比往往表现出不同程度的差异。这种差异是由随机抽样造成的, 称为抽样误差 标准误: 标准误,平均数抽样总体的标准差),标准误的大小反映样本平均数的抽样误差的大小,即精确性的高低 2、已知u服从标准正态分布N(0,1),试查表计算下列各小题的概率值: (1) P(0.3 (2) P (-1 (3) P (-1.96 (4) P (-2.58 (注:此类题计算方法见课本P43例3.9) 第四章 统计推断 一、什么是统计推断?统计推断有哪几种,含义是什么? 统计推断:由一个样本或一糸列样本所 得的结果来推断总体的特征,主要包括假设检验和参数估计两个方面 假设检验:假设检验又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断 参数估计:参数估计是统计推断的另一个方面,它是指由样本结果对总体参数在一定概率水平下所作出的估计,参数估计包括区间估计和点估计。参数的区间估计和点估计是建立在一定理论分布基础上的一种方法 二、什么是小概率原理?它在假设检验中有何作用? 小概率原理:如果假设一些条件,并在假设的条件下能够准确地算出事件A出现的概率α 为很小,则在假设条件下的n次独立重复试验中,事件A将按预定的概率发生,而在一次试验中则几乎不可能发生 作用:在假设检验中,根据小概率原理 计算出的可能性若小于α 则否定原假设 ,若大于α 则接受原假设 三、用中草药青木香治疗高血压,记录了13个病例,所测定的舒张压(mmHg)数据如下: 试检验该药是否具有降血压作用? 分析:该题考查的是成对资料平均数的假设检验,用t检验法;检验该药是否具有降血压作用,故用单尾检验 答案:t=5.701,否定H0,接受HA,即该药具有降血压的作用 (注:此类题详细解题步骤见课本P68例4.11) 4、调查了甲、乙两医院乳腺癌手术后5年的生存情况,甲医院共有 755例,生存数为485人,乙医院共有383例,生存数为257人,问 两医院乳腺癌手术后5年生存率有无显著差异? 分析:两个样本频率的假设性检验;np和nq>30,无需连续性矫正,用u检验;事先不知道两个生存率孰高孰低,用双尾检验 答案:u=-0.958 ,接收H0,否定HA,即两医院乳腺癌手术后5年生存率无显著差异 (注:此类题型详解见课本P72例4.14、例4.15;例4.14是不需要连续性矫正的情况,例4.15是需要连续性矫正的情况) 第五章 χ2 检验 一、χ2主要有几种用途?各自用于什么情况下的假设检验? χ2检验的用途:适合性检验(也称吻合度检验)、独立性检验 、同质性检验 (1)适合性检验 比较观测数与理论数是否符合的假设检验 用途:遗传学中用以检验实际结果是否符合遗传规律 、样本的分布与理论分布是否相等 、自由组合定律 (2)独立性检验 是指研究两个或两个以上的计数资料或属性资料之间是相互独立的或者是相互联系的假设检验,通过假设所观测的各属性之间没有关联,然后证明这种无关联的假设是否成立 (3)同质性检验 在连续型资料的假设检验中,对一个样本方差的同质性检验,也需进行χ2 检验 (课本P78—P80是样本方差的同质性检验,个人觉得考的几率不大) 二、有一大麦杂交组合,F2的芒性状表型有钩芒、长芒和短芒三种,观察其对应株数为348,115,157。试检验其比率是否符合9:3:4的理论比率 分析:此题为χ2适合性检验 答案:χ2=0.041,χ20.05=3.84;χ2<χ20.05,p>0.05,接收H0,否定HA,即大麦F2的比率符合9:3:4的理论比率 (注:df=1时,需进行连续性矫正;课本P85例5.1、P87例5.3) 对于资料数多于两组的值,可以用下列简式: (课本P87例5.3) 三、某仓库调查不同品种苹果的耐储藏情况,随机抽取“国光”苹果200个,腐烂14个;“红富士”苹果178个,腐烂16个,试问这两种苹果的耐贮性差异是否显著? 分析:次题为χ2独立性检验 (2×2 列联表的独立性检验) 答案:χ2=0.274,χ2<χ20.05,p>0.05, 接收H0,否定HA,即这两种苹果的耐贮性差异与苹果种类无关 (注:此类题型见课本P88例5.4) 2×2 列联表需要进行连续性矫正,简式为 (课本P882×2 列联一般形式、例5.4) 2×c列联表不需要进行连续性矫正,简式为 r×c列联表不需要进行连续性矫正 第六章 方差分析 一、什么是方差分析?方差分析的基本思想与一般步骤? 方差分析又叫变量分析,它是用以检验两个或多个均数间差异的假设检验方法。它是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸 基本思想:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小 总变异来源于处理效应和实验误差 一般步骤:(1)平方和计算 (2)自由度计算 (3)计算方差 (注:详见课本P99例6.1) 二、什么是多重比较?多重比较有哪些方法? 多重比较:要明确不同处理平均数两两间差异的显著性,每个处理的平均数都要与其他的处理进行比较,这种差异显著性的检验就叫多重比较; 统计上把多个平均数两两间的相互比较称为多重比较。 方法: 最小显著差数法 (LSD法 )和最小显著极差法(LSR法) LSD法的实质是两个平均数相比较的t检验法、 LSR法克服了LSD法的局限性,采用不同平均数间用不同的显著差数标准进行比较,它可用于平均数间的所有相互比较 三、为了研究氟对种子发芽的影响,分别用四种不同浓度的氟化钠溶液处理种子,随后进行发芽试验(每盆50粒,每处理重复三次),观察它们的发芽情况,测得芽长如下表。试作方差分析,并用LSD法、SSR 法和q法分别进行多重比较 四、用同一公猪对三头母猪进行配种试验,所产各头仔猪断奶时的体重(kg)资料如下:No.1: 24.0,22.5,24.0,20.0,22.0,23.0,22.0,22.5; No.2:19.0,19.5,20.0,23.5,19.0,21.0,16.5; No.3:16.0,16.0,15.5,20.5,14.0,17.5,14.5,15.5,19.0 试分析母猪对仔猪体重效应的差异显著性 答案:F=21.515**,s1-2=0.944 第七章 回归和相关分析 一、什么叫回归分析?回归截距和回归系数的统计学意义? 回归分析:(因果关系)如果对x的每一个可能的值,都有随机变量y的一个分布相对应,则称随机变量y对变量x存在回归关系,是一个变量的变化受另一个变量或几个变量的制约 回归截距:常量a,a是总体回归截距,是回归直线在纵坐标的截距,它是y的本底水平,即x对y没有任何作用时y的数量表现,它属于不能用x来估计的部分 回归系数:β为总体回归系数,βx表示依变量y的值改变中,由y与自变量x的线性回归关系 所引起变化的部分,即可以由x直接估计的部分 Y=a+bx:a为当x=0时的Y值,即直线在y轴上的截距,称为回归截距;b 为回归直线的斜率,称为回归系数,其含义是自变量x改变一个单位,依变量y平均增加或减少的单位数 二、什么叫相关分析?相关系数和决定系数各具什么意义? 相关分析:(平行关系) 是两个以上变量之间共同受到另外因素的影响 相关系数:如果两个变量间呈线性关系,但不需要由一个变量来估计另一个变量,只需了解两个变量的相关程度以及相关性质,可以通过计算表示 两个变量相关程度和性质的统计数——相关系数来进行研究 决定系数:统计中还有另外一个表示相关程度的统计数—— 决定系数,决定系数定义为相关系数r的平方。决定系数的含义是变量x引起y变异的回归平方和占y变异总平方和的比率,只能表示相关程度,不能表示相关性质 1统计的工作内容?P2 实验设计 、收集资料、整理资料、分析资料 2资料的类型 P2-P3 (1)计量资料:观察指标用定量的方法测定其数值的大小所得的资料。一般用度量衡单位表示。如身高、体重、浓度。 (2)计数资料:(分类)疗效 (3)等级分组资料 3变异与同质的概念? P3 (1) 变异:在临床治疗中,用同样的药物治疗病情相同的病人,疗效也不尽相同,即 使在实验室里,动物与动物之间也有明显的差异,这种现象称为个体差异或者变异。 (2) 同质:研究对象某一个或者几个属性相同称为同质,例如同种族、年龄、性别的 健康人。 4总体样本的概念?P3 (1) 总体:是同质的个体所构成的全体。有限总体:研究单位是有限的。无限总体:研究 单位是无限的。 (2) 样本:从总体中随机抽取部分有代表性的观察单位。其实测值的集合。 5误差的类型?P6 (1) 系统误差 (2) 随机测量误差 (3) 抽样误差 6概率的概念特征?P6 概念:描写某一事件发生的可能性大小的一个量度。 特征:(1)肯定发生的时间成为必然事件。概率为1 2)可能发生也可能不发生的事件称为随机事件或者偶然事件概率0-1 (3) 概率小于等于0.05或者小于等于0.01事件成为小概率事件。 7频率的概念? 频率指样本的实际发生率。 8, 频率表的绘制步骤?P8-P9 (1)求极差:最大值减最小值 (2)确定组距分组:组距=极差除以10 (3)划计 (4)计数 9描写集中与离散趋势的指标? 集中趋势:算术均数、中位数、几何均数 离散趋势:全距、四分位间距方差、标准差、变异系数 10. 频数分布表的用途? P10 (1)作为陈述资料的形式 ,可以替代原始的资料,便于进一步分析。 (2)便于观察资料的分布类型,医学研究中常见的资料分布类型可以分为对称分布和偏态 分布两大类。 (3)便于发现资料中某些远离群体的特大或者特小的可疑值。 (4)当样本含量比较大时,可用各组段的频率作为概率的估计值。 11医学参考值的范围的含义是什么?P22 医学参考值的范围传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。其确切含义为从选择的参照总体上获得的所有检查结果,用统计方法建立百分位数界限时所得到的区间称为参考值范围。习惯上包含95%的参照总体的范围。 12均数中位数两者的关系? 见笔记 正态分布时:均数=中位数 正偏态分布时:均数大于中位数 均数=中位数=众数 负偏态分布时:均数小于中位数 13正态分布的主要特征?P20 第一节 正态分布的概念和特征 一、正态分布的概念 由表1.1的频数表资料所绘制的直方图,图3.1(1)可以看出,高峰位于中部,左右两侧大致对称。我们设想,如果观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图3.1(3)。这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布(normal distribution)。由于频率的总和为100%或1,故该曲线下横轴上的面积为100%或1。 图3.1频数分布逐渐接近正态分布示意图 为了应用方便,常对正态分布变量X 作变量变换。 (3.1) 该变换使原来的正态分布转化为标准正态分布 (standard normal distribution) ,亦称u 分布。u 被称为标准正态变量或标准正态离差(standard normal deviate)。 二、正态分布的特征: 1.正态曲线(normal curve)在横轴上方均数处最高。 2.正态分布以均数为中心,左右对称。 3.正态分布有两个参数,即均数 和标准差 。 是位置参数,当 固定不变 时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动。是形状参数,当通常用正态分布。 4.正态曲线下面积的分布有一定规律。 实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。正态曲线下一定区间的面积可以通过附表1求得。对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计。 查附表1应注意:①表中曲线下面积为-∞到u 的左侧累计面积;②当已知μ、σ和X 时先按式(3.1)求得u 值,再查表,当μ、σ未知且样本含量n 足够大时,可用样本均数 和标准差S 分别代替μ和σ,按 式求得u 固定不变时, 越大,曲线越平阔; 越小,曲线越尖峭。 表示均数为,方差为的正态分布。用N (0,1)表示标准 值,再查表;③曲线下对称于0的区间面积相等,如区间(-∞,-1.96)与区间(1.96,∞)的面积相等,④曲线下横轴上的总面积为100%或1。 正态分布曲线下有三个区间的面积应用较多,应熟记:①标准正态分布时区间(-1,1)或正态分布时区间(μ-1σ, μ+1σ)的面积占总面积的68.27%;②标准正态分布时区间(-1.96,1.96)或正态分布时区间(μ-1.96σ, μ+1.96σ) 的面积占总面积的95%;③标准正态分布时区间(-2.58,2.58)或正态分布时区间(μ-2.58σ, μ+2.58σ)的面积占总面积的99%。如图3.2所示。 图3.2 正态曲线与标准正态曲线的面积分布 14医学医学参考值的范围?P22 范围:传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。参考值的范围? 目的:a 基于临床实践,着眼于个体。划分正常人与异常人的界限。B 基于预防医学实践,着眼于人群。 标准误与标准差的特点? (1)标准误特点:荡样本例数为n 一定时,标准误与标准差成正比。 (2)标准差的特点:当标准差一定时,标准误与样本含量n 的平方根成反比。 16. 标准误的用途?P30-P31 A 衡量抽样误差的大小 B 估计总体均数的置信区间 C 用于假设检验 样本均数的标准差可用于衡量抽样误差的大小。 17置信区间的概念? 概念:假设检验亦称显著性检验,是统计推断的另一重要内容,其目的是比较总体参数之间有无差别。 步骤:a 建立假设和确定检验水准。 b 选择检验方法和计算检验统计量。 c 确定P 值和做出统计推断的结论。 18 t检验的注意事项?P41-P42 A 假设检验结论正确的前提。 B 检验的方法选用及适用条件。 C 双侧检验与单侧检验的选择。 D 假设检验的结论不能绝对化。 E 正确理解P 值得统计意义。 D 假设检验和可信区间的区别 19假设检验中的两种错误及判定方法?P42-P43 三) 检验的两类错误 称 H0真而被拒绝的错误为第一类错误或弃真错误;称 H0假而被接受的错误为第二类错误或取伪错误。 记 p(I)=p{拒绝H0| H0真}; P(II)=p {接受H0| H0假} 20两独立样本t 检验的概念P37? 两独立样本t 检验又称成对T 检验,它适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均属是否相等。 21什么事方差齐性?P39 22假设检验的基本步骤?基本步骤 1、提出检验假设(又称无效假设,符号是H0))和备择假设(符号是H1)。 H0:样本与总体或样本与样本间的差异是由抽样误差引起的; H1:样本与总体或样本与样本间存在本质差异; 预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。 3、根据统计量的大小及其分布确定检验假设成立的可能性P 的大小并判断结果。若P>α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P 值的大小一般可通过查阅相应的界值 23差分析对资料的要求? A 每个个体的测量值相互独立 B 服从正态分布或近似服从正态分布。 C 总体的方差相等 24方差分析的用途? 用途:适用于多个平均值进行假设检验,以检验所得的多个平均值是否来自相同总体。 25方差分析的基本思想?方差分析的计算公式?P47 26方差分析的具体步骤? A 提出检验假设,确定检验水准。 Ho:u1=U2=U3,H1:U1、U2、U3不全相等 a=0.05 B 计算检验统计量F 值 C 确定P 值,做出推断结论。F=MS处理间/MS处理内 27. 单因素方差分析的公式P47 28. 相对数的概念? 概念:相对数是两个有关的绝对数之比, 也可以是两个统计指标值比,计算相对数的意义主要是把基数化作相等,便于相互比较。 29. 相对数常用的指标及其概念? (1)率:表示在一定范围内某种现象的发生数与可能发生的总数之比,说明某现象的强度或者频度。通常以百分率(%)千分率、万分率(/万)、十万分率(/十万) 率=某事物或现象发生的实际数/某事物或现象发生的所有可能数X 比例基数 (2)构成比:表示某事物内部组成部分在整体中所占的比重 构成比=某一组成部分的观察单位数/同一事物各组成部分的观察单位 X 100% (4) 相对比:即比值是两个有关指标值之比,说明一个指标是另一个指标的 几倍或百分之几。 相对比=甲指标/乙指标 或相对比=甲指标/乙指标X % 甲乙两指标的性质可以相同也可以不同。如反映医院工作效率的门诊人次数与床位数之比,反映人口密度的人口数与土地面积之比。 构成比的特点:A 分子是分母的一部分,包含在分母中无单位。B 各部分构成比之和等于1,若四舍五入造成构成比之和不等于1,则应进行适当调整,使其等于1. C当事物内部某一部分的构成比发生变化时,其他各部分的构成比也会相应发生变化。 30. 相对数应注意的事项? 事项:A 计算相对数时观察单位数应足够大。分母大于等于30. B分析时构成比和率不能混淆。 C 几个率的平均率不一定等于其算数均值。 D 相对数的相互比较应注意可比性。 31率的标准化及其意义?P60 意义:率的标准化是为了在比较两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成(如年龄、性别、工龄、病程长短等)的影响 32. 行和列表卡方检验的注意事项?P76 33. 相关? 是用来测量和描述两个变量间关系的统计技术。 是对两个变量在自然环境下观察。对变量没有控制有着操纵。 33相关关系的特点? A 关系的方向:相关可以分为两个基本类型:正相关和负相关 B 关系的形成:关系的形成形式分为线性和非线性。 C 关系的程度:测量了与特定相关形式的拟合程度,如线性相关测量了数据点与直线的匹配程度。 34. 相关分析的概念? 预测:SAT与大学学习 效果度:新的智力测验与标准智力测验、学习成绩和问题解决能力等关联。 信度:一个测量工具根据其稳定而得到的测量结果的程度而决定是否可信。 理论验证:理论的预测可以有两个变量的相关来检验。 35皮尔逊相关系数? 样本的系数用R 来表示。 (1) R的绝对值在-1和1之间 (2) R的绝对值越接近1,两个变量的关联程度越强。 (3) 正相关时R 值在0和1之间这时一个变量增加,另一个变量也增加。 负相关时,R 值在-1和0之间,此时一个变量增加,另一个变量将减少。 R 无法解释两个变量间的因果关系(教堂数与犯罪数成正比 受数据全距的影响(不应该向相关结果外推 受一个或两个极端值有巨大影响,在判断相关有多好时,不能解释成为比例。R 的平方测量了可由相关解释的数据的变异的比例。 36. 直线回归就是用来描述一个度量如何依赖于另一个变量。其任务就是找出一个变量随另外一个变量变化的直线方程。我们把这个方程叫做直线回归方程。 回归方程:Y=a+bx其中a 是回归方程在Y 轴上的截距,即当X=0时的Y 值,b 为样本的回归系数,即回归直线的斜率,表示当X 变动一个单位时,Y 平均变动b 个单位。 37相关与回归的区别?P32 范文二:教育统计学
范文三:统计学词汇
范文四:生物统计学
范文五:医学统计学