范文一:统计学_贾俊平_第4版_课后答案
第七章
7.2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
,15,,=2.143 ,x49n
(2)在95,的置信水平下,求边际误差。
z,,,t, ,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t= ,2xx
,,z,,,,t,,,z, 因此,=1.96×2.143=4.2 ,2xxx0.025x
(3)如果样本均值为120元,求总体均值 的95,的置信区间。
置信区间为:
==(115.8,124.2) xx,,,,,1204.2,1204.2,,,,,,xx
7.4 从总体中抽取一个n=100的简单随机样本,得到=81,s=12。 x
要求:
22,,,,s,大样本,样本均值服从正态分布:或 xN,xN,,,,,,,nn,,,,
s12ss,,置信区间为:,==1.2 xzxz,,,,,,,22,,100nnn,,
,(1)构建的90,的置信区间。
zz==1.645,置信区间为:=(79.03,82.97) 811.6451.2,811.6451.2,,,,,,,20.05
,(2)构建的95,的置信区间。
zz==1.96,置信区间为:=(78.65,83.35) 811.961.2,811.961.2,,,,,,,20.025
,(3)构建的99,的置信区间。
zz==2.576,置信区间为:=(77.91,84.09) 812.5761.2,812.5761.2,,,,,,,20.005
7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):
3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2
4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3
2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5
4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5
求该校大学生平均上网时间的置信区间,置信水平分别为90,,95,和99,。
解:
(1)样本均值x=3.32,样本标准差s=1.61; (2)抽样平均误差:
,s,, 重复抽样:==1.61/6=0.268 xnn
NnsNn,,,1.61750036,, 不重复抽样:=,,= ,,xN1N,175001,,nn36
0.995=0.268×=0.268×0.998=0.267
(3)置信水平下的概率度:
zz =0.9,t===1.645 1,,,20.05
zz =0.95,t===1.96 1,,,20.025
zz =0.99,t===2.576 1,,,20.005
(4)边际误差(极限误差):
,,,,,tz,,xxx,2
z,,=0.9,= ,,,,,tz,,1,,0.05xxxx,2
,,,z,z,,重复抽样:==1.645×0.268=0.441 xx,20.05x
,,,z,z,,不重复抽样:==1.645×0.267=0.439 xx,20.05x
z,, =0.95,= ,,,,,tz,,1,,0.025xxxx,2
,,,z,z,,重复抽样:==1.96×0.268=0.525 xx,20.025x
,,,z,z,,不重复抽样:==1.96×0.267=0.523 xx,20.025x
z,, =0.99,= ,,,,,tz,,1,,0.005xxxx,2
,,,z,z,,重复抽样:==2.576×0.268=0.69 xx,20.005x
,,,z,z,,不重复抽样:==2.576×0.267=0.688 xx,20.005x(5)置信区间:
xx,,,,,,,xx
=0.9, 1,,
重复抽样:==(2.88,3.76) xx,,,,,3.320.441,3.320.441,,,,,,xx
==(2.88,3.76) 不重复抽样:xx,,,,,3.320.439,3.320.439,,,,,,xx
=0.95, 1,,
重复抽样:==(2.79,3.85) xx,,,,,3.320.525,3.320.525,,,,,,xx
不重复抽样:==(2.80,3.84) xx,,,,,3.320.441,3.320.441,,,,,,xx
=0.99, 1,,
重复抽样:==(2.63,4.01) xx,,,,,3.320.69,3.320.69,,,,,,xx
==(2.63,4.01) 不重复抽样:xx,,,,,3.320.688,3.320.688,,,,,,xx
7.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样
本,他们到单位的距离(单位:km)分别是:
10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2
假定总体服从正态分布,求职工上班从家里到单位平均距离的95,的置信区间。
解:小样本,总体方差未知,用t统计量
x,, tn,1t,,,s
n
均值=9.375,样本标准差s=4.11
置信区间:
ss,, xtnxtn1,1,,,,,,,,,,,,22,,nn,,
=0.95,n=16,==2.13 tn,1t151,,,,,,,20.025
ss,, xtnxtn1,1,,,,,,,,,,,,22,,nn,,
4.114.11,,==(7.18,11.57) 9.3752.13,9.3752.13,,,,,,1616,,
7(11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g。现从某天生产
的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(单位:g)如下: 每包重量(g) 包数
96~98 2
98~100 3
100~102 34
102~104 7
104~106 4
合计 50
已知食品包重量服从正态分布,要求: (1)确定该种食品平均重量的95,的置信区间。 解:大样本,总体方差未知,用z统计量
x,, N0,1z,,,s
n
样本均值=101.4,样本标准差s=1.829
置信区间:
ss,, xzxz,,,,,,,22,,nn,,
zz=0.95,==1.96 1,,,20.025
ss,, xzxz,,,,,,,22,,nn,,
1.8291.829,,==(100.89,101.91) 101.41.96,101.41.96,,,,,,5050,,
(2)如果规定食品重量低于l00g属于不合格,确定该批食品合格率的95,的置信区间。
解:总体比率的估计
大样本,总体方差未知,用z统计量
,,p,z N0,1,,,pp1,,
n
样本比率=(50-5)/50=0.9
置信区间:
,,pppp11,,,,,,,,pzpz, ,,,,,,22,,nn,,
zz=0.95,==1.96 1,,,20.025
,,pppp11,,,,,,,,pzpz,,,,, ,,22,,nn,,
,,0.910.90.910.9,,,,,,,,0.91.96,0.91.96,,,,==(0.8168,0.9832) ,,5050,,
7(13 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了
18个员工。得到他们每周加班的时间数据如下(单位:小时):
6 21 17 20 7 0 8 16 29
3 8 12 11 9 21 25 15 16 假定员工每周加班的时间服从正态分布。估计网络公司员工平均每周加班时间的90%
的置信区间。
解:小样本,总体方差未知,用t统计量
x,, t,tn,1,,s
n
均值=13.56,样本标准差s=7.801
置信区间:
ss,, xtnxtn1,1,,,,,,,,,,,,22,,nn,,
=0.90,n=18,==1.7369 tn,1t171,,,,,,,20.05
ss,, xtnxtn1,1,,,,,,,,,,,,22,,nn,,
7.8017.801,,==(10.36,16.75) 13.561.7369,13.561.7369,,,,,,1818,,
7(15 在一项家电市场调查中(随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23,。求总体比例的置信区间,置信水平分别为90%和95%。
解:总体比率的估计
大样本,总体方差未知,用z统计量
,,p,z N0,1,,,pp1,,
n
样本比率=0.23
置信区间:
,,pppp11,,,,,,,,pzpz,,,,, ,,22,,nn,,
zz=0.90,==1.645 1,,,20.025
,,pppp11,,,,,,,,pzpz,,,,, ,,22,,nn,,
,,0.2310.230.2310.23,,,,,,,,0.231.645,0.231.645,,,,= ,,200200,,
=(0.1811,0.2789)
zz=0.95,==1.96 1,,,20.025
,,pppp11,,,,,,,, pzpz,,,,,,,22,,nn,,
,,0.2310.230.2310.23,,,,,,,,==(0.1717,0.231.96,0.231.96,,,,,,200200,,
0.2883)
7(20 顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下:
方式1 6.5 6.6 6.7 6.8 7.1 7.3 7.4 7.7 7.7 7.7
方式2 4.2 5.4 5.8 6.2 6.7 7.7 7.7 8.5 9.3 10
要求:
(1)构建第一种排队方式等待时间标准差的95,的置信区间。
解:估计统计量
2nS,1,,2,~1n, ,,2,
2s经计算得样本标准差=3.318 2
置信区间:
22nSnS,,11,,,,2,,, 22nn,,11,,,,,,,,,212
2222=0.95,n=10,==19.02,==2.7 ,n,1,9,n,1,91,,,,,,,,,,,,,0.0250.975212
22,,nSnS11,,90.227290.2272,,,,,,,,,==(0.1075,0.7574) ,,,,,22,,19.022.7,,nn11,,,,,,,,,,,212,,
因此,标准差的置信区间为(0.3279,0.8703)
(2)构建第二种排队方式等待时间标准差的95,的置信区间。
解:估计统计量
2nS,1,,2,~1n, ,,2,
2s经计算得样本标准差=0.2272 1
置信区间:
22nSnS,,11,,,,2, ,,22nn,,11,,,,,,,,,212
2222=0.95,n=10,==19.02,==2.7 ,n,1,9,n,1,91,,,,,,,,,,,,,0.0250.975212
22,,nSnS11,,93.31893.318,,,,,,,,,==(1.57,11.06) ,,,,,22,,19.022.7,,nn11,,,,,,,,,,,212,,
因此,标准差的置信区间为(1.25,3.33)
(3)根据(1)和(2)的结果,你认为哪种排队方式更好?
第一种方式好,标准差小~
7(23 下表是由4对观察值组成的随机样本。
配对号 来自总体A的样本 来自总体B的样本
1 2 0 2 5 7 3 10 6 4 8 5
(1)计算A与B各对观察值之差,再利用得出的差值计算和。 sdd
=1.75,=2.62996 sdd
(2)设分别为总体A和总体B的均值,构造的95,的置信区间。 ,,和,,,,,12d12
解:小样本,配对样本,总体方差未知,用t统计量
d,,dt, tn,1,,dsd
n
均值=1.75,样本标准差s=2.62996
置信区间:
ss,,dd 1,1dtndtn,,,,,,,,,,,,22,,nn,,
=0.95,n=4,==3.182 tn,1t31,,,,,,,20.025
ss,,dd 1,1dtndtn,,,,,,,,,,,,22,,nn,,
2.629962.62996,,==(-2.43,5.93) 1.753.182,1.753.182,,,,,,44,,
nn,7(25 从两个总体中各抽取一个,250的独立随机样本,来自总体1的样本比例为p121
,40,,来自总体2的样本比例为,30,。要求: p2
的90,的置信区间。 (1)构造,,,12
(2)构造的95,的置信区间。 ,,,12
解:总体比率差的估计
大样本,总体方差未知,用z统计量
pp,,,,,,,1212 z,N0,1,,
pppp11,,,,,,1122,nn12
样本比率p1=0.4,p2=0.3
置信区间:
,,pppppppp1111,,,,,,,,,,,,11221122,,ppzppz,,,,,,,,,,,122122,,nnnn1212,,
zz=0.90,==1.645 1,,,20.025
,,pppppppp1111,,,,,,,,,,,,11221122,,ppzppz,,,,,,,,,,,122122,,nnnn1212,,
=
,,0.410.40.310.30.410.40.310.3,,,,,,,,,,,,,,0.11.645,0.11.645,,,,,, ,,250250250250,,
=(3.02%,16.98%)
zz=0.95,==1.96 1,,,20.025
,,pppppppp1111,,,,,,,,,,,,11221122,,ppzppz,,,,,,,,,,,122122,,nnnn1212,,
=
,,0.410.40.310.30.410.40.310.3,,,,,,,,,,,,,,0.11.96,0.11.96,,,,,, ,,250250250250,,
=(1.68%,18.32%)
7.26 生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对序进行改进以减
小方差。下面是两部机器生产的袋茶重量(单位:g)的数据:
机器1 机器2
3.45 3.22 3.9 3.22 3.28 3.35
3.2 2.98 3.7 3.38 3.19 3.3
3.22 3.75 3.28 3.3 3.2 3.05
3.5 3.38 3.35 3.3 3.29 3.33
2.95 3.45 3.2 3.34 3.35 3.27
3.16 3.48 3.12 3.28 3.16 3.28
3.2 3.18 3.25 3.3 3.34 3.25
22要求:构造两个总体方差比,/,的95,的置信区间。 12
解:统计量:
2s12,1 Fnn,,1,1,,122s22,2
置信区间:
22,,ss1122,,ss22 ,,,FnnFnn1,11,1,,,,,,,,,,,,,2121212,,,,
22ss=0.058,=0.006 12
n1=n2=21
=0.95,==2.4645, Fnn,,1,1F20,201,,,,,,,2120.025
1= Fnn,,1,1,,1212,,,,Fnn1,1,,,221
1===0.4058 Fnn,,1,1F20,20,,,,1212,,0.975F20,20,,0.025
22,,ss1122,,ss22,=(4.05,24.6) ,,FnnFnn1,11,1,,,,,,,,,,,,,2121212,,,,
7(27 根据以往的生产数据,某种产品的废品率为2,。如果要求95,的置信区间,若要
求边际误差不超过4,,应抽取多大的样本?
,pz,解: ,21pp,,,
n
2zpp,,,1,,,2 n,2,p
zz =0.95,==1.96 1,,,20.025
22zpp,,,1,,1.960.020.98,,,2==47.06,取n=48或者50。 n,220.04,p
7(28 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约
为120元,现要求以95,的置信水平估计每个顾客平均购物金额的置信区间,并要求边
际误差不超过20元,应抽取多少个顾客作为样本?
22z,,,2zz解:,=0.95,==1.96, n,1,,,20.0252,x
2222z,,1.96120,,2 =138.3,取n=139或者140,或者150。 n,,22,20x
7(29 假定两个总体的标准差分别为:,,若要求误差范围不超过5,相应,,12,,1512的置信水平为95,,假定nn,,估计两个总体均值之差,,,时所需的样本量为多1212大?
222z,,,,,,,212zz解:n1=n2=,=0.95,==1.96, n,1,,,20.0252,,xx12
2222221.961215,,z,,,,,,,,,212 n1=n2== =56.7,取n=58,或者60。 n,225,,xx12
7(30 假定nn,,边际误差E,0(05,相应的置信水平为95,,估计两个总体比例之12
差时所需的样本量为多大? ,,,12
2zpppp,,,,11,,,,,,,21122,,zn,z解:n1=n2=,=0.95,==1.96,取1,,,20.0252,pp,12
p1=p2=0.5,
22221.960.50.5,,zpppp,,,,11,,,,,,,,,21122,,n, n1=n2== =768.3,取n=769,22,0.05pp,12
或者780或800。
八章
8(2 一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,
测得其平均寿命为680小时。已知该元件寿命服从正态分布,,60小时,试在显著,
性水平0(05下确定这批元件是否合格。
解:H:μ?700;H:μ,700 01
x已知:,680 ,60 ,
由于n=36,30,大样本,因此检验统计量:
x,,680700,0z,,,-2
sn6036
zz当α,0.05,查表得,1.645。因为z,-,故拒绝原假设,接受备择假设,说明这批产,,
品不合格。
8(4 糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机
工作是否正常。某日开工后测得9包重量(单位:千克)如下:
99(3 98(7 100(5 101(2 98(3 99(7 99(5 102(1 100(5
已知包重服从正态分布,试检验该日打包机工作是否正常(a,0(05)? 解:H:μ,100;H:μ?100 01
x经计算得:,99.9778 S,1.21221
检验统计量:
x,,99.9778100,0t,,,-0.055 sn1.212219
当α,0.05,自由度n,1,9时,查表得,2.262。因为,,样本统计量落t9tt,,,2,2在接受区域,故接受原假设,拒绝备择假设,说明打包机工作正常。
8(5 某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50
袋,发现有6袋低于250克。若规定不符合标准的比例超过5,就不得出厂,问该批
食品能否出厂(a,0(05)?
解:解:H:π?0.05;H:π,0.05 01
已知: p,6/50=0.12
检验统计量:
p0.120.05,,,0Z,,,2.271
0.0510.05,,1n,,,,,,,00
50
zzz当α,0.05,查表得,1.645。因为,,样本统计量落在拒绝区域,故拒绝原假设,,,
接受备择假设,说明该批食品不能出厂。
8(7 某种电子元件的寿命x(单位:小时)服从正态分布。现测得16只元件的寿命如下:
159 280 101 212 224 379 179 264
222 362 168 250 149 260 485 170
问是否有理由认为元件的平均寿命显著地大于225小时(a,0(05)? 解:H:μ?225;H:μ,225 01
x经计算知:,241.5 s,98.726
检验统计量:
x,,241.5225,0t,,,0.669
sn98.72616
t当α,0.05,自由度n,1,15时,查表得,1.753。因为t,,样本统计量落在接t15,,,,
受区域,故接受原假设,拒绝备择假设,说明元件寿命没有显著大于225小时。
8(10 装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳
动效率可以用平均装配时间反映。现从不同的装配方法中各抽取12件产品,记录各
自的装配时间(单位:分钟)如下:
甲方法:31 34 29 32 35 38 34 30 29 32 31 26
乙方法:26 24 28 29 30 29 32 26 31 29 32 28
两总体为正态总体,且方差相同。问两种方法的装配时间有无显著不同 (a,0(05)? 解:建立假设
H:μ,μ=0 H:μ,μ?0 012112
总体正态,小样本抽样,方差未知,方差相等,检验统计量
xx,,,12 t,
11s,pnn12
snnxx根据样本数据计算,得,12,=12,,31.75,,3.19446,,28.6667,11212s=2.46183。 2
22nsns,,,11,,,,11122 s,pnn,,212
221210.922161210.71067,,,,,,,,, ,,8.1326 12122,,
xx,,,12,2.648 t,
11s,pnn12
α,0.05时,临界点为,,2.074,此题中,,故拒绝tnn,,2t22tt,,,,,2120.025,2
原假设,认为两种方法的装配时间有显著差异。
8(11 调查了339名50岁以上的人,其中205名吸烟者中有43个患慢性气管炎,在134
名不吸烟者中有13人患慢性气管炎。调查数据能否支持“吸烟者容易患慢性气管炎”
这种观点(a,0(05)?
解:建立假设
H:π?π;H:π,π012112
p,43/205=0.2097 n1=205 p,13/134=0.097 n2=134 12
检验统计量
ppd,,,,12z,
pppp11,,,,,,1122,nn12
0.20980.0970,,,,,
0.209810.20980.09710.097,,,,,,,205134
,3
zz当α,0.05,查表得,1.645。因为,,拒绝原假设,说明吸烟者容易患慢性气管炎。 z,,
8(12 为了控制贷款规模,某商业银行有个内部要求,平均每项贷款数额不能超过60万元。
随着经济的发展,贷款规模有增大的趋势。银行经理想了解在同样项目条件下,贷款
的平均规模是否明显地超过60万元,故一个n=144的随机样本被抽出,测得=68(1x
万元,s=45。用a,0(01的显著性水平,采用p值进行检验。
解:H:μ?60;H:μ,60 01
x已知:,68.1 s=45
由于n=144,30,大样本,因此检验统计量:
x,,68.160,0z,,,2.16 sn45144
x由于,μ,因此P值=P(z?2.16)=1-,查表的=0.9846,P值=0.0154 ,2.16,2.16,,,,
由于P,α,0.01,故不能拒绝原假设,说明贷款的平均规模没有明显地超过60万元。
8(13 有一种理论认为服用阿司匹林有助于减少心脏病的发生,为了进行验证,研究人员
把自愿参与实验的22 000人随机平均分成两组,一组人员每星期服用三次阿司匹林(样
本1),另一组人员在相同的时间服用安慰剂(样本2)持续3年之后进行检测,样本1
中有104人患心脏病,样本2中有189人患心脏病。以a,0(05的显著性水平检验服
用阿司匹林是否可以降低心脏病发生率。
解:建立假设
H:π?π;H:π,π012112
p,104/11000=0.00945 n1=11000 p,189/11000=0.01718 n2=11000 12
检验统计量
ppd,,,,12 z,
pppp11,,,,,,1122,nn12
0.009450.017180,,,, ,
0.0094510.009450.0171810.01718,,,,,,,1100011000
,-5
zz0.05,查表得,1.645。因为,-,拒绝原假设,说明用阿司匹林可以降低心脏当α,z,,
病发生率。
8(15 有人说在大学中男生的学习成绩比女生的学习成绩好。现从一个学校中随机抽取了
25名男生和16名女生,对他们进行了同样题目的测试。测试结果表明,男生的平均
成绩为82分,方差为56分,女生的平均成绩为78分,方差为49分。假设显著性水
平α=0(02,从上述数据中能得到什么结论?
解:首先进行方差是否相等的检验:
建立假设
2222,,,,H:,;H:? 011212
22ssn1=25,=56,n2=16,=49 12
256s1,,1.143 F,249s2
当α,0.02时,,3.294,,0.346。由于,FF24,15F24,15F24,15,,,,,,,212,,12,,,,检验统计量的值落在接受域中,所以接受原假设,说明总体方差无显F24,15,,,2
著差异。
检验均值差:
建立假设
H:μ,μ?0 H:μ,μ,0 012112
总体正态,小样本抽样,方差未知,方差相等,检验统计量
xx,,,12 t,
11s,pnn12
22ssnnxx根据样本数据计算,得,25,=16,,82,=56,,78,=49 121212
22nsns,,,11,,,,11122,53.308 s,pnn,,212
xx,,,12,1.711 t,
11s,pnn12
tα,0.02时,临界点为,,2.125,t,,故不能拒绝原假设,不能tnn,,2t39,,,,,,120.02
认为大学中男生的学习成绩比女生的学习成绩好。
范文二:医学统计学课后习题答案(第2版高等教育出版社)
医学统计学课后习题答案 (第 2版高等教育出版社 ) 第一章 绪论
1. 举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体, 这个类就是总体。 总体是根据研究目 的所确定的所有同质观察单位某种观察值 (即变量值) 的集合, 通常有无限总体 和有限总体之分, 前者指总体中的个体是无限的, 如研究药物疗效, 某病患者就 是无限总体, 后者指总体中的个体是有限的, 它是指特定时间、 空间中有限个研 究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这 个部分就是样本。例如在一项关于 2007年西藏自治区正常成年男子的红细胞平 均水平的调查研究中,该地 2007年全部正常成年男子的红细胞数就构成一个总 体,从此总体中随即抽取 2000人,分别测的其红细胞数,组成样本,其样本含 量为 2000人。
2. 简述误差的概念。
误差泛指实测值与真实值之差, 一般分为随机误差和非随机误差。 随机误差是使 重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差; 非随机误差中最常见的为系统误差, 系统误差也叫偏倚, 是使实际观测值系统的 偏离真实值的误差。
3. 举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征, 这些数值特征称为参数, 如整个 城市的高血压患病率。 根据样本算得的某些数值特征称为统计量, 如根据几百人 的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的, 而参数是他们想知道的。 一般情况下, 这些参数是难以测定的, 仅能够根据样本 估计。 显然, 只有当样本代表了总体时, 根据样本统计量估计的总体参数才是合 理的。
4. 简述小概率事件原理。
当某事件发生的概率小于或等于 0.05时, 统计学上习惯称该事件为小概率事件, 其含义是该事件发生的可能性很小, 进而认为它在一次抽样中不可能发生, 这就 是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章 调查研究设计
1. 调查研究主要特点是什么?
调查研究的主要特点是:①研究的对象及其相关因素 (包括研究因素和非研究因 素) 是客观存在的, 不能人为给予干预措施②不能用随机化分组来平衡混杂因素 对调查结果的影响。
2. 简述调查设计的基本内容。
①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查 方式⑤确定调查项目和调查表⑥制定资料整理分析计划⑦制定调查的组织计划。 3. 试比较常用的四种概率抽样方法的优缺点。
(1)单纯随机抽样 优点是:均数(或率)及标准误的计算简便。缺点是:当总 体观察单位数较多时, 要对观察单位一一编号, 比较麻烦, 实际工作中有时难以 办到。
(2)系统抽样 优点是:①易于理解,简便易行②容易得到一个按比例分配的 样本, 由于样本相应的顺序号在总体中是均匀散布的, 其抽样误差小于单纯随机 抽样。缺点是:①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋 势, 系统抽样将产生明显的偏性。 但对于适合采用系统抽样的情形, 一旦确定了 抽样间隔, 就必须严格遵守, 不能随意更改, 否则可能造成另外的系统误差②实 际工作中一般按单纯随机抽样方法估计抽样误差, 因此这样计算得到的抽样误差 一般偏大。
(3)分层抽样 优点是:①减少抽样误差:分层后增加了层内的同质性,因而 观测值的变异度减小, 各层的抽样误差减小, 在样本含量先锋等的情况下其标准 误一般小于单纯随机抽样、 系统抽样和整群抽样的标准误②便于对不同的层采用
不同的抽样方法, 有利于调查组织工作的实施③还可对不同层进行独立分析。 缺 点是:当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。 (4)整群抽样 优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量一定时,其抽样误差一般大于单纯随机抽样的误差, 。
4. 常用的非概率抽样方法有哪些?
有偶遇抽样、立意抽样、定额抽样、雪球抽样等。
5. 简述调查问题的顺序安排。
调查问题顺序安排总原则:①符合逻辑②一般问题在前, 特殊问题在后③易答题 在前, 难答题在后④如果采用封闭式和开放式相结合的问题, 一般先设置封闭式 问题⑤敏感问题一般放在最后。 此外, 在考虑问题顺序时, 还应注意问题是否适 合全部调查对象,并采用跳答的形式安排问题和给出指导语。
第四章 定量资料的统计描述
1. 均数、中位数、几何均数的适用范围有何异同?
相同点是都用于描述定量资料的集中趋势。不同点:①均数用于单峰对称分布, 特别是正态分布或近似正态分布的资料②几何均数用于变量值间呈倍数关系的 偏态分布资料, 特别是变量经过对数变换后呈正态分布或近似正态分布的资料③ 中位数用于不对称分布资料、两端无确切值的资料以及分布不明确的资料。 2. 同一资料的标准差是否一定小于均数?
同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水 平, 而标准差是描述单峰对称分布资料离散程度最常用的指标。 标准差大, 表示 观察值之间变异大, 即一组观察值的分布较分散; 标准差小。 表示观察值之间变 异小, 即一组观察值的分布较集中。 若标准差远大于均数表明数据离散程度较大, 可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。
3. 极差、四分位数间距、标准差、变异系数的适用范围有何异同?
相同点是都用于描述资料的离散程度。 不同点:①极差可用于描述单峰对称分布 小样本资料的离散程度, 或用于初步了解资料的变异程度②四分位数间距可用于 描述偏态分布资料、 两端无确切值或分布不明确的资料的离散程度③标准差用于 描述正态分布或近似正态分布资料的离散程度④变异系数用于比较几组计量单 位不同或均数相差悬殊的正态分布资料的离散程度。
4. 正态分布有哪些基本特征?
①正态曲线在横轴上方均数处最高②正态分布以均数为中心, 左右对称③正态分 布有两个参数,即位置参数μ和形态参数?④正态曲线下的面积分布有一定规 律,正态曲线与横轴间的面积恒等于 1。曲线下区间(μ-1.96?,μ+1.96?) 内的面积为 95.00%;区间(μ-2.58?,μ+2.58?)内的面积为 99.00%
5. 制定医学参考值范围时,正态分布法和百分位数法分别适用于何种资料? ①通过大量调查证实符合正态分布的变量或近似正态分布的变量, 可按正态分布 曲线下面积的规律制定医学参考值范围, 服从对数正态分布的变量, 可对观察值 取对数后按正态分布法算出医学参考值范围的对数值, 然后求其反对数②对于经 正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。
第五章、定性资料的统计描述
1. 应用相对数时需要注意哪些问题?
①应有足够的观察单位数; ②不能以构成比代替率; ③计算观察单位数不等的及 格率的合计率和平均率时, 不能简单的把各组率相加求其平均值而得, 而应该分 别将分子和分母合计, 再求出合计率和平均率; ④相对数的比较应注意其可比性, 如果内部构成不同, 应计算标准化率; ⑤样品率或样品构成比的比较应作检验假 设。
2. 为什么不能以构成比代替率?
率是指某现象实际发生数和某时间点或某时间段可能发生该现象的观察单位总 数之比, 用以说明该现象发生的频率或强度。 构成比是指事物内部某一组成部分
范文三:统计学原理(第2版)习题答案简版
第一章总论
二、单项选择题
1. B 2. C 3. A 4. B 5. A6. D 7. D 8. B 9. D 10. D 11. C 12. A 13. C 14. D 15. D
三、多项选择题
1. ACE 2. ABD 3. BE 4. CE5. BDE 6. ABC 7. ACE 8. ABCE9. BCE 四、判断题
1.×2.×3.√ 4.√ 5.×6.×7.√ 8.×
第二章统计设计
一、填空题
(1)第一、各个方面、各个环节
(2)整体设计、专项设计
(3)全阶段设计、单阶段设计。
(4)长期设计、中期设计、短期设计。
(5)相互联系、相互制约
(6)总体数量、概念、具体数值。
(7)总量指标、相对指标、平均指标
(8) 数量指标、质量指标。
(9) 数量性、综合性、具体性。
(10) 国民经济统计指标体系、科技统计指标体系、社会统计指标体系
二、多项选择题
1. BE 2. AD 3. ABCE4. ACE 5. BD 6. ABC 7. CD 8. ABCD 9. ABCDE
三、判断题
1.√ 2.√ 3.×4.√ 5.√
第三章统计调查
一、填空题
1.准确、及时、全面、系统。
2.基础资料。
3.全面、非全面、经常性、一次性、组织方式不同
4.核心、原始资料
5.国民经济(或国家)、地方、专业
6.原始记录、统计台账
7.一次性、全面
8.全面、非全面
9.原始、次级
10.范围
11.重点调查、典型调查
12.普查、全面统计报表、重点调查、典型调查、抽样调查
13.明确调查目的
14.调查单位
15.调查表、表头、表体、表脚、单一、一览
16.开放式问题、封闭式问题
二、单项选择题
1. C 2. B 3. C 4. D 5. C 6. D 7. D 8. D 9. D 10. D 11. B 12. C 13. B 14. A 15. B 16. B 17. A 18. B
三、多项选择题
1. ADE 2. ACDE 3. AE4. ACE 5. ABC 6. CD 7. ACD 8. ABC 9. ABCDE 10. DE 11. BCDE
第四章统计整理
二、单项选择题
1. C 2. A 3. B 4. B 5. B 6. C 7. C 8. C 9. A 10. C 11. C 12. A 13. B 14. C 15. B
三、多项选择题
1. AC 2. CE 3. DE 4. BCDE 5. ACD 6. ABE7. ABE 8. CD E9. ACD 10. ACDE
四、判断题
1.×2.×3.×4.√ 5.×6.√ 7.√ 8.√ 9.×10.√
六、计算题
1.
某班学生学习成绩次数分布表
分组标志为学习成绩, 为数量标志,分组方法采用的是组距式分组。 该班 46名同学中 不及格学生为 2
人, 不及格率为 4.35%, 及格率为 95.65%, 优秀学生为 8人, 优秀率为 17.39%; 成绩为良好的同学有 19人,占 41.3%,成绩为中等的同学有 10人,占 21.74%,成绩为及 格的同学有 7人,占 15.22%。
2.该数列为组距式变量数列中的异距数列,该数列可以说明某公司 80名销售人员日 销售额的分布特征。分组变量为日销售额,各组变量值分别为 2000元及以下、 2000-2500
元, 2500-3500元, 3500-4000元, 4000元以上,在上述各组中下限依次是 1500(开口组 假定下限) 、 2000、 2500、 3500、 4000,各组中上限依次是 2000、 2500、 3500、 4000、 4500(开口组假定上限) 。 组距依次为 500、 500、 1000、 500、 500, 各组组中值依次是 1750、 2250、 3000、 3750、 4250,各组销售人员数为次数,各组销售人员数比重为频率。
3.
第 1章总论
某地区企业按职工人数分组表
4.
第五章总量指标与相对指标
一、选择题
1. B 2. D 3. D 4. B 5. B 6. B 7. A 8. B 9. B 10. D 11. A 12. B 13. C
二、多选题
1. ABCDE 2. AC 3. ACE 4. CDE 5. ABCDE 6. AD 7. BCDE 8. BCD 9. BDE10. ABDE 11. BE
三、计算题
3.计划完成程度 ==112%
2013年二季度累计固定资产投资额达到 25亿元,因此提前完成任务时间为半年
4.计划完成程度 =510/500=102%,第四年三季度到第五年二季度完成产量达到 500万 吨,因此提前完成任务时间为三个季度。
第六章平均指标
一、单项选择题
1. C 2. D3. B 4. B 5. A 6. B 7. B 8. C
二、多项选择题
1. ABCE 2. ABE 3. CDE 4. ABCE 5. AC 6. AC 7. ACE 8. ABD 9. ABC
四、计算题
1.
月)
(元 /
5100
*=
=∑f f
x
x
2.
03. 29000
18300
==
=
f
xf x (元 /公斤) 03. 2900018300===∑x
m m H (元 /公斤) 第七章标志变异指标
一、单项选择题
1. A 2. C 3. B 4. D 5. A 6. D 7. D 8. B 9. C 10. D 11. B 二、多项选择题
1. ACE 2. AE 3. ABC 4. ABCE 5. BDE 三、判断题
1. × 2. × 3. ×4. × 5. √ 6. √ 五、计算题 1.
① 5. 9611000
961500
==
=
∑f
xf x (小时)
) (99. 7650
3845
件 ==
=∑f
xf x
第 1
章总论 ② 1000
17092750
)
(2
=
-=
∑f
f
x x σ=130.74(小时)
③平均合格率 %931000
930
==p 标准差 %51. 2507. 093. 0) 1(=?=-=
p p σ
标准差系数 %43. 27%93%51. 25===
x
V σσ
2.
36256002175000===f xf x 工人
(元 /人) 297.5660053125000) (2
==-=
∑f
f x x 工人
σ(元) %8.23625
297.56
==
=
x
V σσ工人
4812.52401155000===
∑f
xf x 技术 (元 /人)
390.31
24036562500) (2
==-=f f x x 技术
σ(元) %8.114812.5
390.31===
x V σσ技术 技术及管理人员平均数代表性大。
3. 优秀率:%155000750
==
p %71. 3515. 085. 0) 1(=?=-=p p σ 合格率:%905000
4500
==
p %301. 09. 0) 1(=?=-=p p σ 4.
∑?
=f
f
x x 甲 =29.1(千公里)
=
甲 σ()
05. 444. 2
==-∑f
f
x x (千公里)
%92. 131
. 2905
. 4==
=
x V σ
σ甲
∑?=f f
x x 乙 =27.22(千公里)
=
乙 σ()
01. 61216. 362
==-∑f
f
x x (千公里)
%08. 2222
. 2701
. 6==
=
x V σ
σ乙 甲厂轮胎质量好,质量更稳定。
第八章时间数列
一、单项选择题
1. C2. D 3. C 4. D 5. A 6. C 7. B 8. D 9. B 10. A 11. D 12. D
13. C 14. C 15. C 16. C 17. D 18. A 19. C 二、多项选择题
1. ACDE 2. BE 3. ACD 4. ABCE 5. BCDE 6. BCE 7. BC 8. ABD 三、判断题
1.× 2.√ 3.× 4.× 5.× 6.√ 7.×8.× 9.× 10.√ 五、计算题
1.
2014年粮食产量 =167.330772亿斤 粮食产量每年平均增长速度 =6.88% 2.
②年平均产量 =57. 625(万件)
年平均增长量 =47(万件)
年平均发展速度 =8.01%100801. 147. == 年平均增长速度 =108.01%-1=8.01%
③ 2017年产量 33. 1000(万件) ④ 5068. 6x 5432=++++x x x x ⑤
t 08. 24625.57y t +=
2014年预计产量 =625.57+24.08×7=794.13(万件) 3.
②年平均产值 =4. 137(万元) 平均增长量 =69. 8(万元) ③年平均发展速度 =%57. 106
年平均增长速度 =106.57%-1=6.57% ④
t 752. 8137.4y t +=
2014年预计产值 =163.66(万元) 4.
t 32. 025.618y t +=
2014年预计产值 =26.578(万元)
第九章指数
一、单项选择题
1. C2. A 3. C 4. B 5. B 6. A 7. B 8. C 9. D 10. A 11. B12. C
13. C 14. A 15. B 二、多项选择题
1. BDE 2. BCE 3. A CE4. BCDE 5. ABE 四、计算题 1. 11.4f
f x x 0
00==
(元 /件) 12. 10f
f x x 1
1
11==
(元 /件)
10.7f
f x x 1
1
0n
==
∑(元 /件)
单位成本指数:
%77. 88x x 0
1=
28. 1x x 01-=-(元 /件)
固定结构指数:
%58. 94x x n 1=
58. 0x x n 1-=-(元 /件)
结构影响指数:
%86. 93x x 0
n =
7. 0x x 0n -=-(元 /件)
综合分析:88.77%=94.58%×93.86% -1.28=-0.58-0.7 2. 产值指数 %010p
p 0
1
1==
∑q q
0p
p 0
1
1=-∑∑q q (万元) 以上计算结果表明,该企业三种产品的产值变动为 0,增加的绝对数量为 0元。 产品产量指数 %45. 97p
p 0
001==
q q K q
5p
p 0
1-=-∑∑q q (万元)
以上计算结果表明,三种产品的报告期产量比基期下降了 2.55%,使得报告期的产值 比基期减少了 5万元。
价格指数 %62. 102p
p 0
1
11==
∑q q K z
5p
p 0
11
1=-∑∑q q (万元)
以上计算结果表明,三种产品的报告期价格比基期提高了 2.62%,使得报告期的产值
比基期增加了 5万元。
综上, 100%=97.45%×102.62%
0万元 =-5万元 +5万元
3.
工资总额总变动:
%4. 113E E 01
=67E E 01=-(万元) 职工人数影响:%105a a
b a b a 0
10001==
250000
b ) a (a001=-(元) =25万元 平均工资影响:%108b b
b a b a 0
10111==
420000) b b (a 011=-?(元) =42万元
综合分析:113.4%=105%×108% 67=25+42 4.
①总产值指数 =
%11. 111q p q p 0
01
1=∑∑
=-80q p q p 0
011(万元)
②总产量指数 =%17. 114q p q p k 0
00
0q = 822-720=102(万元) ③物价总指数 =
%32. 97q
p q p 1
11=∑ 800-822=-22(万元)
5.出口额变动:
%15. 202q
p q p 0
01
1= 160100-79200=80900(元)
出口量影响:
%21. 121q p q p 0
01
0=∑ 96000-79200=16800(元)
出口价影响:
%77. 166q
p q p 1
1
1= 160100-96000=64100(元)
综合分析:202.15%=121.21%×166.77% 80900=16800+64100
6.①工资总额变动情况:
%82. 122f x f x 0
011=∑ 795600-647800=147800(元) 79. 1774f f x x 0000==∑(元 /人) 23. 1850f f x x 1111
==∑(元 /人) 37. 1768f f x x 1
10n ==(元 /人) 工人人数的变动:%81. 117f
f 0
1
=∑ 115361
x ) f f (001∑∑=-(元) 月工资水平的变动 :
%104.25x x 0
1=
32439f ) x x (101=-∑(元)
综合分析:122.82%=117. 81%×104.25% 147800=115361+32439 ②月工资水平指数:
%104.25x x 0
1=
32439f ) x x (101=-∑(元)
固定结构指数:
%63. 104x x n
1=
8. 35199f ) x x (1n 1=?-∑(元)
结构影响指数:
%64. 99x x 0
n =
∑-=?-6. 2760f ) x x (10n (元)
综合分析:104.25%=104.36%×99.64% 32439=35199.8-2760.6
第十章抽样调查
一、单项选择题
1. B 2. B 3. B 4. C 5. C 6. D 7. C 8. D 9. B 10. B
11. B 12. C 13. B 14. A15. B 二、多项选择题
1. ABCD2. ABCE 3. ACDE 4. ADE 5. CDE
第 1
章总论 四、计算题 1.
(1)重复抽样:82. 43n
2
==
σμ(小时)
89. 85t ==?μ(小时)
44914.11≤ X ≤ 45085.89 不重复抽样:38. 43) N
n
1(n
2
=-
=
σμ(小时) 02. 85t ==?μ
44914.98≤ X ≤ 45085.02 2.
(2) %6p =
%37. 2n
)
p 1(p p =-=
μ %74. 4t p ==?μ
1.26%≤ P ≤ 10.74%
不能认为这批水果罐头的不合格率不会超过 10%
3.① 16t n 2
2
2=?=σ ② 19. 267)
p 1(p t n 2
2=?
-=≈ 268(个) 4. %97. 0n
)
p 1(p p =-=
μ %94. 1t p ==?μ
93.06%≤ P ≤ 96.94%
5. 525. 5f xf x ==(安培 ) 1919. 0f
f ) x x (2
2
=-=
σ(安培) 044. 0n
2
==
σμ(安培)
0.088t ==?μ(安培)
5.437≤ X ≤ 5.613
该批电池合格。
6. 5. 331f xf x ==(天) 75. 227f
f ) x x (2
2
=-=
σ(天) 75. 0) N
n
1(n
2
=-
=
σμ(天) 47. 1t ==?μ(天)
330.03≤ X ≤ 332.97
7. 44. 14n n x x i
i
==
∑(小时) 96. 14n
n i
2i 2i ==
σσ(小时)
41. 0n
2
i ==
σμ(小时) 0.82t ==?μ(天)
13.62≤ X ≤ 15.26
8.样本平均数:75==
∑r
x x i
(头)
样本群间方差:)
r
x x
r
i i
x
∑=-=
1
2
2
δ
200=(头)
平均数抽样平均误差:??
?
??--=
12R r R r x x δμ6.06=(头) 抽样极限误差:12.12==?x x t μ(头)
62.88≤ X ≤ 87.12
95.45%的概率下平均每户存栏生猪头数的置信区间为:49.9828~50.4172公斤 样本成数:r
p
p r
i
i
∑=
%706
%
71%72%70%68%69%70=+++++=
样本群间方差:()r
p p r i
i
p ∑-=2
2
δ000167. 0==0.0167%
成数抽样平均误差:
??
?
??--=
12
R r R r p p δμ005178. 0==0.5178%
抽样极限误差:%0356. 1==?p p t μ
95.45%的概率下平均包装一等品率的置信区间为:68.9644%~71.0356%
第十一章相关分析与回归分析
一、填空题
1.完全相关、不完全相关、不相关、直线相关、曲线相关、单相关、复相关
2. -1≤ r ≤ +1 3.函数、 +1或 -1
4.无直线相关关系、完全正相关、完全负相关 5.估计标准误差 二、单项选择题
1. B 2. B 3. A 4. B 5. C 6. C 7. A 8. D 9. C 10. D 三、多项选择题
1. ACD 2. DE 3. ABCE 4. AB 5. ACE 6. AD 7. ABDE 8. CD
9. AC D10. ABE 四、判断题
1.× 2.√ 3.× 4.× 5.× 五、计算题 1. ① ∑∑∑---=
2
2
2
2
)
(. ) (. y y n x x n y
x xy n r 9478. 0=二者是高度正相关。
② x y c 8958. 059. 395+= ③ 65
. 126=y S
④
当 x=1100万元时, 97. 1380=c y (万元)
第 1
章总论 2.
① =r 9558. 0二者是高度正相关。 ② x y c 2. 54. 20+= ③ 53. 6=y S
3.① x y c 0955. 09098. 17+-= x=500,
84. 29=c y
② 9338. 0=y S
范文四:《统计学基础(第2版)》参考答案
【习题与实践训练】答案 第一章
判断题
1. × 2.× 3.× 4.× 5.× 6.× 7.√ 8.× 9.× 10.√ 单项选择题
1.B 2.D 3.D 4.D 5.A 6.C 7.D 8.B 9.A 10.C 多项选择题
1.BCDE 2.ABCD 3.ACD 4.ADE 5.ABC 6.ABCDE 7.ADE 8.BCE 9.ABCDE 10.BCD 填空题
1. 工作过程与结果 理论与实践 2.统计设计、统计调查、统计整理和统计分析 3. 大量观察法、统计分组法、综合指标法 4. 变动的数量标志 5. 总体单位 数量标志 品质标志 统计总体 数量指标 质量指标 6. 指标条件 指标名称、指标数值、指标单位 7.一系列相互联系的统计指标所组成的有机整体 基本 专题 8. 定性数据 定量数据 9.母体 子样 10.连续型变量 离散型变量 应用能力训练题 1. 略 2.略
3. ⑴总体:持有该公司信用卡的所有顾客;总体单位:持有该公司信用卡的每一位顾客; 样本:300名顾客;样本量:300名;品质标志:过去六个月是否购买产品;数量标志:每位顾客购买金额;数量指标:300名顾客购买总额;质量指标:平均购买额为1782.67元;统计量:300名顾客平均购买额为1782.67元;参数:持有该公司信用卡的所有顾客购买总额。⑵本案例采用的统计方法属推断统计。
4. 轿车生产总量,旅游收入是数量指标;经济发展速度,人口出生率,安置再就业人数,城镇居民人均可支配收入,恩格尔系数是质量指标。
区分数量指标与质量指标的方法是:数量指标用绝对数表示,质量指标用相对数和平均数表示。
5. 总体:中国农民;样本:全国31个省(区、市)6.8万户农村住户的农民;变量:现金收入、工资性收入、出售农产品的收入、家庭二、三产业生产经营收入、财产性收入、转移性收入。 6. 略。
第二章
判断题
1. × 2.× 3.× 4. √ 5.× 6.× 7. × 8. √ 9.× 10. × 单项选择题
1.C 2.A 3.A 4.C 5.B 6.D 7.A 8.C 9.B 10.D 多项选择题
1.BDE 2.ACD 3.BCD 4.ADE 5.BCE 6.ABCE 7.ABCE 8.BDE 9.BDE 10.ABC 填空题
1. 单一表 一览表 2.普查 抽样调查 重点调查 典型调查 3.全面调查 非全面调查 4. 直接观察法 5.有意识 随机 6.统计调查方案 7.表头 表体 表脚 8. 访问法(采访法、询问法)9. 开放式问题 封闭式问题 10.网上直接调查 网上间接调查
应用能力训练题 1. 略 2.略
3. ⑴全面调查 一次性调查 直接调查 统计报表 ⑵全面调查 一次性调查 直接调查 普查
⑶非全面调查 经常性调查 直接调查 抽样调查 ⑷非全面调查 经常性调查 直接调查 重点调查 ⑸非全面调查 经常性调查 直接调查 典型调查 4. ⑴直接观察法 直接调查 ⑵实验法 直接调查 ⑶访问法 直接调查 ⑷网上调查 直接调查 5. 略 6.略
第三章
一、判断题
1.× 2. × 3. × 4. × 5. √ 6. √ 7. × 8. × 9. √ 10. √ 二、选择题
1.B 2. B 3. C 4.A 5. D 6.A 7.D 8.B 9.D 10.A 三、多项选择题
1.ACD 2.BCD 3.ABDE 4.CD 5.ACE 6.BCE 7.BCD 8.ABE 9.BCDE 10.BC 四、填空题
1. 选择分组标志和划分各组界限 2. 类型分组、结构分组和分析分组 3. 品质分配数列 变量分配数列
4. 组限 每个组的最大值 每个组的最小值 组中值 5. 反比
6. 上组限不在内
7. 等距分组 异距分组
8. 按某标志分的组 各组相应的分配次数或频率或标志值 频数 频率 9. 钟型分布、U 型分布和J 型分布。
10.总标题、横行标题、纵栏标题和数字资料 五、应用能力训练题 1.组距数列分布表
2.组距数列分布表
3.组距数列频率及累计频数分布表
成绩呈钟型分布。
60分以下5个人,80分以上23个人。 4.品质标志分组
按数量标志分组
复合表
第四章
一、判断题:
√ 2. × 3. × 4. × 5. × 6. × 7. × 8. × 9. √ 10. × 二、单项选择题
1.B 2.A 3.D 4.B 5.B 6.D 7.A 8.D 9. C 10.C 11.D 12. C 13.A 14.B 15.D 16.B 17. D 18.B 19.A 20.D 三、多项选择题
1.ACE 2.ABC 3.ABCD 4.CDE 5.AC 6.BD 7.ABC 8.ABC 9.ABE 10.BE 四、填空题
1. 总体单位总量 总体标志总量 时期指标 时点指标 2. 劳动单位3. 有名数 无名数 无名数 4.
水平法 累计法
5. 比较相对数 结构相对数 6.比较 7.时期 8.结构 9.强度相对 平均 10.可比 五、应用能力训练题:
1. 销售利润率超额完成计划3.7% 劳动生产率完成计划100.5%
实际比计划少下降0.52个百分点
4. 实际产值2007年比2006年增长10%
计划规定比上年增加8.5% 实际产值2007年比2006年的增长率=110%×(1+8.5%)-1=19.35% 5. 计划规定比上年增加的百分比为(1+6%)/103% -1=2.9%;
降低成本计划完成情况指标=1365/(1398-20)=99.06%,完成了计划,超了0.94%,多降低了13元。 6. 略
第五章
一、判断题
1. × 2.× 3.× 4. √ 5.× 6.× 7. × 8. √ 9.× 10. √ 二、单项选择题
1.B 2.A 3.A 4.C 5.A 6.A 7. A 8.A 9.C 10.C 三、多项选择题
1.BDE 2.BC 3.ABCD 4.ACDE 5.CD 6.ABCE 7.ABC 8.CD 9.AB 10.ABCD 四、填空题
1. 一般水平(代表水平,典型水平) 2.次数 次数比重 3. 75% 4. 93.97%
5. 平均数 6.最多 当中 位置 7.总体标志总量 同一总体单位总量 8.极端变量值 没有明显集中趋势 9. 11.76% 10.集中 离散 五、应用能力训练题
1. 营业收入的平均数是: =2138.9573(亿美元) 中位数是1901.91亿美元。 2. 解:
计划完成程度% 组中值x 计划任务数f 实际完成数xf 90——100 0.95 80 76 100——110 1.05 400 420 110——120 1.15 120 138 合 计 — 600 634 平均计划完成程度= 634/600=105.67% 3. 解:
蔬菜名称 价格(元/千克)x 成交额(元)m 成交量(千克)m/x 土豆 1.2 1200 1000 油菜 1.6 3200 2000 蘑菇 2.2 2200 1000 合计 — 6600 4000 蔬菜的平均价格= 6600/4000=1.65(元/千克) 4. ⑴平均成绩= 79分 ⑵平均成绩= 78.33分 ⑶平均成绩= 79.67分
⑷全体学生平均成绩的变化原因在于男女生人数所占比重变动。 5.
年 龄 听众人数f 组中值x xf 15——20 9 17.5 157.5 20——25 16 22.5 360 25——30 27 27.5 742.5 30——35 44 32.5 1430 35——40 42 37.5 1575 40——45 23 42.5 977.5 45——50 7 47.5 332.5 50——55 2 52.5 105
合 计 170 — 5680 ⑴听众年龄的平均数=5680/170=33.41 岁 众数为 = 34.47岁
⑵听众年龄的标准差=7.62 岁 6. 解:
年龄 18以下 18—24 25—30 31—35 36—40 41—50 51—60 60以上 比重% 17.7 33.5 19.4 10.1 8.4 7.2 2.7 1.0 组中值x 14 22 27.5 33 38 45.5 55.5 65.5 中国互联网用户平均年龄= 27.1375岁 标准差=10.65岁 7. 答:
⑴如果给每个标志值都加上5分钟,平均数=12.3+5=17.3分钟 ⑵如果给每个标志值都加上5分钟,标准差=4分钟 ⑶如果给每个标志值都加上5分钟,方差=16
⑷如果给每个标志值都加上5分钟,众数、中位数、四分位数都相应增加5分钟。 8. 解:采用平均指标和标志变异指标评价组装方法的好坏。
平均组装个数(个) 标准差 标准差系数% 第一种方法 128.73 1.69 1.31 第二种方法 165.6 2.06 1.24 第三种方法 165.4 6.76 4.09
因为第二种方法平均组装个数最多,标准差系数最小,所以应选第二种方法。 9. 幼儿组平均身高=71.3cm,标准差=2.37cm,标准差系数=3.32% ;
成年组平均身高=172.1cm,标准差=3.99cm,标准差系数=2.32% ;幼儿组的身高差异大。 10. 解:
⑴应用变异指标来反映投资风险。
⑵甲股票价格的标准差=3.97,平均数=27,标准差系数=14.70% ; 乙股票价格的标准差=2.61,平均数=27,标准差系数=9.67% ; 丙股票价格的标准差=8.19,平均数=24,标准差系数=34.13% ; ⑶如果进行股票投资,应选乙股票。
第六章
一、判断题
1. × 2.× 3. √ 4. × 5.× 6. √ 7. × 8. × 9. √ 10. √ 二、单项选择题
1.B 2.A 3. B 4.C 5. C 6. B 7. A 8. B 9. B 10.C 三、多项选择题
1.ACD 2.ABCD 3.ABCE 4.ABCE 5.ADE 6.ABCDE 7.BC 8.ACD 9.ACDE 10.BCD 四、填空题
1.抽样调查、总体相应数量 2.总体标准差、样本单位数 3.不重复抽样 4.分类抽样 5.抽样极限误差
6.抽样平均误差
7.样本方差、样本成数 8.原假设、备择假设 9.30个
10.抽样极限误差、抽样平均误差 五、应用能力训练题 1.重复抽样条件下:
μp =P (1-P )
n =3%
不重复抽样条件下:
μp P (1-P n ? ) ?
1-? n N ??
=2.98%
2.n=400,p=0.721,t=1.96
μp =P (1-P )
n =2.24%
下限=0.721-1.96×2.24%=67.4%;上限=0.721+1.96×2.24%=76.8%
即: 我们能用95%的概率保证该新家电产品的市场占有率大约在67.4%—76.8%之间。 3. t=1.96
n =
t 2σ2
?2
x
=49.79≈50
4.列表计算如下:
月平均工资(元) 工人人数(人)
524 4 2096 5184 534 6 3204 4056 540 9 4860 3600 550 10 5500 1000 560 8 4480 0 580 6 3480 2400 600 4 2400 6400 660 3 1980 30000 合计 50 28000 52640 总体月平均工资的区间: 550.82—569.18元。 总体工资总额的区间: 826230—853770元 5. n=400,p=0.04
μp P (1-P n ? ) ?
1-? n N ??
=1.35%
下限=0.04-2×1.35%=1.3%;上限=0.04+2×1.35%=5.3%
所以,不能认为这批产品的废品率不超过5%。 6.第一步提出假设H 0:X ≤424.20 H1:X > 424.20
第二步计算统计量。由于总体标准差σ未知,用样本标准差S 替代。Z 统计量为
代入数值,得Z=1.84
第三步查临界值。因为是右单侧检验,α=0.05时其临界值Z 0.05=1.645 第四步比较做决策。∵Z=1.84>Z 0.05=1.645 ∴拒绝H 0
即美国产业工人的平均周收入与1997年相比有显著提高。 7.
及格率区间为74.32%—89.68%。
在其他条件不变时,允许误差缩小一半,应抽取400名学生。 8.列表计算如下:
组中值 包数 148.5 10 1485 32.4 149.5 20 1990 12.8 150.5 50 7525 2 151.5 20 3030 28.8 合计 100 15030 76 样本平均数: 150.3 样本方差: 0.76 抽样平均误差:0.087
当t=3时, 下限=150.3-3×0.087=150.04;上限=150.3+3×0.087=150.56 即:150.04—150.56克
表明这批食品平均每包重量达到规格要求。 (2)样本合格率: 70% 抽样平均误差:
μp =P (1-P )
n =0.0458
当t=3时,下限=0.7-3×0.0458=56.26%;上限=0.7+3×0.0458=83.74%
即:这批食品包装的合格率在56.26%—83.74%之间。
9.因为 置信区间宽度为4个百分点,所以抽样极限误差为2%。
t 2P (1-P ) n = ?2p
=1536.64≈1537
10.N=2000,t=2,p=60%
μp P (1-P n ? ) ?
1-? n N ??
=4.77%
下限=0.60-2×4.77%=50.46%;上限=0.60+2×4.77%=69.54%
以95.45%的概率估计该校学生英语等级考试成绩在70分以上的学生所占比重范围为50.46%-69.54%。
第七章
判断题:
1. × 2.√ 3.× 4.× 5.√ 6.× 7.√ 8.√ 9.× 10.√ 单项选择题:
1.D 2.A 3.C 4.C 5.C 6.B 7.A 8.D 9.B 10.C 多项选择题:
1.CE 2.ABC 3.BC 4.ABD 5.ABC 6.ABCD 7.AD 8.BDE 9.BDE 10.ADC 填空题:
1.时期 数值 2.时期 时点 3.时点 时期
4.现象的水平分析 速度分析 5.变量数列 动态数列 6.33.06%
7. 连乘积 和
8.相应的环比发展速度 前一期的累计增长量 9.0.94%
10.按月(季)平均法 移动平均趋势剔除法 应用能力训练题 1.300.3辆
2.72627.96亿元 3.84.4% 4.(1)197.3万元(2)205.3人(3)2.88万元
(4)4月份的=0.98万元 5月份的=0.86万元 6月份的=1.05万元 (5)0.96万元 5. (1)
(2)平均增长量=32万台(3)平均发展速度=112.5%(4)平均增长速度=12.5% 6.2010年将达到什么水平=204872.2亿元
7.如果以后每年增长8%,需要9年后才能达到200亿元。 8.
年份 2001 2002 2003 2004 2005 2006 2007 销售额(百万元) 5.6 11.4 17.1 24 31.3 38 43.9 逐期增长量(百万元) — 5.8 5.7 6.9 7.3 6.7 5.9 累计增长量(百万元) 0 5.8 11.5 17.4 24.7 31.4 37.3 定基发展速度 100 203.57 305.36 428.57 558.93 678.57 783.93 环比发展速度 — 203.57 150 140.35 130.42 121.41 115.53 增长1%的绝对值 — 0.056 0.114 0.171 0.24 0.313 0.38 (5)平均增长速度=140.94% (6)
?∑y a =?
n ?
?ty ?b =?∑t 2?b=6.5107;a=24.47 y c =24.47+6.5107t
当t =4时 2008年销售额=50.51百万元
9.(1)季节变动(2)季节变动(3)长期趋势(4)不规则变动 (5)循环变动(6)季节变动
10.四项移动平均并经二次移动后数列为 (1)单位:万吨.
年份 一季 二季 三季 四季 2001 13.125 13.375 2002 13.75 14.25 13.5 13.75 2003 15.25 16 16.875 18.125 2004 19.625 20.625 (2)
年份 一季 二季 三季 四季 合计 季平均数 2004 15 7 10 20 52 13 2005 16 8 12 20 56 14 2006 18 10 14 24 66 16.5 2007 21 17 19 27 84 21 合计 70 42 55 91 258 64.5 同季平均数 17.5 10.5 13.75 22.75 64.5 16.125 季节比率% 108.53 65.12 85.27 141.08 400 100
(3)假设2008年全年计划收购量为120万吨,则将计划目标分解,一、二、三、四季度计划收购量应分别为32.559;19.536;25.581;42.324万吨。
第八章
判断题
1. × 2.× 3.× 4.× 5.× 6.× 7.× 8.× 9.× 10.√ 单选题
1.B 2.D 3.C 4.B 5.B 6.A 7.B 8.C 9.C 10.C 多选题
1.ABC 2.CE 3.BCE 4.ACD 5.AE 6.AB 7.ACD 8.ADE 9.ABD 10.CDE 填空题
1.加权算术平均指数 加权调和平均指数 2.降低了9.1% 3.6.05% 4.指数
5.质量指标 基期 数量指标 报告期
6.个体指数 算术 调和
7.假设在报告期产量的情况下,报告期成本比基期比基期降低了3% 由于单位成本的降低使总成本报告期比基期减少了2200元 8.105.26% 9.下降10% 10.上升1.03% 应用能力训练题 1.
2. (1)甲: 114.29% 105% 乙: 100% 100% 丙: 97% 110%
(2)三种商品的物价总指数=100.79% 三种商品的销售量总指数=105.83% (3)三种商品的销售额总指数=106.67% (4)106.67%=105.83%×100.79% 400万元=350万元+50万元
3.产品产量的变动对产值的变动影响 106.07% ; 80.12万元
单价的变动对产值的变动影响 114.77% ; 169.88万元
4.(1) 价格总指数=99.42% 销售量总指数=129.55%
(2)在总销售额增长绝对值中,受价格因素影响的绝对值 =-200万元 在总销售额增长绝对值中,受销售量因素影响的绝对值=7800万元
7600万元=(-200万元)+7800万元
5.(1)生产总成本指数=107.5% (2)产品产量指数=110.8% (3)由于单位成本降低而节约的绝对额=-0.396万元 6.(1) 102% 2007年与2006年比较,零售物价上升2% 绝对量=49.3亿元 零售量指数=107.30% 绝对量=171.5亿元 109.4%=107.30%×102%
220.8亿元=171.5亿元+49.3亿元 7. (1)2006年的总平均成本=9.96元 2007年的总平均成本=9.23元 (2)平均成本指数=92.7% (3)92.7%=109.39%×84.72% -0.73=0.792+(-1.522)
第九章
一、判断题
1. × 2.× 3. √ 4. √ 5. √ 6. √ 7. √ 8. × 9. √ 10. √ 二、单项选择题
1.C 2.C 3.C 4.D 5. C 6. C 7. B 8. B 9.B 10.D 三、多项选择题
1. ABCD 2. AB 3. DE 4. BD 5. ABD 6.BCE 7. ABD 8. BCDE 9. ADE 10. DE 四、填空题
1. 函数关系 -1或+1 2.相关关系 3.估计标准误差 4.方程的起点值 回归系数 最小平方法 5.前提和基础 深入和继续 6.平均数 回归方程 7.完全负相关 完全正相关 完全无直线相关 8. 0到1之间 9.代表性最差 代表性最好
10. 0<|r|<0.3为微相关,0.3≤|r|<0.5为低度相关,0.5≤|r|<0.8为显著相关,0.8≤|r|<1为高度相关。 五、应用能力训练题 1. ⑴编制相关表如下:
航班正点率% 91.4 81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 68.5 顾客投诉次数 18 21 58 85 68 74 93 72 122 125 相关图为:
由此可见,航班正点率和顾客投诉次数之间成负相关关系。 ⑵相关系数=—0.8686
⑶ 回归方程yc=430.19—4.7006x 回归系数的意义是航班正点率每提高1%,顾客投诉次数平均下降4.7006次。
⑷如果航班正点率为80%,顾客的投诉次数=54
2. 解: ⑴用广告费支出作自变量,销售量作因变量,估计的回归方程yc=4.07+0.1958x ⑵广告费用每增加10000元,销售量将上升1958箱。
3. 解: ⑴飞行成本y 依乘客数量x 的直线回归方程yc=1.57+0.0407x ⑵飞行每增加一名乘客,飞行成本将增加40.7美元。
⑶在此案例中,即使飞行时不搭载乘客,飞行500英里的飞行成本为1570美元。
4. 解: ⑴账单数额和小费数额之间相关系数=0.8282,所以两者之间存在高度正相关关系。 ⑵账单数额和小费数额之间回归方程为yc=-0.35+0.1486x 当账单数额为100美元时,应该留下小费数=14.51美元 ⑶现已知给出小费10元,回归方程为yc=24.74+4.6150x 其消费的账单数额为70.89美元 5. 解:
⑴科研经费支出与公司利润之间相关系数=0.9091 ⑵利润y 依科研经费支出x 的直线回归方程yc=20+2x
⑶当科研经费支出为120万元时,利润=44(10万元)=440万元 ⑷当利润为380万元时,回归方程yc=-7.40+0.4132x
科研经费支出=-7.40+0.4132x38=8.3016(10万元)=83.016万元 ⑸估计标准误差=6.3509
6. 解:两者之间的相关方向为负,相关系数=—0.8278 高度负相关; 债券利率依最低贷款利率变化的直线回归方程yc=15.46—0.7146x 当最低贷款利率为5%时,债券利率=11.887% 7. 略。 8. 略。
第十章
16项统计值:
2. 图略。
3. Excel函数计算结果:平均数123.42、众数123、中位数123、极差44、平均差8.5168、标准差10.65046。
利用分组资料计算结果:平均数123.4、众数123.5714、中位数123.3333、极差50、平均差8.784、标准差11.01998。 4. (1)
平均增长量-257.93 动态平均数47183.26364 (2)
平均发展速度:99.42% 平均增长速度:-0.58% (3)移动平均法
最小平方法y c =48239. 18-175. 986x
5.(1)按季平均法
(2)移动平均趋势剔除法:
除法剔除长期趋势后季节比率计算如下表:
6.(1)价格指数为:0.886957
销售量指数为:1.118541
(2)销售额指数=价格指数×销售量指数
即:0.992097=0.886957×1.118541 由于价格变动对销售量的影响数为:-2080 由于销售量变动对销售额的影响数为:1950 销售额总变动为:-130
销售额总变动=由于价格变动对销售量的影响数+由于销售量变动对销售额的影响数即:-130=-2080+1950 7.相关系数为:0.993402 回归方程为:y c
=-7. 273+0. 074x
8.(1)相关系数为:0.749
(2)回归方程为:y c =0.000413+0.005883x
大哥:snail
范文五:新编统计学(第2版)
第一章 总 论
【学习目标】
? 了解统计的含义及统计实践和统计学的产生和发展过程。
? 熟悉统计学的研究对象和统计研究的基本方法。
? 理解统计学的基本概念。
? 了解Excel在统计分析中的主要功能及其使用方法。
第一节 统计的产生和发展
一、统计的含义
在日常生活中经常会接触到“统计”这一术语。“统计”一词由来已久,其英文表示为Statistics,最早出自拉丁语Status(状态),是指各种现象的状态和状况。汉语中“统计”原为合计或汇总计算的意思。在东汉时期称统计为通计,在南北朝时期称统计为总计,至清亁隆十二年(公元1747年),开始使用“统计”一词。
现代“统计”一词有三种含义,即统计工作、统计资料和统计学。
统计工作即统计实践活动,是指运用科学的方法,按照预先设计的要求,对社会现象的数量方面进行收集、整理和分析的工作过程的总称。社会经济统计则是指对社会经济现象的数量方面进行收集、整理和分析的工作过程的总称。一个完整的统计工作过程包含了统计设计、统计调查、统计资料整理和统计分析等几个阶段。
统计资料是在统计工作过程中取得的各项数字资料及与之有联系的其他资料的总称。统计资料是统计工作各阶段的成果,既包括统计调查收集的原始资料,也包括经过加工整理、分析研究从而形成的综合统计资料,如综合统计报表、统计汇编、统计年鉴、统计公报及统计分析报告。准确、可靠的统计资料是宏观经济决策和微观经济管理中分析、研究社会经济现象不可缺少的重要依据。
统计学是关于认识客观现象总体数量特征和数量关系的科学。它是从统计实践中概括、提炼、总结出来的,系统地论述统计理论和方法的科学。统计学按照研究领域和研究重点的不同可以分为许多分支。研究统计的一般理论和方法的科学称为理论统计学,理论统计学一般可分为描述统计学和推断统计学两大类。而研究特定领域的统计理论和方法的科学称为应用统计学,如国民经济统计学、人口统计学、卫生统计学、工业统计学和地质统计学等。社
新编统计学(第2版) 2 Statistics
会经济统计学则是关于社会经济现象数量方面的收集、整理、分析的原理、原则和方式方法的科学,按其性质划分,它属于应用统计学。
统计的三种含义之间存在着密切的联系。
统计学与统计工作的关系是理论与实践的关系。一方面,统计工作是形成统计学的基础。统计理论是统计工作经验的总结,只有当统计工作实践发展到一定阶段时,才能形成独立的统计科学。统计实践的发展,又不断地丰富并推进着统计科学理论的发展。另一方面,统计工作的发展又需要统计理论的指导,统计科学研究大大促进了统计实践工作水平的提高,统计工作的现代化与统计科学的进步是分不开的。
统计工作和统计资料的关系是统计活动与统计成果的关系。一方面,统计资料的需求支配着统计工作的设计;另一方面,统计工作的质量高低又直接影响着统计资料的数量和质量。统计工作的现代化关系到向社会提供丰富的资料和信息、提高决策可靠性和工作效率的重要问题。
本书主要介绍的是统计学的基本理论和方法,并且侧重于介绍这些理论和方法在社会经济领域中的应用,但实质上大部分知识是可以通用于各个领域的,如数据分布特征描述、时间序列分析、抽样估计和相关与回归分析等。
二、统计实践的产生与发展
统计的起源很早,统计的实践活动已经存在了几千年。一般的计数活动早在原始社会时期就已存在,主要表现在人们对仅有的剩余劳动成果或其劳动对象加以清点与度量。逐渐地,有了结绳记事、绘图记事等统计计量的方法。
在奴隶社会,由于国家在赋税、徭役、征兵及治水等方面的需要,就开始了人口、土地等基本国情的登记和计算工作。据《书经?禹贡篇》记载,我国在4000多年前的夏朝(公元前22世纪),全国人口总数为13 553 923人,当时我国的基本土地情况是拥有土地24 328 024顷,并根据山川土质、人口物产及贡赋多寡,将全国分为九州。由此可见我国人口统计历史的久远。我国这些人口、土地等统计,被西方经济学家推崇为“统计学最早的萌芽”。西周建立了较为系统的统计报告制度,统计作为治理国家的重要手段已经被人们所认识。而在地中海沿岸,统计活动也有悠久的历史。公元前27世纪,埃及为了建造金字塔和大型农业灌溉系统,曾进行过全国人口和财产调查。公元前15世纪,罗马帝国规定每5年进行一次人口、土地、牲畜和家奴的调查,并以财产总额作为划分贫富等级和征丁课税的依据。
在中国封建社会,统计实践已初具规模,户籍统计和田亩统计等都有很大的发展,其制度、方法和组织都居于当时世界先进水平。例如,战国各封建领域的人口数字;秦统一六国后,为了国防和财政的需要,进行了户口、土地、物产和赋税统计,有了地方田亩和户口国籍统计资料;唐代计口授田的统计计算;宋明时期采用鱼鳞册的比较完整的土地调查登记方法。清光绪三十年(1904年)已正式设立统计机构——宪政编查馆统计局,这是我国第一个
第一章 3 总论 以统计命名的全国性统计领导机构,进行关于国情、国力的统计。当然,由于在资本主义社会前期,生产力水平较低,商品经济尚不发达,统计只在有限的范围内(如人口、土地、财产和税收等方面)对国情、国力进行一些简单的登记和计算,发展缓慢。
随着资本主义社会制度的出现和迅速发展,社会分工日益具体,社会生产力和商品经济得到高度发展,国内外竞争日趋激烈,社会生活日趋复杂。为了满足管理国家以及对内对外进行资本主义掠夺和扩张的需要,许多国家对有关的经济活动进行了广泛的统计。欧洲各国政府相继建立了独立的统计机构,为统计的发展提供了客观条件。定期或不定期地举行人口、工业、农业、贸易和交通等各项调查,出版统计刊物,使统计工作成为社会专业性活动。除了人口、税收、土地等传统内容外,商业、航运、外贸和工业等领域统计数字的记录和传播也空前活跃,使统计工作开始从国家管理领域扩展到社会经济活动的多个领域,成为经营决策和生产管理的重要手段。在19世纪上半叶,欧洲出现了所谓的“统计的狂热时代”:工业、农业、商业、交通、邮电、海关、银行、保险乃至于人口、社会各方面都逐步形成专业的统计;建立了人口、工业、农业普查制度;各国先后成立了统计学会,大大促进了统计事业的发展,积累了大量的统计资料。
20世纪50年代以后,随着电子计算机技术的发展和各种统计分析软件的应用,使统计数据的汇总整理、计算分析、发布、传输和储存管理都发生了革命性的变化,统计活动的开展更加方便、快捷,统计的应用几乎无所不在。
新中国建立以来,我国统计工作经历了曲折的发展过程。第一个时期是“**”以前的17年(1949—1966),这是新中国统计工作建立、健全和发展的时期。第二个时期是“**”时期,统计工作遭到严重的破坏。第三个时期是统计工作恢复和重新发展的时期。在这一期间,全面恢复了统计机构,建立和健全了从中央到地方的统计组织;调整了统计指标,产生了一系列从多角度、多侧面反映我国社会主义经济建设的统计指标体系;颁布了多项法律法规。1984年1月1日颁布了《中华人民共和国统计法》(以下简称《统计法》);1987年2月国家统计局发布了《中华人民共和国统计法实施条例》,对我国《统计法》的基本内容作了具体的规定;1996年5月在第八届全国人民代表大会常务委员会第十九次会议上审议通过了《关于修改〈中华人民共和国统计法〉的决定》。新的《统计法》的颁布实行,更标志着我国统计法制建设取得了突破性的进展,大力推进了统计现代化建设,灵活应用多种调查方法,广泛开展统计工作和统计理论的国际交流,使我国的统计工作逐步与国际统计接轨。 三、统计学的产生与发展
随着统计实践活动的产生和发展,人们对统计工作实践经验不断进行总结和概括,进而形成了指导统计实践的统计科学。在统计科学的发展史上,从17世纪到19世纪中叶,形成了各种不同的统计学派。统计学的产生与这些统计学派的理论和研究成果密切相关。
新编统计学(第2版) 4 Statistics
,一,国势学派
国势学派是17世纪中叶产生于德国的统计学派,是最早的流派之一。其创始人是德国赫姆斯特(Helmstadt)大学教授海尔曼?康令(H. Conring,1605—1681),主要继承人是德
1719—1772)。该学国哥廷根(Gottingen)大学教授哥特弗里德?阿亨华尔(G. Achenwall,
派认为统计学是研究一个或几个国家的显著事项的学问,即“关于国家组织、人口、军队、领土、财产、地面和地下资源等事实的学问”;其研究对象是有关国家富强的重大事项,包括地理、政治、经济、法律等;研究方法是对各国情况进行比较,以文字记述为主,记述国情、国力的情况。阿亨华尔在1749年出版的《近代欧洲各国国势学论》中首创了一个新的德文词 语——Statistik,即“统计学”。统一了统计学的称谓是该学派的主要贡献。但这一学派主要使用文字记述的方法而很少用数字手段进行研究,可谓有统计学之名,而无统计学之实。
,二,政治算术学派
政治算术学派是17世纪中叶在英国兴起的统计学派,其创始人是威廉?配弟(William Petty,1623—1687)和约翰?格朗特(John Graunt,1620—1674)。约翰?格朗特在《关于死亡表的自然与政治的观察》(1662年)一书中,运用数量对比的方法对伦敦人口的有关重要指标进行了分析,发现了其中的数量规律性,成为政治算术学派的先驱之一。威廉?配弟在他的代表作《政治算术》(Political Arithmetic)(1676年)一书中,把政治算术看做是“对于人口、土地、资本、产业的真实情况的认识方法”。该学派认为统计研究的目的是揭示以数量表现的社会经济现象的规律性,为制定政策提供依据;研究对象是社会经济现象,包括人口、资本、土地、军事等;研究方法采用以数字、重量、尺度表现和比较的方法,对社会经济现象进行比较和推算。威廉?配弟首创的数量对比分析方法为统计学的创立奠定了方法论基础,在典型调查、统计分组法、统计平均数、相对数、统计推算、国民收入估计和统计分析报告等方面作出了重大贡献。但该学派一直没有采用“统计学”这一名称,可谓有统计学之实,而无统计学之名。直到1850年,德国学者克尼斯(A. Knies,1821—1898)在其《独立科学的统计学》中,提出把“统计学”作为政治算术的科学命名,才结束了这种名实不符的局面。
,三,数理统计学派
19世纪中期,产生了主张以数理方法去研究社会经济现象和自然现象的数理统计学派,该学派的先驱是比利时科学家阿道夫?凯特勒(A. Quetelet,1796—1874),他首次把概率论应用于社会经济统计,对法国、英国和比利时的犯罪统计资料进行了研究,从中发现了某些社会现象的规律性,使统计方法的发展得到了质的飞跃,为统计的数量分析奠定了数理基础。贝努里(Jakob Bernoulli,1654—1705)的大数定理、莫阿弗尔(Abraham de Moivre,1667—1754)的中心极限定理、贝叶斯(Thomas Bayes,1702—1761)的主观概率、高斯(Carl Friedrich Gauss,1777—1855)的误差理论等又丰富和完善了数理统计理论。英国统计学家葛
第一章 5 总论 尔登(F. Galton,1822—1921)首先提出了生物统计学,皮尔逊(K. Pearson,1857—1936)将生物统计一般化进而发展成为描述统计学,埃奇沃思(F. Y. Edgeworth,1845—1926)、鲍莱(A. L. Bowley,1869—1957)则侧重于描述统计在社会经济领域中的应用和方法的研究,费歇尔(R. A. Fisher,1880—1962)则创立了推断统计学。20世纪50年代,又出现了贝叶斯统计学,将统计推断运用于决策问题。数理统计逐渐形成一个完整的学科体系。1867年在名为《关于数理统计学及其在政治经济学和保险学中的应用》的论文中,威特斯坦(T. Wittstein)首次提出了“数理统计学”这个术语,随即成为该学科和学派的正式名称。
,四,社会统计学派
19世纪后半叶,正是数理统计学派突飞猛进的发展之时,德国出现了社会统计学派。社会统计学派也是统计学历史上比较有影响的学派之一,其主要的代表人物是德国学者恩格尔(L. E. Engel,1821—1896)、克尼斯(A. Knies,1821—1898)、梅尔(C. G. V. Mayer,1841—1925)等。从学术渊源上看,社会统计学派实际上融汇了国势学派和政治算术学派的观点,又继承和发扬了凯特勒强调的研究社会现象的传统,并把政府统计与社会调查结合进来,进而形成了自己的观点。该学派认为统计学是一门社会科学,因而研究目的在于查明社会生活中的规律性;研究对象是社会现象,以现象的数量为主,此外包括政治、经济、道德、文化等;研究方法是大量观察法,并强调全面调查;同时,强调把作为一门应用数学的数理统计学的某些分析方法引进社会统计学中。
以上这些统计学派构成了统计学历史上的主流学派,其不同观点中的科学内容构成了统计学的基础。统计学正是对上述统计学派的观点进行归纳、提炼和总结的结果,是它们的精华部分。
第二节 统计学的研究对象和方法 一、统计学的研究对象
统计学的研究对象是现象总体的数量特征和数量关系,通过这些数量方面来反映现象变动的规律性。统计学研究对象具有以下特点。
,一,数量性
统计学研究的是现象的数量方面,通过对数量特征和数量关系的研究来揭示现象的本质和发展规律。现象的数量方面具体指它的规模、水平、结构、比例关系和速度等。统计认识过程也就是对客观事物量化和深化的过程。首先,统计在对客观事物定性认识的基础上,确定与事物性质适应的量,并表现为一定的数,再通过实验或调查取得实际的数据,使定性的
新编统计学(第2版) 6 Statistics
认识数量化、具体化,最后对大量数据加以综合分析和对比研究,达到认识事物变动量的类型、量的顺序、量的大小和量的关系的目的。
,二,总体性
统计研究社会现象的数量方面,是从总体的角度来认识现象的数量特征的。如果要研究我国国民经济态势,就要研究我国所有部门、地区或所有经济活动单位组成的总体的发展变化情况;若研究某企业职工的基本情况,就要研究该企业所有职工组成的总体的基本特征。统计研究的是总体综合的数量特征,而不是个别事物的数量特征。因而,统计具有总体性特点。
要形成对总体数量特征的认识,必然以个体事物量的认识为起点。统计在认识现象时,需要通过对组成其总体的个别事物的量的认识来达到对总体的认识,例如,为研究全国人口数量、性别构成、出生率(死亡率)等方面的情况,首先必须对每一个人进行调查研究,收集与研究总体数量相应的资料,汇总整理后形成对现象总体量的认识。认识总体的数量特征是目的,而调查研究个体是起点。
,三,具体性
统计学研究的是具体事物的数量方面,即研究社会现象在一定时间、地点、条件下的数量表现,而不研究抽象的数量,故它具有具体性的特点。这是统计学和数学的一个重要区别。数学也是以数量作为其研究对象的,但它在研究客观世界的空间形式和数量关系时,具有高度的抽象性,可以撇开所研究客体的具体内容。而统计在研究现象的数量方面时,则必须紧密联系被研究现象的具体内容,联系其质的特征。
二、统计研究的基本方法
在调查、整理、分析的各个阶段,统计运用各种专门的方法对现象进行分析研究。其最基本的研究方法有大量观察法、统计分组法、综合指标法、归纳推断法和统计模型法等。
,一,大量观察法
大量观察法是指统计研究客观现象和过程,要从总体上进行考察,对总体中的全部单位或足够多的单位进行调查并加以综合研究的方法。统计研究运用大量观察法是由社会经济现象的大量性和复杂性所决定的。复杂的社会经济现象是在诸多因素的错综作用下形成的,各单位的数量特征有很大差别,不能仅取少数单位或任意抽取个别单位进行观察,必须从总体出发,收集大量调查单位的材料,才能从中认识社会经济现象的规律性。
,二,统计分组法
统计分组法是指根据统计研究的任务和现象本身的性质特点,按照某种标志将总体区分为若干组成部分的一种统计方法。例如,将人口按性别分组、职工按职业分组、学生按成绩
第一章 7 总论 分组、企业按经济类型分组、公司按经营收入分组等。
现象总体是由某一方面具有同质性的许多单位组成的群体,但由于在其他方面总体单位之间具有一定的差别,因此有必要进行统计分组。统计分组法是研究社会经济现象总体内部差异的重要方法,通过分组可以研究总体中不同类型的性质,如工业企业按所有制不同划分、按轻重工业划分等,都说明了经济类型的不同特点;通过分组可以研究国民经济的生产力布局和产业结构问题,如国内生产总值在第一产业、第二产业和第三产业的总值和比重资料能够较为清楚地表明国内生产总值在三类产业间的分布情况;通过分组还可以研究总体中现象之间的依存关系,如劳动者的收入和劳动生产率之间的关系、商业企业的销售额与流通费用率之间的关系等。统计分组法在统计研究中的应用非常广泛。
,三,综合指标法
综合指标是指综合反映社会经济现象总体数量特征和数量关系的指标。常用的综合指标有总量指标、相对指标、平均指标等。综合指标法是指运用各种统计综合指标对社会经济现象的数量方面进行综合、概括的分析方法。对大量的原始数据经过汇总整理,计算出各种综合指标,可以反映出现象在具体时间、地点、条件下的总体规模、相对水平、平均水平和差异程度,概括地描述总体的综合数量特征及其变动趋势。
综合指标法和统计分组法之间存在着密切的关系。统计分组如果没有相应的统计指标来反映现象的规模水平,就不能揭示现象总体的数量特征,而综合指标如果不进行科学的统计分组,就无法划分事物变化的数量界限,就会掩盖现象的矛盾,成为笼统的指标。所以,在研究社会经济现象的数量关系时,必须科学地进行分组,合理地设置统计指标,指标体系和分组体系应该相适应。一般应把统计分组和综合指标结合起来进行应用。
,四,归纳推断法
归纳推断法是指对所获得的大量观察资料,通过观察各单位的特征,归纳推断总体特征的方法。一般以一定的置信度要求,采用归纳推理方法,根据样本数据来推断总体数量特征。这是从个别到一般,由具体事实到抽象概括的推理方法。归纳推断法可用于总体数量特征的估计,也可用于对总体的某些假设进行检验,在统计研究中有广泛的用途,是现代统计学的基本方法之一。
,五,统计模型法
统计模型法是根据一定的经济理论和假定条件,用数学方法模拟客观经济现象相互关系的一种研究方法。利用这种方法可以对社会经济现象和过程中表现出来的数量关系进行比较完整和近似的描述,从中将客观现象的其他复杂关系影响加以抽象和抵消,以便于利用数学模型对社会经济现象的变化进行数量上的模拟和预测。如长期趋势分析、相关回归分析、统计预测等。
统计模型法一般必须包含三个方面的构成要素,即社会经济变量、基本数学关系式和模
新编统计学(第2版) 8 Statistics
型参数。在进行实际计算与分析时,一般将总体中一组相互联系的统计指标作为社会经济变量,其中有些变量会被描述为其他变量的函数,可称为因变量,而它们所依存的其他变量则称为自变量。往往要用一个或一组数学方程式来表示现象的基本关系式,该数学方程可以是直线的,也可以是曲线的;可以是二维的,也可以是多维的。
第三节 统计学中的几个基本概念 一、统计总体与总体单位
统计总体简称总体,是指根据一定的目的所确定的研究对象的全体。它是由客观存在的某些性质相同的许多个别事物组成的整体。总体单位是构成统计总体的基本单位。例如,要研究全国钢铁企业的生产经营情况,则全国的钢铁企业就是总体,每个钢铁企业就是总体单位。
各总体单位在某一方面的同质性(共同性)是形成统计总体的一个必要条件,同时也是总体的一个重要特征。例如,上例中每一个钢铁企业间存在诸多不同的特征,但它们都是“我国的钢铁企业”,这一点是相同的,即具有相同性质。但总体的同质性不要求总体单位在各个方面都具有共同性,而只是当统计研究目的确定后,总体所构成的各总体单位在某一点上或某些方面应具有共同性。如上例,研究钢铁企业的发展,只要是钢铁企业就应该包括在该总体内,而不考虑它是国有的还是个体的。但如果目的是研究个体经济的发展,则只要是个体经济就包含在该总体之中,并不考虑其行业的归属。
一个统计总体所包含的总体单位的数量有时是无法计量的,如宇宙中星球的个数,这样的总体称为无限总体;有时是可以计量的,如一个国家或地区的人口总数,称为有限总体。社会经济现象一般都是有限总体。显然对无限总体不能采用全面调查的方法,而对有限总体则既可以用全面调查的方法,也可以用非全面调查的方法。当然,即使是有限总体也应该根据现实需要和可能来确定统计调查方法,只要是调查单位足够多就符合大量性的要求了。
随着统计研究的目的和任务的不同,构成统计总体的总体单位也不尽相同。总体单位可以是人(如一个职工),可以是物(如一台设备),也可以是企事业单位(如一个公司),还可以是一个事件、状况、长度、时间等。
统计总体和总体单位的确定是由统计研究的目的和任务决定的。因此,总体和总体单位不是一成不变的,当统计研究的目的和任务发生变化时,统计总体和总体单位必将随之发生变化。
第一章 9 总论 二、统计标志与标志表现
统计标志简称标志,是说明总体单位属性或特征的名称,如学生的身高、体重、性别,企业的收入、规模、经济性质等。每个总体单位从不同角度去观察,都具有许多特征,如将每位职工作为总体单位,他们都具有性别、文化程度、民族、职业、年龄、工龄和工资收入等特征。将每个企业作为总体单位,都具有所属行业、职工人数、占地面积、生产能力、经营收入、上缴税金、成本和利润等特征。
标志按其性质不同可分为品质标志和数量标志。品质标志是说明总体单位属性特征的名称,一般用文字表现,如人口的性别、民族、文化程度,企业的经济类型、行业、地址等;数量标志是说明总体单位数量特征的名称,一般用数值表现,如人口的年龄、学生的学习成绩、企业的利润和产量等。
标志表现是标志在各个总体单位的具体体现,如某学生的某门课程考试成绩是80分,某单位的经济性质是股份制企业等。任何一项统计工作,首先要掌握的是现象总体的各个总体单位在特定的时间、地点、条件下实际发生的情况。因此,标志的具体表现便是统计最为关心的问题。如果说标志就是统计所要调查的项目,那么,标志表现则是调查所得的结果。 三、统计指标和指标体系
,一,统计指标
1(统计指标的概念
统计指标简称指标,是反映统计总体数量特征的范畴和具体数值。例如,“2010年末我国总人口为134 100万人”就是一个完整的统计指标,它包括指标名称、指标数值、空间范围、时间和计量单位等构成因素。在统计设计阶段,统计指标是说明总体现象的数量特征的名称。例如,“全国的国内生产总值”,它不含数值,只有名称,因为其指标数值尚待统计。但设计统计指标最终都是为了取得相应的指标数值。
统计指标是统计中常用的重要概念。无论是统计研究,还是统计实践活动,自始至终都离不开统计指标,统计活动过程也就是统计指标的设计、数据形成和应用的过程。统计指标虽然依照客观实际具有不同类型,但其共同作用表现为:从认识的角度,统计指标是以具体数值来反映社会经济现象的数量特征、变化规律及数量关系;从社会管理和科学研究的角度,统计指标是制定政策、管理国民经济、进行科学研究的事实依据。
2(统计指标的特点
统计指标具有如下两个特点。
(1)可量性。所谓可量性是指客观存在的现象的大小、多少可以实际进行计量。统计指标是离不开数量的,凡是不能直接表现为数量的,都不能称之为统计指标。可量性是社会
新编统计学(第2版) 10 Statistics
经济现象的范畴转化为指标的前提,只有那种在性质上属于同类,而在数量上又可量的大量社会经济现象,才能成为统计指标反映和研究的对象。
(2)综合性。统计指标是大量个别单位标志表现的综合结果。例如,以某城市商业企业为统计总体,统计其企业数、经营收入、上缴税金、职工平均工资收入等指标。通过统计调查,进而通过汇总综合得出这些指标,从这些指标所反映的情况看不到企业规模的差异,职工们劳动效率和工资水平的差异也被忽略了,这些指标显示的是该城市商业企业的整体情况和职工们的一般收入水平。可见,统计指标的形成必然经过从个别到整体的过程。通过个别单位数量差异的抽象化,来体现总体各单位的综合数量特征。
3(统计指标的分类
统计指标按其反映总体内容的不同可分为数量指标和质量指标。数量指标是反映社会经济现象总规模水平和工作总量的统计指标,一般用绝对数表示,如职工人数、工业总产值和工资总额等;质量指标是反映总体相对水平或平均水平的统计指标,一般用相对数和平均数表示,如计划完成程度、平均工资等。
由于统计指标反映的是一定社会经济范畴的内容,因此,统计指标的确定,一方面必须和经济学理论对范畴所作的一般概括相符合,要以经济理论为指导,设置科学的统计指标;另一方面,统计指标又必须是对社会经济范畴的进一步具体化,才能确切地反映社会经济现象的数量关系。例如,政治经济学对劳动生产率这个经济范畴作了一般的概括说明,即劳动生产率是表明单位劳动时间所创造的使用价值。但当劳动生产率作为一个统计指标时,就必须明确规定其劳动时间是指工人的劳动时间还是企业全体职工的劳动时间,即确定是工人劳动生产率还是全员劳动生产率。
4(指标和标志的区别与联系
指标和标志是既有区别又有联系的两个概念。
指标和标志存在着明显的区别:首先,指标和标志说明的对象不同,指标是说明总体特征的,而标志则是说明总体单位特征的;其次,所有指标都必须用数值表示,而标志有不能用数值表示的品质标志和能用数值表示的数量标志两种。
指标和标志又存在着联系:第一,指标的数值都是从总体单位的标志值汇总得到的;第二,指标和标志的确定也不是一成不变的,当总体和总体单位随研究目的发生变化时,指标和标志也必然随之发生相应的变化。例如,以某企业的全部职工为研究对象,该企业职工工资总额、女职工比重两个指标分别是由该企业每个职工的工资额、性别两个标志的具体表现汇总而得的。若以全国工业企业为研究对象,则每个企业的职工工资总额、女职工比重又都属于标志。
,二,统计指标体系
由于某一单个指标只能反映总体某一个特定的数量特征,要反映客观现象各方面的数量特征,需要将一系列有联系的统计指标有机地结合起来进行分析研究,这就需要设置统计指
第一章 11 总论 标体系。
统计指标体系是由一系列相互联系的统计指标所构成的整体,它从相互依存和相互制约的多个方面来反映所研究现象的数量特征。例如,为了全面反映工业企业生产经营的全貌,有必要设置产量、收入、成本、税金、产品品种与质量、职工人数、职工工资、劳动生产率、原材料、设备和资金等指标组成的工业企业统计指标体系。再如,为了完整反映我国人口的有关情况,为党政领导制定政策、经济决策提供理论依据,就有必要设置全国人口总数,按性别、民族、年龄、地区等划分的人口数及其比重,以及人口的平均年龄等人口统计指标体系。
一般来说,社会经济统计指标体系分为两大类,即基本统计指标体系和专题统计指标体系。基本统计指标体系一般又可分为三个层次:最高层是反映整个国民经济和社会发展的统计指标体系;中间层是各部门和各地区的统计指标体系;最基层是各企业和事业单位的统计指标体系。专题统计指标体系是针对某一社会经济现象而制定的统计指标体系,如经济效益指标体系、人民物质文化生活水平指标体系、商品价格指标体系和财政金融统计指标体系等。
国民经济和社会发展的统计指标体系是最主要的指标体系,以它为中心组成了一个既有分工又有联系的统计指标体系系统。在对社会经济现象进行了解、研究、评价和判断时,要使用配套的、口径和范围一致的、互相衔接的统计指标体系。
四、变量与变量值
没有差异就没有统计研究的必要,所以统计所研究的标志和指标通常都是可变的或有差异的,习惯上统称它们为变量。换言之,变量既可以是在不同总体单位之间具体表现不尽相同的标志,也可以是在不同时间或空间上数值不尽相等的指标。变量的具体取值称为变量值,是对客观现象进行观测与统计分析的结果。
说明现象数量特征的变量称为数值型变量或定量变量,其取值是数值型数据。如某企业每个职工的年龄不尽相同,有25岁、26岁、30岁等,这里的职工年龄就是一个定量变量,这些具体数值则是年龄这个定量变量的变量值。
说明现象属性特征的变量称为定性变量,其变量值通常用文字表现。定性变量又分为分类变量和顺序变量。分类变量的取值是一系列平行类别的名称。例如,“企业经济类型”就是一个分类变量,其变量值可分别为“国有企业”、“集体企业”、“股份有限公司”和“私营企业”等。顺序变量的取值是一系列有序类别的名称。例如,“产品等级”是一个顺序变量,其变量值是“一等品”、“二等品”、“三等品”和“次品”等。
变量按其变量值是否连续可分为离散型变量和连续型变量。离散型变量是指可以按一定顺序一一列举其整数变量值,且两个相邻整数变量值之间不可能存在其他数值的变量。例如,企业数、设备数、学生人数等都是离散型变量。连续型变量是指其变量值不能一一列举,任何相邻整数变量值之间存在无限多个变量值的变量,如职工的身高、企业的设备利用率等。
新编统计学(第2版) 12 Statistics
第四节 用Excel进行统计分析
在统计工作中需要对各种数据进行制表、绘图、分组整理、分析和管理等。在计算机普及时代,繁琐的数据处理工作离不开先进、实用的数据处理软件。在众多的数据处理软件中,由于Excel能够与Windows操作系统以及Office中的其他软件良好结合,而且普及面广、使用简便、功能强大、能够满足一般统计分析的需要,所以本教材选择Excel来进行统计分析。
利用Excel进行统计分析主要是利用Excel中的统计函数、数据分析工具和图表。本节先对Excel的这几种统计功能作一个简单的概述,在后面各章中还将会结合各章例题分别介绍怎样使用这些功能进行各种统计分析。
一、统计函数
Excel内置的函数中有很多可用于统计,其中常用的统计函数有:AVEDEV(平均差)、AVERAGE(算术平均值)、CONFIDENCE(总体平均值的置信区间)、CORREL(相关系数)、COVAR(协方差)、GEOMEAN(几何平均值)、HARMEAN(调和平均值)、KURT(峰度)、MEDIAN(中位数)、MODE(众数)、NORMDIST(正态分布的概率值)、NORMINV(正态分布的累积函数的逆函数)、NORMSDIST(标准正态分布的概率值)、NORMSINV(标准正态分布累积函数的逆函数)、SKEW(偏度)、STANDARDIZE(正态化数值)、STDEV(样本的标准差)、STDEVP(总体的标准差)、VAR(样本方差)、VARP(总体方差)和ZTEST(Z检验的双尾P值)等。
使用函数功能最直观的方式是单击编辑栏的fx按钮,弹出“插入函数”对话框,如图1-1所示。在“插入函数”对话框中的“或选择类别”框中选定函数类型“统计”,在下面的“选择函数”列表中选择所需的函数,单击“确定”按钮,弹出“函数参数”对话框,在对话框中再按提示输入数据区域和相关参数即可。图1-2就是利用AVERAGE函数计算A1到A10单元格这10个数据的算术平均值的对话框,单击对话框中的“确定”按钮,计算结果“5.5”就将显示在预先选定的输出单元格A11中。
第一章 13 总论
图1-1 “插入函数”对话框 图1-2 “函数参数”对话框
使用函数功能的另一种方式,是在公式编辑栏中按Excel的规定输入函数名和有关参数的数值或所在区域,其大致形式为“=函数名(参数1,参数2, ?)”。不同的函数需指定不同的参数。图1-2中的计算可用“=AVERAGE(A1:A10)”来完成。
函数实际上就是一些预定义的计算公式。在统计数据处理中,通常需要自己输入一些公式来完成计算。使用公式不仅可以由现有数据得到计算结果,便于检查和修改,而且通过公式的复制功能可大大提高同类计算的工作效率,还具有随数据源的更新而自动更新计算结果的功能。Excel中的所有公式都以等号(=)开头。公式可以包括数字、数学运算符、单元格引用和函数命令。
公式复制是Excel数据成批计算的重要操作方法,它可以使用自动填充功能来实现,也可以用“复制”和“粘贴”命令来实现。在复制公式时,须注意单元格引用的方式是绝对引用和相对引用。绝对引用的单元格地址的行号和列标前带有“$”符号,无论将公式复制和剪切到哪里,该单元格都固定不变。相对引用不加“$”符号,将公式复制和剪切到别处时,公式中所引用的一个单元格地址也会随之变动。例如,图1-2 中的在单元格B1中输入“=A1*2”,确定后将鼠标放到单元格B1右下角,按住鼠标向下拖拽至B10,即可将B1的计算公式复制到B2,B10,并且得到相应的计算结果;将单元格A11的公式复制到B11,即可得到B1,B10的算术平均数。
如果仅需要将公式的计算结果复制到目标区域,并不想复制公式本身,则在粘贴时应使用“选择性粘贴”命令,即右击目标区域,选择“选择性粘贴”命令,在其对话框中选择“数值”或“值与数字格式”选项,再单击“确定”按钮即可。
二、数据分析工具
Excel提供了一组可直接使用的数据分析工具,称为“分析工具库”,为统计分析提供极大的方便。使用这些工具的方法是:在Excel 2007或Excel 2010中选择“数据”?数据分析”命令(在Excel 2003工作表中选择“工具”?“数据分析”命令);在弹出的“数据分析”
新编统计学(第2版) 14 Statistics
对话框中选择所需的分析工具(如图1-3所示);在所选工具的对话框中填写必要的数据或参数的信息后单击“确定”按钮,即可得到所需的输出结果(表格或图表形式)。各种分析工具的使用方法将在后面章节中具体说明。
图1-3 数据分析中的分析工具菜单
如果菜单栏中没有出现“数据分析”命令,则应先执行“加载宏”命令。在Excel 2007工作表中,单击文档左上角的Office按钮,在菜单中单击其下端的“Excel选项”按钮(在Excel 2010工作表中,选择菜单栏的“文件”?“选项”命令),在打开的“Excel选项”对话框中选择“加载项”选项,选择“加载项”中的“分析工具库”,单击下方的“转到”按钮,即可弹出“可用加载宏”对话框,在“可用加载宏”对话框中选择“分析工具库”后单击“确定”按钮即可。在Excel 2003工作表中,在“工具”菜单中选择“加载宏”,在其对话框中选择“分析工具库”后单击“确定”按钮即可。
三、图表
Excel具有强大而灵活的图表功能,使枯燥乏味的数据形象化。利用Excel 的图表向导可以轻松地创建图表。
在Excel 2003工作表中,选择菜单栏中的“插入”命令,在子菜单中选择“图表”命令,或直接在常用工具栏中单击“图表向导”图标,在弹出的“图表向导”对话框中选择所需的图表类型(如图1-4所示)。Excel 2003提供了柱形图、条形图等14种标准类型,用户还可以自己定义图表类型。选定图表类型后单击“下一步”按钮,弹出“图表数据源”对话框,在“数据区”选项卡中输入数据所在区域。每一行(或一列)数据作为一个系列,如果有多个系列,则可在“系列”选项卡中添加(或删除)、命名、指定相应数据区域,并指定分类轴。然后根据提示填写标题、分类轴和数值轴的名称等,即生成所需的统计图表。
Excel 2007或Excel 2010的图表比Excel 2003的图表更加美观,而且类型丰富多样,共有11种标准图表类型、170多种常用子图表。单击“插入”,工具栏显示出常用图表类型,单击“其他图表”,即可查看所有图表类型及其子图形,如图1-5所示。
第一章 15 总论
图1-4 Excel 2003的统计图表类型 图1-5 Excel 2007的统计图表类型
对自动生成的图表可以进行缩放、移动、复制和删除等操作,也可以单击图表的任一部分(如标题、图例、坐标轴、绘图区等)对其进行修改或美化。
新编统计学(第2版) 16 Statistics
案例思考与讨论
【案例1-1】 应届本科毕业生就业状况的调研
就业竞争越来越激烈~大学毕业生的就业问题已经越来越受到全社会关注。很多学校专门成立了毕业生就业指导机构~这些机构常常需要对大学生的求职与就业的状况进行调查和分析研究~以便及时了解学生们的就业意愿、择业倾向、求职经历、主要困难和障碍等相关状况~调查目的是为高校有针对性地做好大学生就业指导工作、完善学校教育改革、及时为采取促进就业的必要措施提供科学的参考信息。
为了搞好大学生求职与就业状况的统计调查和分析~必须首先明确统计总体、总体单位~设计有关的标志、变量、统计指标和统计指标体系~理解它们之间的关系和它们在统计研究中的作用。
思考与讨论问题:
1(若要对某高校应届本科毕业生的就业状况进行调研,统计总体和总体单位分别是什么,
2(研究者需要了解哪些信息,这些信息具体用哪些指标来反映,
3(为了得到研究者所需的信息,必须对每个总体单位调查哪些项目,其中哪些是数量标志、哪些是品质标志,
4(上述指标与标志之间存在什么样的联系,
5(这项调查研究所关注的变量有哪些,其中哪些是定量变量、哪些是定性变量,在定性变量中又有哪些是分类变量、哪些是顺序变量,
?【案例1-2】 新世纪实现新跨越 新征程谱写新篇章
党的十六大以来的十年~是我国经济社会发展进程中极不平凡的十年~是积极应对国际形势深刻调整、国内发展日新月异的十年~是战胜各种风险、困难和挑战~经济总量实现历史跨越的十年。十年来~在以**同志为**的党中央的正确领导下~全国各族人民坚持以**理论和“三个代表”重要思想为指导~深入贯彻落实科学发展观~全面推进改革开放和现代化建设~切实转变经济发展方式~国民经济快速增长~人民生活明显改善~社会事业全面进步~国际地位显著提高~经济社会发展取得举世瞩目的辉煌成就。
1(国民经济连上新台阶~社会生产力和综合国力显著提升
经济持续较快发展。2003—2011年~国内生产总值年均实际增长10.7%~其中有六年实
? 这是国家统计局综合司于2012年8月15日发布的《从十六大到十八大经济社会发展成就系列报告》之一。引自国家统计局网站(http://www. stats.gov.cn)。原文篇幅很大,在不影响文章主要观点的情况下,编者删去了部分文字和大量图表。
第一章 17 总论 现了10%以上的增长速度~在受国际金融危机冲击最严重的2009年依然实现了9.2%的增速。这一时期的年均增速不仅远高于同期世界经济3.9%的年均增速~而且高于改革开放以来9.9%的年均增速。经济总量连续跨越新台阶。2011年~我国国内生产总值达到47.2万亿元~扣除价格因素~比2002年增长1.5倍。经济总量居世界位次稳步提升。2008年国内生产总值超过德国~居世界第三位,2010年超过日本~居世界第二位~成为仅次于美国的世界第二大经济体~如图1-6所示。
500 000 450 000 400 000 350 000 300 000 250 000 200 000 生产总量/亿元 150 000 100 000 50 000 0
图1-6 2003—2011年国内生产总值及其增长速度
在经济总量稳步增长的同时~人均国内生产总值也快速增加。2011年~我国人均国内生产总值达到35 083元~扣除价格因素~比2002年增长1.4倍~年均增长10.1%。
国家财政实力明显增强。2011年~我国财政收入达到103 740亿元~比2002年增长4.5倍~年均增长20.8%。财政收入的快速增长为加大教育、医疗、社保等民生领域投入~增强政府调节收入分配能力等提供了有力的资金保障。
国家外汇储备大幅增加。我国外汇储备2006年末突破1万亿美元~2009年末突破2万亿美元~2011年末达到31 811亿美元~比2002年增长10.1倍~年均增长30.7%~外汇储备规模连续六年稳居世界第一位。
2(结构调整迈出新步伐~经济发展的协调性和竞争力明显增强
三次产业协同性增强。农业基础稳固、工业生产能力全面提升、服务业全面发展的格局逐步形成。2003—2011年~第一产业年均增长4.6%~第二产业年均增长11.9%~第三产业年均增长11.1%~均保持较快的发展态势。制造业大国地位初步确立。按照国际标准工业分类~在22个大类中~我国在7个大类中名列第一~钢铁、水泥、汽车等220多种工业品产量居世界第一位。据美国经济咨询公司环球通视数据~2010年我国制造业产出占世界的比重为19.8%~超过美国成为全球制造业第一大国。新能源、新材料、新医药等新兴产业蓬勃发展~
比上年增长/% 成为经济增长新亮点。服务业不断发展壮大。2011年~服务业增加值占国内生产总值的比重上升到43.1%~比2002年提高1.6个百分点。信息服务业、快递业等现代物流业、商务服务业、高技术服务业等迅速发展~服务业对经济社会发展的支撑和带动作用日益凸显。
需求结构明显改善。内需的强劲增长有效弥补了外需的不足~对实现经济平稳较快发展
新编统计学(第2版) 18 Statistics
起到了极为关键的作用。2011年~内需对经济增长的贡献率由2002年的92.4%提高到104.1%~外需贡献率则由2002年的7.6%转为-4.1%。
城镇化步伐明显加快。2011年~我国城镇化率首次突破50%~达到51.3%~比2002年提高12.2个百分点~我国城乡结构发生历史性变化。
区域结构不断优化。中西部地区加快发展~经济总量占全国的比重持续上升~区域发展呈现出协调性增强的趋势。2011年~中、西部地区的地区生产总值占全国的比重分别为20.1%、19.2%~分别比2002年提高1.3、2.0个百分点,中、西、东北地区全社会固定资产投资占全国的比重分别为23.2%、23.5%和10.7%~分别比2002年提高5.5、3.2和2.4个百分点。主体功能区建设初见成效~西部大开发、振兴东北老工业基地、促进中部地区崛起等区域发展战略向纵深推进~区域间产业梯度转移步伐加快~中西部地区发展潜力不断释放。
3(基础设施和基础产业发展实现新飞跃~经济发展的基础和环境得到进一步改善
农业基础不断巩固和加强。农业综合生产能力稳步提高~特别是取消农业税、实施农业补贴~极大地调动了农民生产积极性。2011年~粮食总产量达到57 121万t~比2002年增长25.0%~年均增长2.5%~连续5年稳定在5亿t以上~实现半个世纪以来首次“八连增”。近年来~我国谷物、肉类、花生、茶叶、水果等农产品产量稳居世界第一位。
固定资产投资特别是基础设施和基础产业投入快速增长。2003—2011年全社会固定资产投资累计完成144.9万亿元~年均增长25.6%,其中~基础设施投资25.7万亿元~2004—2011年年均增长21.9%。投资规模之大、增速之快为历史所少有。
能源生产供应能力稳步提高。2011年~我国能源生产总量达到31.8亿t标准煤~比2002年增长1.1倍~是世界第一大能源生产国~能源自给率在90%左右。
交通运输能力持续增强。我国铁路运输达到国际先进水平~“五纵七横”国道主干线和西部开发八条公路干线建成。截至2011年~铁路营业里程达到9.3万km~比2002年增长29.6%,高速公路8.5万km~增长2.4倍,民用航空航线里程达到349.1万km~增长1.1倍。旅客周转量年均增长9.1%~货物周转量年均增长13.6%。
邮电通信业蓬勃发展。2003—2011年~全国邮电业务总量年均增长23.2%。传统业务继续发展~移动电话用户数快速增加。新兴业务不断发展壮大~快递等新兴业务不断涌现~3G移动用户迅猛发展~互联网规模快速壮大。
4(对外经济和对外贸易实现新跨越~对外开放的深度和广度得到进一步拓展
进出口贸易规模不断扩大。2011年~货物进出口总额达到36 421亿美元~比2002年增长4.9倍~年均增长21.7%。其中~出口额18 986亿美元~增长4.8倍~年均增长21.6%,进口额17 435亿美元~增长4.9倍~年均增长21.8%。进出口贸易总额跃居世界第二位~其中货物出口额居世界第一位~货物进口额居世界第二位。
进出口商品结构不断优化。在出口总额中~工业制成品占比由2002年的91.2%提高到2011年的94.7%,机电产品由48.2%提高到57.2%,高新技术产品由20.8%提高到28.9%。先进技术、设备、关键零部件进口快速增长~大宗资源能源产品进口规模不断扩大。
第一章 19 总论
利用外资规模跃居全球第二。2003—2011年~全国累计实际使用外商直接投资7 164亿美元~连续多年成为吸收外商直接投资最多的发展中国家~全球排名也上升至第二位。
对外投资从无到有~“走出去”步伐不断加快。2011年我国非金融类对外直接投资601亿美元~比2003年增长19.7倍。对外经济合作迅速发展。2011年~对外承包工程业务完成营业额1 034亿美元~比2002年增长6.2倍。
5(人民生活持续获得新改善~人民群众享受到更多改革和发展的实惠
就业规模不断扩大。2011年末~我国城乡就业人数达到76 420万人~比2002年增加3 140万人。其中~城镇就业人数从25 159万人增加到35 914万人~增加10 755万人。随着工业化和城市化进程的不断推进~城镇吸纳就业的能力不断增强~城镇就业人员占全国的比重从2002年末的34.3%提高到2011年末的47.0%。
城乡居民收入快速增长。2011年~城镇居民人均可支配收入21 810元~比2002年增长1.8倍~扣除价格因素~年均实际增长9.2%,农村居民人均纯收入6 977元~比2002年增长1.8倍~扣除价格因素~年均实际增长8.1%。2010、2011年农村居民收入增速连续两年快于城镇~城乡居民收入差距有所缩小。
居民生活质量明显改善。2011年~城乡居民家庭恩格尔系数分别为36.3%和40.4%~分别比2002年降低了1.4和5.8个百分点。主要耐用消费品拥有量大幅增长。2011年底~城镇居民家庭平均每百户拥有家用汽车18.6辆~比2002年底增加17.7辆,农村居民家庭平均每百户拥有电冰箱61.5台~增长3.1倍。
覆盖城乡居民的社会保障体系建设取得突破性进展~初步形成了以社会保险为主体~包括社会救助、社会福利、优抚安臵、住房保障和社会慈善事业在内的社会保障制度框架。2011年末~全国城镇职工基本养老、城镇基本医疗、失业、工伤、生育保险参保人数分别达到28 391万人、47 343万人、14 317万人、17 696万人、13 892万人~全国列入国家新型农村社会养老保险试点地区参保人数3.3亿人。
6(各项社会事业发展取得新突破~经济社会发展的协调性增强
全面实行城乡免费义务教育~教育公平迈出重大步伐。国民受教育程度大幅度提升~国民平均受教育年限达到9年以上。职业教育快速发展。2011年~各类中等职业教育招生809万人~在校生2 197万人~毕业生663万人。高等教育大众化程度进一步提高。2011年~全国普通高等教育本专科招生682万人~在校生2 309万人~毕业生608万人~比2002年分别增加361万、1 405万和475万人。
科技投入持续增加~科技发展成果丰硕。2011年~全国研究与试验发展,R&D,经费支出8 687亿元~比2002年增长5.7倍~占国内生产总值的比重由1.07%上升到1.84%。技术市场成交额4 764亿元~比2002年增长4.4倍。重要科学前沿和战略必争领域取得了一批重大创新成果。
卫生工作成效显著。成功应对了突如其来的非典、高致病性禽流感、甲型H1N1流感等重大疫情。医疗卫生体制改革进入实质性启动阶段。医疗卫生服务体系建设步伐明显加快。
新编统计学(第2版) 20 Statistics
2011年末~全国共有医疗卫生机构95万个,共有卫生技术人员620万人~比2002年末增加193万人。
文化事业进一步加强~公共文化服务体系建设进入快速、稳定的重要发展期。2011年末~全国共有公共图书馆2 952个~比2002年末增加255个,博物馆2 650个~增加1 139个,艺术表演团体7 069个~增加4 482个。广播节目综合人口覆盖率为97.1%,电视节目综合人口覆盖率为97.8%。文化产业异军突起~各项指标均位居世界前列。
体育事业不断进步。2003—2011年~我国运动员共获得1 063个世界冠军~创造136项世界纪录。特别是成功举办了2008年北京奥运会~极大提升了我国的国际影响力。
7(节能减排和环境保护得到空前重视~经济可持续发展能力不断增强
环境质量持续改善。2011年~在监测城市中空气质量达到二级以上,含二级,标准的城
3市占监测城市数的88.8%。2011年末~城市污水处理厂日处理能力达11 255万m~比2002年末增长2.1倍,城市污水处理率达到82.6%~提高42.6个百分点。
节能降耗取得明显成效。2011年~单位国内生产总值能耗比2002年下降12.9%。
污染物排放总量得到控制。2010年~化学需氧量和二氧化硫排放量比2005年分别下降12.45%和14.29%。
当前~我国正处于经济社会发展的关键时期和改革开放的攻坚阶段~既面临着难得的历史机遇~也面临着诸多可以预见和难以预见的风险挑战~特别是我国经济发展中不平衡、不协调、不可持续的问题依然突出~支撑经济高速增长的优势有所弱化~经济增长面临的资源环境约束增强~收入分配差距较大~科技创新能力不强~城乡区域发展不平衡~制约科学发展的体制机制障碍依然较多等。因此~我们既要坚定发展信心~又要增强忧患意识~未雨绸缪~坚持用发展和改革来解决前进中遇到的问题。
思考与讨论问题:
1(从该分析报告可以看出社会经济统计的研究对象是什么,结合本文体会统计的分析研究具有哪些特点,该研究报告是运用哪些统计研究的基本方法取得的成果,
2(该分析报告中运用了大量统计指标来阐明党的十六大以来的十年间我国经济社会发展的巨大成就。其中有哪些统计指标是数量指标,有哪些统计指标是质量指标,其中哪些是绝对数表示的,哪些是相对数表示的,哪些是平均数表示的,
3(从文中举几个例子来说明每个统计指标包括了哪些构成因素。
4(怎样理解统计指标具有可量性和综合性两个特点(结合该报告中的指标来说明),
5(该分析报告指出我国的“制造业大国地位初步确立”、“国际地位显著提高”,请分别列举本文中与此有关的主要统计信息。
6(该报告在分析我国这十年来结构调整方面取得的成就时,主要分析了哪些结构,结构调整的积极变化又是通过哪些指标来具体表现的,请注意文中是如何运用统计指标来得出结论的。
第一章 21 总论
7(从该报告可以看出国民经济和社会发展统计指标体系至少包括了哪几大方面的统计指标,
思考与练习
1(如何理解统计的不同含义,它们之间有何关系,
2(举例说明总体、总体单位、指标和标志之间的区别与联系。
3(完整的统计工作过程一般包括哪几个阶段,
4(数量指标和质量指标如何区别,
5(在班里组织一个5,7人的学习小组,自选课题确定调查目的并展开统计调查,明确在此目的下的统计总体、总体单位,同时列出标志(包括品质标志、数量标志)与标志表现,变量(包括离散变量、连续变量),变量值和统计指标(包括数量指标、质量指标)等,并尝试列出一套指标体系。
6(2012年6月初,某校工商管理学院对该院全体应届毕业生进行了一次调查。调查数据显示,该专业应届毕业生200人,其中有29人考上了研究生,占该专业应届毕业生的14.5%;5月底已签订就业协议的学生有154人,占该专业应届毕业生的77%;统计学课程的平均成绩为82.5分,优良率高达66.7%。总成绩排名第一的学生是一个女生,她的统计学成绩为98分,24门课程的成绩达到优秀标准,共获得校级以上奖励6项。
要求:请指出上述数据哪些是统计指标,哪些是标志值,
转载请注明出处范文大全网 » 统计学_贾俊平_第4版_课后