范文一:统计学原理第三版课后习题答案
1:各章练习题答案
2.1 (1) 属于顺序数据。
(2)频数分布表如下:
服务质量等级评价的频数分布
服务质量等级
家庭数(频率)
频率% A 14 14 B 21 21 C 32 32 D 18 18 E 15 15 合计
100
100
(3)条形图(略) 2.2 (1)频数分布表如下:
(2) 某管理局下属40个企分组表
按销售收入分组(万元) 企业数(个)
频率(%) 先进企业 11 27.5 良好企业 11 27.5 一般企业 9 22.5 落后企业 9 22.5 合计
40
100.0
2.3 频数分布表如下:
某百货公司日商品销售额分组表
按销售额分组(万元)
频数(天)
频率(%) 25~30 4 10.0 30~35 6 15.0 35~40 15 37.5 40~45 9 22.5 45~50 6 15.0 合计
40
100.0
直方图(略)。 2.4 (1)排序略。
(2)频数分布表如下:
100只灯泡使用寿命非频数分布
按使用寿命分组(小时) 灯泡个数(只) 频率(%)
650~660 2 2 660~670
5 5
670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计
100
100
直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:
分组 天数(天)
-25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计
60
(3)直方图(略)。 2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。 2.7 (1(2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,
且平均成绩较A班低。
2.8 箱线图如下:(特征请读者自己分析)
2.9 LU。
(2)s=21.17(万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但
单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 2.11 =426.67(万元);s=116.48(万元)。 2.12 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本
大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。 2.13 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。 (2) 男生:=27.27(磅),s=2.27(磅); 女生:=22.73(磅),s=2.27(磅); (3)68%;
(4)95%。
2.14 (1)离散系数,因为它消除了不同组数据水平高地的影响。
4.2
=0.024; 172.12.3
=0.032; 幼儿组身高的离散系数:vs=
71.3
(2)成年组身高的离散系数:vs=
由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。 2.15 2.16 (1)方差或标准差;(2)商业类股票;(3)(略)。 2.17 (略)。
第3章 概率与概率分布
3.1设A=女性,B=工程师,AB=女工程师,A+B=女性或工程师 (1)P(A)=4/12=1/3 (2)P(B)=4/12=1/3 (3)P(AB)=2/12=1/6
(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2
3.2求这种零件的次品率,等于计算“任取一个零件为次品”(记为A)的概率P(A)。 考虑逆事件A=“任取一个零件为正品”,表示通过三道工序都合格。据题意,有:
P(A)=(1-0.2)(1-0.1)(1-0.1)=0.648
于是 P(A)=1-P(A)=1-0.648=0.352
3.3设A表示“合格”,B表示“优秀”。由于B=AB,于是
P(B)=P(A)P(B|A)=0.8×0.15=0.12
3.4 设A=第1发命中。B=命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。
P(B)=P(A)P(B|A)+P()P(B|) =0.8×1+0.2×0.5=0.9 脱靶的概率=1-0.9=0.1
或(解法二):P(脱靶)=P(第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1 3.5 设A=活到55岁,B=活到70岁。所求概率为:
P(B|A)=
P(AB)P(B)0.63
===0.75 P(A)P(A)0.84
3.6这是一个计算后验概率的问题。
设A=优质率达95%,=优质率为80%,B=试验所生产的5件全部优质。 P(A)=0.4,P()=0.6,P(B|A)=0.955, P(B|)=0.85,所求概率为:
P(A|B)=
P(A)P(B|A)0.30951
==0.6115
P(A)P(B|A)+P()P(B|)0.50612
决策者会倾向于采用新的生产管理流程。
3.7 令A1、A2、A3分别代表从甲、乙、丙企业采购产品,B表示次品。由题意得:P(A1)=0.25,P(A2)=0.30, P(A3)=0.45;P(B|A1)=0.04,P(B|A2)=0.05,P(B|A3)=0.03;因此,所求概率分别为:
(1)P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3) =0.25×0.04+0.30×0.05+0.45×0.03=0.0385 (2)P(A3|B)=
0.45?0.030.0135
==0.3506
0.25?0.04+0.30?0.05+0.45?0.030.0385
3.8据题意,在每个路口遇到红灯的概率是p=24/(24+36)=0.4。
设途中遇到红灯的次数=X,因此,X~B(3,0.4)。其概率分布如下表:
3.9 设被保险人死亡数=X,X~B(20000,0.0005)。
(1)收入=20000×50(元)=100万元。要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。所求概率为:P(X ≤10)=0.58304。
(2)当被保险人死亡数超过20人时,保险公司就要亏本。所求概率为: P(X>20)=1-P(X≤20)=1-0.99842=0.00158 (3)支付保险金额的均值=50000×E(X) =50000×20000×0.0005(元)=50(万元) 支付保险金额的标准差=50000×σ(X)
=50000×(20000×0.0005×0.9995)1/2=158074(元)
3.10 (1)可以。当n很大而p很小时,二项分布可以利用泊松分布来近似计算。本例中,λ= np=20000×0.0005=10,即有X~P(10)。计算结果与二项分布所得结果几乎完全一致。
(2)也可以。尽管p很小,但由于n非常大,np和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。 本例中,np=20000×0.0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9.995, 即有X ~N(10,9.995)。相应的概率为: P(X ≤10.5)=0.51995,P(X≤20.5)=0.853262。
可见误差比较大(这是由于P太小,二项分布偏斜太严重)。
【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。
(3)由于p=0.0005,假如n=5000,则np=2.5<5,二项分布呈明显的偏态,用正态分布来计算就会出现非常大的误差。此时宜用泊松分布去近似。>5,二项分布呈明显的偏态,用正态分布来计算就会出现非常大的误差。此时宜用泊松分布去近似。><>
150-200
30
)=P(Z<-1.6667)=0.04779>-1.6667)=0.04779>
(2) 设所求值为K,满足电池寿命在200±K小时范围内的概率不小于0.9,即有:
P(|X-200|<>
|X-200|30<>
30
≥0.9
即:P{Z
K
30
≥0.95,K/30≥1.64485,故K≥49.3456。 3.12设X =同一时刻需用咨询服务的商品种数,由题意有X~B(6,0.2)
(1)X的最可能值为:X0=[(n+1)p]=[7×0.2]=1 (取整数) ∑2
(2)P(X>2)=1-P(X≤2)=1-
C6k0.2k0.86-k
k=0
=1-0.9011=0.0989
第4章 抽样与抽样分布
4.1 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50
4.2 a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 4.3 a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4.4 a. 101, 99 b. 1 c. 不必 4.5 趋向正态
4.6. a. 正态分布, 213, 4.5918 b. 0.5, 0.031, 0.938
4.7. a. 406, 1.68, 正态分布 b. 0.001 c. 是,因为小概率出现了 4.8. a. 增加 b. 减少
4.9. a. 正态 b. 约等于0 c. 不正常 d. 正态, 0.06 4.10 a. 0.015 b. 0.0026 c. 0.1587
4.11. a. (0.012, 0.028) b. 0.6553, 0.7278 4.12. a. 0.05 b. 1 c. 0.000625
第5章 参数估计
5.1 (1)σ=0.79。(2)E=1.55。
5.2 (1)σ=2.14。(2)E=4.2。(3)(115.8,124.2)。 5.3 (2.88,3.76);(2.80,3.84);(2.63,4.01)。 5.4 (7.1,12.9)。 5.5 (7.18,11.57)。
5.6
(18.11%,27.89%);(17.17%,22.835)。
5.7 (1)(51.37%,76.63%);(2)36。 5.8 (1.86,17.74);(0.19,19.41)。
5.9 (1)2±1.176;(2)2±3.986;(3)2±3.986;(4)2±3.587;(5)2±3.364。 5.10 (1)=1.75,sd=2.63;(2)1.75±4.27。 5.11 (1)10%±6.98%;(2)10%±8.32%。 5.12 (4.06,14.35)。 5.13 48。 5.14 139。 5.15 57。 5.16 769。
第6章 假设检验
6.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强度相对于以前提高了”,所以原假设与备择假设
应为:H0:μ≤1035,H1:μ>1035。
π=“某一品种的小鸡因为同类相残而导致的死亡率”,H0:π≥0.04,H1:π<0.04。 6.3="" h0:μ="">0.04。>
6.2
6.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证据支持店
方倾向于认为其重量少于60克;
(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结果却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;
(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。 6.5 (1)检验统计量z=
-μs/n
,在大样本情形下近似服从标准正态分布;
(2)如果z>z0.05,就拒绝H0;
(3)检验统计量z=2.94>1.645,所以应该拒绝H0。 6.6 z=3.11,拒绝H0。 6.7 z=1.93,不拒绝H0。 6.8 z=7.48,拒绝H0。
χ2=206.22,拒绝H0。 6.10 z=-5.145,拒绝H0。 6.11 t=1.36,不拒绝H0。 6.12 z=-4.05,拒绝H0。
6.9
6.13 F=8.28,拒绝H0。 6.14 (1)检验结果如下:
t-检验: 双样本等方差假设
平均 方差 观测值 合并方差 假设平均差 df t Stat P(T<=t) 单尾="" t="" 单尾临界="">=t)><=t)>=t)>
变量 2
109.9
33.35789474
20
100.7
变量 1 24.11578947
20
28.73684211
0 38
-5.427106029 1.73712E-06 1.685953066 3.47424E-06
t 双尾临界 2.024394234
变量 2
109.9
33.35789474
20
100.7
24.11578947
20 0 37
-5.427106029 1.87355E-06 1.687094482 3.74709E-06 2.026190487
变量 1
100.7
24.11578947
20 19
0.722940991 0.243109655 0.395811384
变量 2
109.9
33.35789474
20 19
t-检验: 双样本异方差假设
平均 方差 观测值 假设平均差 df t Stat P(T<=t) 单尾="" t="" 单尾临界="">=t)><=t) 双尾="" t="">=t)>
变量 1
(2)方差检验结果如下:
F-检验 双样本方差分析
平均 方差 观测值 df F
P(F<=f) 单尾="" f="">=f)>
第7章 方差分析与试验设计
7.1 F=4.6574 A-B=44.4-=14.4>LSD=5.85,拒绝原假设; A-C=44.4-42.6=1.8 7.3 0.05 (或),不能拒绝原假设。 7.4 有5种不同品种的种子和4种不同的施肥方案,在20快同样面积的土地上,分别采用5种种子和4种施肥方案 搭配进行试验,取得的收获量数据如下表: F种子=7.2397>F0.05=3.2592(或P-value=0.0033<> F施肥方案=9.2047<><> 7.5 F地区=0.0727 F包装方法=3.1273 F广告媒体=3 8.1(1)利用Excel计算结果可知,相关系数为 rXY=0.948138,说明相关程度较高。 (2)计算t统计量 2.681739 =8.436851 0.317859 给定显著性水平=0.05,查t分布表得自由度n-2=10-2=8的临界值tα2为2.306, t= = = 显然t>tα2,表明相关系数 r 在统计上是显著的。 8.2 利用Excel中的”数据分析”计算各省市人均GDP和第一产业中就业比例的相关系数为:-0.34239,这说明人均GDP与第一产业中就业比例是负相关,但相关系数只有-0.34239,表明二者负相关程度并不大。 相关系数检验: 在总体相关系数ρ=0的原假设下,计算t统计量: t= = =-1.9624 查t分布表,自由度为31-2=29,当显著性水平取α=0.05时,当显著性水平取α=0.1时, tα=2.045;tα2=1.699。由于计算的t统计量的绝对值1.9624小于tα2=2.045,所以在α=0.05的显著性水平下,不能拒绝相关系数ρ=0的原假设。即是说,在α=0.05的显著性水平下不能认为人均GDP与第一产业中就业比例有显著的线性相关性。 但是计算的t统计量的绝对值1.9624大于tα2=1.699,所以在α=0.1的显著性水平下,可以拒绝相关系数ρ=0的原假设。即在α=0.1的显著性水平下,可以认为人均GDP与第一产业中就业比例有一定的线性相关性。 8.3 设当年红利为Y,每股帐面价值为X 建立回归方程 Yi=β1+β2Xi+ui 估计参数为 Yi=0.479775+0.072876Xi 参数的经济意义是每股帐面价值增加1元时,当年红利将平均增加0.072876元。 序号6的公司每股帐面价值为19.25元,增加1元后为20.25元,当年红利可能为: ^ ^ Yi=0.479775+0.072876?20.25=1.955514(元) 8.4 (1)数据散点图如下: (2)根据散点图可以看出,随着航班正点率的提高,投诉率呈现出下降的趋势,两者之间存在着一定的负相关关系。 (3)设投诉率为Y,航班正点率为X 建立回归方程 Yi=β1+β2Xi+ui 估计参数为 Yi=6.0178-0.07Xi (4)参数的经济意义是航班正点率每提高一个百分点,相应的投诉率(次/10万名乘客)下降0.07。 (5)航班按时到达的正点率为80%,估计每10万名乘客投诉的次数可能为: ^ ?=6.0178-0.07?80=0.4187(次/10万) Yi 8.5 由Excel回归输出的结果可以看出: (1)回归结果为 Yi=32.99309+0.071619X2i+0.168727X3i+0.179042X3i (2)由Excel的计算结果已知:β1,β2,β3,β4 对应的 t 统计量分别为0.51206、4.853871、4.222811、3.663731 ,其绝对值均大于临界值t0.025(22-4)=2.101 ,所以各个自变量都对Y有明显影响。 由F=58.20479, 大于临界值F0.05(4-1,22-4)=3.16,说明模型在整体上是显著的。 8.6 (1)该回归分析中样本容量是14+1=15 (2)计算RSS=66042-65965=77 ESS的自由度为k-1=2,RSS的自由度 n-k=15-3=12 (3)计算:可决系数 R=65965/66042=0.9988 修正的可决系数 =12 ^ 2 15-1 ?(1-0.9988=)15-3 0. 9986 (4)检验X2和X3对Y是否有显著影响 F= ESS/(k-1)65965/232982 ===5140.11 RSS/(n-k)77/126.4166 (5) F统计量远比F临界值大,说明X2和X3联合起来对Y有显著影响,但并不能确定X2和X3各自对Y的贡献为多少。 8.7 ^ 8.8 (1)用Excel输入和X数据,生成X和 2 X3的数据,用Y对X、 X2、X3回归,估计参数 Yi=-1726.73+7.879646874Xi-0.00895X2+3.71249E-06X3 t=(-1.9213) (2.462897) (-2.55934) (3.118062) 22 R=0.973669 =0.963764 (2)检验参数的显著性:当取α=0.05时,查t分布表得t0.025(12-4)=2.306,与t统计量对比,除了截距项外, 各回归系数对应的t统计量的绝对值均大于临界值,表明在这样的显著性水平下,回归系数显著不为0。 (3)检验整个回归方程的显著性:模型的R=0.973669,=0.963794,说明可决系数较高,对样本数据拟合较好。由于F=98.60668,而当取α=0.05时,查F分布表得F0.05(4-1,12-4)=4.07,因为F=98.60668>4.07,应 2 2 拒绝H0:β2=β3=β4=0,说明X、X、X联合起来对Y确有显著影响。 (4)计算总成本对产量的非线性相关系数:因为R=0.973669因此总成本对产量的非线性相关系数为 2 23 R2=0.973669或R=0.9867466 (5)评价:虽然经t检验各个系数均是显著的,但与临界值都十分接近,说明t检验只是勉强通过,其把握并不大。如果取α=0.01,则查t分布表得t0.005(12-4)=3.3554,这时各个参数对应的t统计量的绝对值均小于临界值,则在α=0.01的显著性水平下都应接受H0:βj=0的原假设。 8.9 利用Excel输入X、y和Y数据,用Y对X回归,估计参数结果为 ?=5.73-0.314x Yii t值=(9.46)(-6.515) R=0.794 =0.775 2 2 ?=307.9693?e-0.314x 整理后得到:y 第9章 时间序列分析 9.1 (1)30× 1.06×1.05= 30×1.3131 = 39.393(万辆) (2 1=1=7.11% (3)设按7.4%的增长速度n年可翻一番 则有 1.074=60/30=2 所以 n = log2 / log1.074 = 9.71(年) 故能提前0.29年达到翻一番的预定目标。 9.2 (1)(1)以1987年为基期,2003年与1987年相比该地区社会商品零售额共增长: (1+10%)5?(1+8.2%)5?(1+6.8%)5-1=3.3186-1=2.3186=231.86% (2)年平均增长速度为 32 n (1+10%)5?(1+8.2%)5?(1+6.8%)5-1=0.0833=8.33% (3) 2004年的社会商品零售额应为 30?(1+0.0833)7=52.509(亿元) 343 9.3 (1)发展总速度(1+12%)?(1+10%)?(1+8%)=259.12% 平均增长速度=259.12%-1=9.9892% (2)500?(1+6%)2=561.8(亿元) 14570(3)平均数=∑yj=, =142.5(亿元) 4j=14 2002年一季度的计划任务:105%?142.5=149.625(亿元)。 9.4 (1)用每股收益与年份序号回归得Yt=0.365+0.193t。预测下一年(第11年)的每股收益为 ^ ?=0.365+0.193?11=2.488元 Y11 (2)时间数列数据表明该公司股票收益逐年增加,趋势方程也表明平均每年增长0.193元。是一个较为适合的投资 方向。 9.5 (1) 2)T?t=8.9625+0.63995?t (3 上表中,其趋势拟合为直线方程Tt=8.9625+0.63995?t。 根据上表计算的季节比率,按照公式Yt=Tt?St-KL计算可得: 2004年第一季度预测值: Y?17=T?17?S?1=(8.9625+0.63995?17)?1.097301=21.7723 2004年第二季度预测值: Y?18=T?18?S?2=(8.9625+0.63995?18)?1.147237=23.49725 2004年第三季度预测值: Y?19=T?19?S?3=(8.9625+0.63995?19)?0.852641=18.009 ( 2004年第四季度预测值: Y?20=T?20?S?4=(8.9625+0.63995?20)?0.902822=19.6468 平均法计算季节比率表: 季节比率的图形如下: (2) 原时间序列与移动平均的趋势如下图所示: 9.7 (1)采用线性趋势方程法:T? i=460.0607+7.0065t 剔除其长期趋势。 剔除长期趋势后分析其季节变动情况表: 3)运用分解法可得到循环因素如下图: ( .810.1 Lq=∑q1p0=2124=104.16% , Lp=∑p1q0=2196=107.73%; .2.2∑q0p02039∑p0q02039 qp2281∑p1q12281 P=∑11==103.83% , P===107.39%。 qp.8∑q0p12196∑p0q12124 2124+2281440510.2 Eq===103.99%;Fq=.16%?103.83%=103.99%;2039.2+2196.84236 104.16%+103.83%Bq==104.00%。 2 10.3 Pq=∑q1z1=94500=92.83% , Pq'=∑q1p1=117100=93.27%。 ∑q0z1101800∑q0p1125550 ∑ipp0q02196.8pq10.4 Ap===107.73%;Hp=∑p1q1=2281=107.39%;Gp=∑p0q0∏ip00=107.01%。 2039.2∑p0q0p1q12124∑ip 10.5 Lq?Pp=V;104.16%?107.39%=111.86% ;84.8+157=241.8。 10.6 ⑴360?12%=43.2;⑵112%÷105%=106.67% , 360?6.67%=24.0; ⑶360?106.67%?5%=19.2;⑷106.67%?105%=112% , 24.0+19.2=43.2。 46685636490810.7 ⑴0==2.3816 , 1==2.6967 , 假定==2.3483 196020902090 2.34832.69672.6967 ⑵,98.60%?114.84%=113.23% ?=2.38162.34832.3816 563620902.6967 ⑶ =?466819602.3816 120.74%=106.63%?113.23% , 968≈309.6+658.6 10.8 依据有关公式列表计算各企业的工业经济效益综合指数如下: 各企业经济效益综合指数一览表(标准比值法) 10.9 依据有关公式列表计算各企业的工业经济效益综合指数如下表: 各企业经济效益综合指数一览表(改进的功效系数法) 体说明)。 上面两种方法给出的综合评价结果的差异表现在D、E两个企业的综合经济效益排名不同。原因在于两种方法的对比标准不同(以下具 11.1(1)根据最大的最大收益值准则,应该选择方案一。 (2)根据最大的最小收益值准则,应该选择方案三。 (3)方案一的最大后悔值为250,方案二的最大后悔值为200,方案三的最大后悔值为300,所以根据最小的最大后悔值准则,应选择方案二。 (4)当乐观系数为0.7时,可得:方案一的期望值为220,方案二的期望值为104,方案三的期望值为85。根据折中原则,应该选择方案一。 (5)假设各种状况出现的概率相同,则三个方案的期望值分别为:116.67、93.33、83.33 按等可能性准则,应选择方案一。 11.2 (1)略 (2)三个方案的期望值分别为:150万元、140万元和96万元。但方案一的变异系数为1.09,方案二的变异系数为0.80,根据期望值准则结合变异系数准则,应选择方案二。 (3)宜采用满意准则。选择方案二。 (4) 宜采用满意准则。选择方案三。 11.3 钥匙留在车内为 A,汽车被盗为E。 P(A/E)=(0.2*0.05)/ (0.02*0.05+0.8*0.01)= 55.56%。 11.4 (1)买到传动装置有问题的车的概率是30%。 (2)修理工判断车子有问题为B1,,车子真正有问题为A1, P(A1/B1)=(0.3*0.9)/(0.3*0.9+0.7*0.2)= 66% (3)修理工判断车子没有问题为B2,车子真正有问题为A1 P(A1/B2)=(0.3*0.1)/(0.3*0.1 +0.7*0.8)= 5% 11.5 决策树图 略。 (1) 生产该品种的期望收益值为41.5万元大于不生产的期望值,根据现有信息可生产。 (2) 自行调查得出受欢迎结论的概率=0.65*0.7+0.35*0.30=0.56, 此时,市场真实欢迎的概率=0.65*0.7/(0.65*0.7+0.35*0.30)=0.8125 期望收益值=(77*0.8125 -33*0.1875)0.56+(-3*0.44) =30.25万元 (3) 委托调查得出受欢迎结论的概率=0.65*0.8 +0.35*0.20=0.59 此时,市场真实受欢迎的概率= 0.65*0.8/(0.65*0.8 +0.35*0.20)=0.8814 期望收益值=(75*0.8814 -35*0.1186)0.59+(-5*0.41)=34.50万元 根据以上分析结果。由于进一步调查的可靠性不高,并要花费相应的费用,所以没有必要进一步调查。 第12章 国民经济统计基础知识 12.1 生产法GDP=168760亿元; 分配法GDP=168755亿元 使用法GDP=154070亿元 国内生产净值=149755亿元(按生产法计算) 国民总收入=165575亿元(按收入法计算) 国民可支配总收入=167495亿元 国民可支配净收入=148490亿元 消费率=67.95%(按可支配总收入计算) 储蓄率=32.05%(按可支配总收入计算) 投资率=27.31%(按使用法GDP计算) 12.2 国民财富总额为:216765亿元 12.3生产法GDP增长速度为8.69%;紧缩价格指数为102.83%。 使用法GDP增长速度为8.25%。紧缩价格指数为103.25%。 统计学第三版答案 第一章 1. 什么是统计学?怎样理解统计学与统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。 2.简要说明统计数据的来源 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品 (2)变量:口味(如可用10分制表示) (3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。 (4)从匹配样本的观察值中推断两品牌口味的相对好坏。 第二章、统计数据的描述 思考题 1描述次数分配表的编制过程 答:分二个步骤: (1) 按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组与组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则 (2) 将数据分配到各个组,统计各组的次数,编制次数分配表。 2.解释洛伦兹曲线及其用途 答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。 3. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 4 怎样理解均值在统计中的地位? 答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分, 具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统 计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。 5 对比率数据的平均,为什么采用几何平均? 答:比率数据往往表现出连乘积为总比率的特征,不同于一般数据的和为总量的性质,由此需采用几何平均。 6. 简述众数、中位数和均值的特点和应用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。 7 为什么要计算离散系数? 答:在比较二组数据的差异程度时,由于方差和标准差受变量值水平和计量单位的影响不能直接比较,由此需计算离散系数作为比较的指标。 练习题: 1. 频数分布表如下: 服务质量等级评价的频数分布 服务质量等级 A B C D E 家庭数(频率) 14 21 32 18 15 频率% 14 21 32 18 15 100 100 合计 条形图(略) 2 (1)采用等距分组: n=40 全距=152-88=64 取组距为10 组数为 64/10=6.4 取6组 频数分布表如下: 按销售收入分组(万元) 企业数(个) 频率(%) 先进企业 良好企业 一般企业 落后企业 合计 11 11 9 9 40 27.5 27.5 22.5 22.5 100.0 3 采用等距分组 全距=49-25=24 n=40 取组距为5,则组数为 24/5=4.8 取5组 Frequency 4. .(1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时) 灯泡个数(只) 频率(%) 650~660 660~670 2 5 2 5 670~680 680~690 690~700 700~710 710~720 720~730 730~740 740~750 6 14 26 18 13 10 3 3 6 14 26 18 13 10 3 3 100 100 合计 直方图(略)。 5 等距分组 n=65 全距=9-(-25)=34 取组距为5,组数=34/5=6.8, 取 7组 Frequency (3) A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散, 且平均成绩较A班低 8. 箱线图如下:(特征请读者自己分析) 9.(LU 。 (2)s?21.17(万元)。 10.甲企业平均成本1? ?m i?13 3 1i m1i?i?1x1i =19.41(元), 乙企业平均成本2? ?m i?1 3 3 2i m1i?i?1x2i =18.29(元); 原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占 比重较大,因此拉低了总平均成本。 11.= ?xf i?1k k ii 426.67(万元); i ?f i?1 s? 116.48(万元) 13(1)离散系数,因为它消除了不同组数据水平高低的影响。 4.2 ?0.024172.1 (2)成年组身高的离散系数:; 2.3vs??0.032 71.3 幼儿组身高的离散系数:; vs? 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度 相对较大。 14 先考虑平均指标,在平均指标相近时考虑离散程度指标。 应选择方法A,其均值远高于其他两种方法,同时离散程度与其他两组相近。 15.(1)风险的度量是一个不断发展的问题,在古典金融理论中,主要采用标准差这个统计测度来反映,现代金融中,采用在险值(value at risk)。 (2)无论采用何种风险度量,商业类股票较小 (3)个人对股票的选择,与其风险偏好等因素有关。 第四章 1.总体分布指某个变量在总体中各个个体上的取值所形成的分布,它是未知的,是统计推断的对象。从总体中随机抽取容量为n的样本?x1,x2,?,xn?,它的分布称为样本分布。由样本的某个函数所形成的统计量f?x1,x2,?,xn?,它的分布称为抽样分布(如样本均值、样本方差的分布) 2.重复抽样和不重复抽样下,样本均值的标准差分别为: 因此不重复抽样下的标准差小于重复抽样下的标准差,两者相差一个调整系数 3.解释中心极限定理的含义 答:在抽样推断中,中心极限定理指出,不论总体服从何种分布,只要其数学期望和方差存在,对总体进行重复抽样时,当样本容量充分大,样本均值趋近于正态分布。中心极限定理为均值的抽样推断奠定了理论基础。 第四章、参数估计 1. 简述评价估计量好坏的标准 ?答:评价估计量好坏的标准主要有:无偏性、有效性和相合性。设总体参数?的估计量有?1 ???,称??是无偏估计量;如果??和??小于?,如果E??是无偏估计量,且D?和?112112?,则??比????,则??是相合估计量。 ?更有效;如果当样本容量n??,?D?21121 2.说明区间估计的基本原理 答:总体参数的区间估计是在一定的置信水平下,根据样本统计量的抽样分布计算出用样本 ???? ?? 统计量加减抽样误差表示的估计区间,使该区间包含总体参数的概率为置信水平。置信水平反映估计的可信度,而区间的长度反映估计的精确度。 3.解释置信水平为95%的置信区间的含义 答:总体参数是固定的,未知的,置信区间是一个随机区间。置信水平为95%的置信区间的含义是指,在相同条件下多次抽样下,在所有构造的置信区间里大约有95%包含总体参数的真值。 4.简述样本容量与置信水平、总体方差、允许误差的关系 2 z?/2??2?答:以估计总体均值时样本容量的确定公式为例:n? E2 样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。 2. 解:由题意:样本容量为n?49 (1) 若??15,?? ? ?2.143 ?1.96*2.143?4.20028 (2) ??0.05,E?z?/2 ? ?120,??z?/2?z?/2 ??120?4.20028,120?4.20028?(3) 若 ? ??115.7997,124.20028? 2. 解:由题可得:n?36,?3.317,s?1.609 尽管采用不重复抽样,但因为样本比例很小(不到0.5%),其抽样误差与重复抽样下近似相同,采用重复抽样的抽样误差公式来计算。 n?36为大样本,则在?的显著性水平下的置信区间为: ??z?/2 ???z?/2 当??0.1,z?/2?1.64,置信区间为(2.88,3.76) 当??0.05,z?/2?1.96,置信区间为(2.80,3.84) 当??0.01,z?/2?2.56,置信区间为(2.63,4.01) 5解:假设距离服从正态分布,n?16,?9.375,s?4.113 平均距离的95%的置信区间为??t0.025? 15???t0.025? 15=(7.18,11.57) 7解:由题意:n?50,p? 32 ?64%。 50 因为np,n?1?p?均超过5,大样本 (1)总体中赞成比率的显著性水平为 ?的置信区间为 ? ?p?z?/ p?z?/??当??0.05时, E?z?/ ??13.3% 置信区间为(50.7%,77.3%) (2)如果要求允许误差不超过10%,置信水平为95%,则应抽取的户数: 2 z?/2???1???1.962*0.8*0.2? n???62 E20.12 8.此题需先检验两总体的方差是否相等: 22 H0:?12??2 ,H1:?12??2 22在5%的显著性水平下,F?s1/s2?96.8/102.0?0.949 F0.025(13,6)?5.37,F0.975(13,6)?1/F0.025(6,13)?1/3.6?0.28,不拒绝原假设 认为两总体方差是相同的。 (1) 1???90%,?1?2??t0.05? 19?9.8?9.8?1.729*4.55即(1.93,17.669) (2) 1???95%,?1?2??t0.025? 19?9.8?9.8?2.093*4.55即(0.27,19.32) 11.大样本的情况 ?p1?p2? ?z?(1)90% 置信度下 ?40%?30%??(2)95% 置信度下 ?10%?6.979%(3.021%,16.979) ?40%?30%???10%?8.316%(1.684%,18.316%) 22 12.解:由题可计算:s1?0.2422,s2?0.0762 2 两个总体方差比?12/?2在95%的置信区间为: 22??s12/s2s12/s2 ,??4.06,14.35? ???Fn?1,n?1F?21??/2n1?1,n2?1???/21 14.解:由题意:??120,z?/2?1.96,E?20 2 z?/2??21.962*1202?则必须抽取的顾客数为:n???139 E2202 第五章、假设检验 思考题 1.1.理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的原则. 答:原假设通常是研究者想收集证据予以反对的假设;而备择假设通常是研究者想收集证据予以支持的假设。建立两个假设的原则有: (1)原假设和备择假设是一个完备事件组。(2)一般先确定备择假设。再确定原假设。(3)等号“=”总是放在原假设上。(4)假设的确定带有一定的主观色彩。(5)假设检验的目的主要是收集证据来拒绝原假设。 2.第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系? 答:第I类错误指,当原假设为真时,作出拒绝原假设所犯的错误,其概率为?。第II类错误指当原假设为假时,作出接受原假设所犯的错误,其概率为?。在其他条件不变时,?增大,?减小;?增大,?减小。 3.什么是显著性水平?它对于假设检验决策的意义是什么? 答:假设检验中犯第一类错误的概率被称为显著性水平。显著性水平通常是人们事先给出的一个值,用于检验结果的可靠性度量,但确定了显著性水平等于控制了犯第一错误的概率,但犯第二类错误的概率却是不确定的,因此作出“拒绝原假设”的结论,其可靠性是确定的,但作出“不拒绝原假设”的结论,其可靠性是难以控制的。 4.什么是p值?p值检验和统计量检验有什么不同? 答:p值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。P值常常作为观察到的数据与原假设不一致程度的度量。统计量检验采用事先确定显著性水平?,来控制犯第一类错误的上限,p值可以有效地补充?提供地关于检验可靠性的有限信息。 p值检验的优点在于,它提供了更多的信息,让人们可以选择一定 的水平来评估结果是否具有统计上的显著性。 5.什么是统计上的显著性? 答:一项检验在统计上是显著的(拒绝原假设),是指这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的。显著性的意义在于“非偶然的 练习题 3.解(1)第一类错误是,供应商提供的炸土豆片的平均重量不低于60克,但店方拒收并投诉。 (2)第二类错误是,供应商提供的炸土豆片的平均重量低于60克,但店方没有拒收。 (3)顾客会认为第二类错误很严重,而供应商会将第一类错误看得较严重。 4.解:提出假设 H0:??6,H2:??6 已知 ??1.19,n?100,??0.05 (1) 检验统计量为Z? ?6 ?aN?0,1? (2) 拒绝规则是:若Z?z?,拒绝H0;否则,不拒绝H0 (3) 由? 6.35得:Z? 6.35?6 ?2.94?z0.05?1.64,拒绝H0,认为改进工艺 能提高其平均强度。 5解: 设?为如今每个家庭每天收看电视的平均时间(小时) 需检验的假设为:H0:??6.70,H1:??6.70 调查的样本为:n?200,?7.25,s?2.5 大样本下检验统计量为:z? 0.55*14.14 ???3.11 2.5在0.01的显著性水平下,右侧检验的临界值为z0.01?2.33 因为z?2.33,拒绝H0,可认为如今每个家庭每天收看电视的平均时间增加了 6. 解:提出假设 H0:?TV??VCR?0.75,H1:?TV?0.75 已知:n?30,s?2,??0.05 2 22222 2 n?1s??29*2 检验统计量?2???103??2 2 ?VCR 0.752 0.05 ?29??42.557 拒绝H0,可判定电视使用寿命的方差显著大于VCR 7. 解:提出假设:H0:?1??2?5,H1:?1??2?5 ??0.02,n1?100,n2?50,独立大样本,则检验统计量为: z? ? ?5?14.8?10.4?5??5.1458 而z0.01?2.33 因为z?z?/2,拒绝H0,平均装配时间之差不等于5分钟 8. 解:匹配小样本 提出假设:H0:?a??b,H1:?a??b 由计算得:?0.625,sd?1.302,n? 8,??0.05,检验统计量为 t? ??1.3577?t0.05?7??1.8946,不拒绝H0,不能认为广告提高了 潜在购买力的平均得分。 9. 解:提出假设:H0:?1??2,H1:?1??2 已知:n1?288,p1? 197301 ?0.684,n2?367,p2??0.82,??0.1 288367 大样本,则检验统计量为: p? p1n1?p2n2288*0.684?367*0.82 ??0.76 n1?n2288?367 ? ??4.0476 z? 而z0.1?1.29,因为z??z0.1,拒绝H0,可认为信息追求者消极度假的比率显著小于非信息追求者。 10. 解:提出假设:H0:?1??2,H1:?1??2 由题计算得:n1?25,s1?0.221,n2?22,s2?0.077 2 2 2 2 s120.2212 检验统计量为:F?2??8.2376,而F0.025?24,21??2.37 2 s20.077 F?F,n2?1?,所以拒绝H0,认为两种机器的方差存在显著差异。 ?/2?n1?1 第七章 相关与回归分析 思考题 1. 相关分析与回归分析的区别与联系是什么? 答:相关与回归分析是研究变量之间不确定性统计关系的重要方法,相关分析主要是判断两个或两个以上变量之间是否存在相关关系,并分析变量间相关关系的形态和程度。回归分析主要是对存在相关关系的现象间数量变化的规律性作出测度。但它们在研究目的和对变量的处理上有明显区别。它们均是统计方法,不能揭示现象之间的本质关系。 3.什么是总体回归函数和样本回归函数?它们之间的区别是什么? 答:以简单线性回归模型为例,总体回归函数是总体因变量的条件期望表现为自变量的函数: E?YXi??f?Xi?????Xi,或Yi????Xi?ui。总体回归函数是确定的和未知的, 是回归分析所估计的对象。样本回归函数是根据样本数据所估计出的因变量与自变量之间的 ?x或y???x?e。回归分析的目的是用样本回归函数来估计总???????i??函数关系:yiiii 体回归函数。它们的区别在于,总体回归函数是未知但是确定的,而样本回归函数是随样本 ?是随机变量;?,?波动而变化;总体回归函数的参数?,?是确定的,而样本回归函数的系数? 总体回归函数中的误差项ui不可观察的,而样本回归函数中的残差项ei是可以观察的。 4. 什么是随机误差项和残差?它们之间的区别是什么? 答:随机误差项ui表示自变量之外其他变量的对因变量产生的影响,是不可观察的,通常要对其给出一定的假设。残差项ei指因变量实际观察值与样本回归函数计算的估计值之间的偏差,是可以观测的。它们的区别在于,反映的含义是不同且可观察性也不同,它们的联系可有下式: 垐 x?u 垐 ?????ei?yi????xi?????xi?ui?????xi?????ii 5.为什么在对参数进行最小二乘估计时,要对模型提出一些基本的假定? 答:最小二乘法只是寻找估计量的一种方法,其寻找到的估计量是否具有良好的性质则依赖模型的一些基本的假定。只有在一系列的经典假定下,最小二乘估计量才是BLUE。 15. .为什么在多元回归中要对可决系数进行修正? 答:在样本容量一定下,随着模型中自变量个数的增加,可决系数R会随之增加,模型的拟合程度上升,但自由度会损失,从而降低推断的精度,因此需要用自由度来修正可决系数, 2 ?????? 用修正的可决系数来判断增加自变量的合适性。 16.在多元线性回归中,对参数作了t检验后为什么还要作方差分析和F检验? 答:t检验仅是对单个系数的显著性进行检验,由于自变量之间存在着较为复杂的关系,因此有必要对回归系数进行整体检验,方差分析和F检验就是对回归方程的整体统计显著性进行的检验方法。 练习题 1. 解:设简单线性回归方程为:y??1??2x?? ??(1) 采用OLS估计:?2 ?xi???yi??334229.09 ??0.786 2 425053.73??xi?? ??????549.8?0.786*647.88?40.566 ?11 回归系数经济意义:销售收入每增加1万元,销售成本会增加0.786万元。 ??xi???yi???334229.092???(2) 可决系数为:R???0.9998 22 ??xi????yi??425053.73*262855.25 2 2 ???回归标准误: ? ? 2.29 ??2 (3) 检验统计量为:t?? Se?2 ? ? ?223.76 所以?2是显著不为零 ????x?40.566?0.786*800?669.366 ?f??(4) 预测:y12f 95% 的 预 测区间为 : ?f?1.96*?y ?669.366?即( 664.579 ,674.153) 2. (1) (2)负相关关系 (3) 9 24.67 .638118686 1 .638118686 Prob > F = 0.0016 .181036906 7 .025862415 R-squared = 0.7790 0.7474 .819155592 8 .102394449 Root MSE = .16082-.0704144 .0141757 -4.97 0.002 -.1039346 -.0368941 6.017831 1.05226 5.72 0.001 3.529632 8.50603 (4)估计的斜率系数为-7.0414,表示航班的正点率每提高1%,百万名乘客的投诉次数会下降:7.0414*0.01=0.070414次。 (5)如果xf?0.8,则yf?6.0178?7.0414*0.8?0.38468次 3. Results of multiple regression for y Summary measures Multiple R R-Square Adj R-Square StErr of Est 0.9521 0.9065 0.8910 3.3313 ANOVA Table Source df SS MS F p-value Explained 3 1937.7485 645.9162 58.2048 0.0000 Unexplained 18 199.7515 11.0973 Regression coefficients Coefficient Std Err t-value p-value Lower limit Constant 32.9931 3.1386 10.5121 0.0000 26.3991 x1 0.0716 0.0148 4.8539 0.0001 0.0406 x2 16.8727 3.9956 4.2228 0.0005 8.4782 x3 17.9042 4.8869 3.6637 0.0018 7.6372 4. 29 3034.13 2.9873e+10 1 2.9873e+10 Prob > F = 0.0000 265831846 27 9845623.91 R-squared = 0.9912 0.9909 3.0139e+10 28 1.0764e+09 Root MSE = 3137.8 .5459054 .0099106 55.08 0.000 .5255705 .5662403 2426.563 809.8789 3.00 0.006 764.829 4088.298 29 3034.13 2.9873e+10 1 2.9873e+10 Prob > F = 0.0000 265831769 27 9845621.08 R-squared = 0.9912 0.9909 3.0139e+10 28 1.0764e+09 Root MSE = 3137.8 .5459054 .0099106 55.08 0.000 .5255705 .5662403 131260.2 1869.528 70.21 0.000 127424.3 135096.2Upp 5. 2812845.95 6.2442e+10 2 3.1221e+10 Prob > F = 0.0000 63190678.2 26 2430410.7 R-squared = 0.9990 0.9989 6.2505e+10 28 2.2323e+09 Root MSE = 1559 .1325853 .0398154 3.33 0.003 .0507435 .2144272 .8546615 .0781069 10.94 0.000 .6941105 1.015213 28 8120.05 2.9088e+10 2 1.4544e+10 Prob > F = 0.0000 44777396.2 25 1791095.85 R-squared = 0.9985 0.9983 2.9132e+10 27 1.0790e+09 Root MSE = 1338.3 .1603467 .0352595 4.55 0.000 .0877283 .2329651 .7797504 .0710054 10.98 0.000 .633512 .9259889 1211.364 377.8058 3.21 0.004 433.2588 1989.47 29 123.97 .043595009 1 .043595009 Prob > F = 0.0000 .009495109 27 .000351671 R-squared = 0.8212 0.8145 .053090118 28 .001896076 Root MSE = .01875-6.59e-07 5.92e-08 -11.13 0.000 -7.81e-07 -5.38e-07 .6662515 .0048402 137.65 0.000 .6563202 .6761829 7. 解 (1)样本容量:n?dfTSS?1?15 (2)RSS?TSS?ESS?66042?65965?77 (3)dfRSS?n?k?15?3?12,dfESS?k?1?2 (4)R? 2 ESS65965n?114 ??0.9988,2?1??1?R2??1??1?0.9988??0.9986 TSS66042n?k12 (5)用F检验:F? ESS/?k?1?65965/2 ??5140,F0.05?2,12??3.89 RSS/n?k77/12 x2,x3整体对y有显著影响,但不能确定单个对y的贡献。 《统计 学》第4 章习题 参考答 案与答 疑 答案与答疑 加入时间: 2008-10-21 17:53:07 点击:1049 4.1 (1)M=10(台);Me=10(台);Mean=9.6(台) o (2)Q=5.5 ;Q=12 LU (3)s=4.2(台) (4)左偏分布 4.2 (1)M=19(岁);M=23(岁);Me=23(岁) oo (2)Q=19; Q=26.5 LU (3)Mean=24(岁);s=6.65(岁) (4)SK=1.08;KU=0.77 (5)样本数据的均值为24岁,但标准差较大,说明网民年龄之间差 异较大.从偏态和峰度系数来看,网民年龄呈现右偏尖峰分布. 4.3 (1)略; (2)Mean=7(分钟); s=0.714(分钟) (3)由于均值不同,采用V进行比较:V=0.274,V=0.102 12 (4)选择第二种(Mean小,V 4.4 (1)Mean=274.1(万元); (2)略; (3)s=21.17 4.5 Mean甲=19.41(元);Mean乙=18.29(元);由于单位成本较低的产品在 乙企业中占的比重比较大,拉低了总平均成本. 4.6 Mean=426.67(万元);s=116.48(万元);SK=0.203;KU=-0.688 4.7(1)MEAN大体相同;(2)S大体相同;(3)较大样本的研究人员机会更多. 4.8(1)Vmale=0.08;Vfemale=0.1 (2)Mean=132(磅);s=11(磅);Mean=110(磅);s=11(磅); malemalefemalefemale (3)68%. (4)95% 4.9 Z=1 Z=0.5,A项更理想一些.(思路:标准分数) AB 4.10 周一和周六(思路:标准分数) 4.11 (1)离散系数,由于数据水平高低不同;(2)V=0.024 ;V=0.035 adultchild 4.12 略 4.13 略 《统计 学》第5 章习题 参考答 案与答 疑 答案与答 疑 加 入时间: 2008-10-3 0 9:15:45 点击:776 5.1 (1)Ω=[0,100] (2)Ω=N (3)Ω=?10,11,12,13,14,....? 5.2 P(A?B)=0.30 5.3 P(B)=2/9 5.4 7/12 ?B)=0.94;(3)P=0.38 5.5 (1)P(AB)=0.56;(2)P(A5.6 P=0.72 5.7 P=2/3 5.8 P=5/11 ;P=28/55 初中高中 5.9 P=0.25 ;P=0.11 AB 5.10 P(x=0)=1/4;P(x=1)=1/2;P(x=2)=1/4 5.11 (1)P(x=100)=0.001;P(x=10)=0.01;P(x=1)=0.2;P(x=0)=0.789;(2)E(X)=0 .4 5.12 (1)θ=2;(2)E(X)=3/2;(3)D(X)=3/20 5.13 1/64 5.14 2/3e 5.15 k=λ-1 或k=λ 5.16 (1)0.7;(2)1/2 5.17 ?398 5.18 (1)0.93 (2)0.39 统计学第三版答案 第二章 2、1)、根据该行业管理局的原始资料整理排序如下: 2)、根据数据资料确定分组组数: k?1? lgNlg2 ?1? lg40lg2 ?1? 1.60210.301 ?6.3?6组 3)、确定各组组距: 各组组距=(152-87)÷6=10.83为了整理方便,组距取为:10 4)、编制频数分布表和计算累计频数、频率: 5)、按照企业的成绩规定进行分组: 3、解:1)、根据百货公司的原始数据排序得: 2)、确定分组的组数: k?1? lgNlg2 ?1? lg40lg2 ?1? 1.60210.301 ?6.3?6组 3)、确定组距: 组距=(49-25)÷6=4 4)、根据资料进行分组整理并编制频数表如下: 5)、直方图如 下: 9、解 x?该百货公司的日均销售额= n ?822330 =274.1(万元) 中位数为排序后第15项数值与16项数值的平均数 (272+273)÷2=272.5(万元) 计算日销售额的标准差: ?? ?(x?) n 2 ? 13002.730 ?20.82(万元) 10、 解: 甲企业的平均成本= 2100?3000?1500210015 ?300020 ?150030 ?6600340 ?19.41(元) 乙企业的平均成本= 3255?1500?1500325515 ?150020 ?150030 ? 6255342 ?18.29(元) 很显然,甲的平均单位成本高于乙企业,主要的原因是各个产品的生产比重不 同,甲企业的产量较集中在成本较高产品B,而乙企业的产量较集中在单位成本比较低的A产品上,这是两个企业产生平均成本差异的主要原因。 11、该地区的企业利润的平均数=51200 120 ? 426.67(万元) 标准差s?116.48(万元)。 13、成人组的平均身高=(166+169+172+177+180+170+172+174+168+173)÷10 =172.1(厘米) 幼儿组的平均身高=(68+69+68+70+71+73+72+73+74+75)÷10=71.3(厘米) 成人组身高的标准差= 158.910 ?3.99(厘米) 幼儿身高的标准差= 56.110 ?2.37(厘米) 成人组的身高标准差系数=3.99÷172.1=2.32% 幼儿组的身高标准差系数=2.37÷71.3=3.32% 显然,幼儿的身高差异大于成年组。 第四章 参数估计 2. 解:由题意:样本容量为n?49 (1) 若??15,?? ? ?2.143 (2) ??0.05,E?z?/2 ?1.96*2.143?4.20028 ? ?120,??z?/2?z?/2 ??120?4.20028,120?4.20028? (3) 若 ? ??115.7997,124.20028? 3、 解:由题可得:n?36,?3.317,s?1.609 尽管采用不重复抽样,但因为样本比例很小(不到0.5%),其抽样误差与重复抽样下近似相同,采用重复抽样的抽样误差公式来计算。 n?36为大样本,则在?的显著性水平下的置信区间为: ??z?/2 ? ??z?/2 当??0.1,z?/2?1.64,置信区间为(2.88,3.76) 当??0.05,z?/2?1.96,置信区间为(2.80,3.84) 当??0.01,z?/2?2.56,置信区间为(2.63,4.01) 5、解:假设距离服从正态分布,n?16,?9.375,s?4.113 平均距离的95%的置信区间为??t0.025? 15? ? ??t0.025? 15=(7.18,11.57) 7、解:由题意:n?50,p?32?64%。 50 因为np,n?1?p?均超过5,大样本 (1)总体中赞成比率的显著性水平为?? ?p?z?/?? 的置信区间为 p?z? ?1.96?13.3% 当??0.05时, E?z?/2 置信区间为(50.7%,77.3%) (2)如果要求允许误差不超过10%,置信水平为95%,则应抽取的户数: n? ?z?/2???1??? E 2 2 ? 1.96*0.8*0.2 0.1 2 2 ?62 8.此题需先检验两总体的方差是否相等: 2222 H0:?1??2,H1:?1??2 22 在5%的显著性水平下,F?s1/s2?96.8/102.0?0.949 F0.025(13,6)?5.37,F0.975(13,6)?1/F0.025(6,13)?1/3.6?0.28,不拒绝原假设 认为两总体方差是相同的。 (1) 1???90%,?1?2??t0.05? 19?9.8??9.8?1.729*4.55即(1.93,17.669) ( 1???95%,?1?2??t0.025? 192) ?9.8??9.8?2.093*4.55 即(0.27,19.32) 11.大样本的情况 ?p (1)90% 置信度下 1 ?p2? ?z?/2 ?40%?30%??1.645* (2)95% 置信度下 ?10%?6.979%(3.021%,16.979) ?40%?30%??1.96* 21 2 2 2 ?10%?8.316%(1.684%,18.316%) 12.解:由题可计算:s ?0.242,s2?0.076 两个总体方差比?12/?22在95%的置信区间为: 2222 ??s1/s2s1/s2 ,??4.06,14.35? ???F?n?1,n?1?F?n?1,n2?1??21??/2?1??/21 14.解:由题意:? ?120,z?/2?1.96,E?20 则必须抽取的顾客数为:n? ?z?/2??2 E 2 2 ? 1.96*120 20 2 22 ?139 一是原假设 ,指对总体提出某具体特征的假设。二是备择假设,是指原假设的互逆事件,即总体不 具某具体特征的假设,备择假设是伴随原假设产生的,与原假设相对立的假设,所以也 叫对立假设或称备选假设。当检验证明原假设可信时,我们就接受原假设,否定备择假 设;当检验证明原假设不可信时,我们就拒绝原假设,而接受备择假设。 第七章 相关与回归分析 7、 解 (1)样本容量:n?dfTSS?1?15 (2)RSS?TSS?ESS?66042?65965?77 (3)dfRSS?n?k?15?3?12,dfESS?k?1?2 (4)R? 2 ESSTSS ? 6596566042 ?0.9988,R?1??1?R 2 2 ?n?k n?1 ?1??1?0.9988? 1412 ?0.9986 (5)用F检验:F? ESS/?k?1?RSS/?n?k? ? 65965/277/12 ?5140,F0.05?2,12??3.89 x2,x3整体对y有显著影响,但不能确定单个对y的贡献。 第九章 统计指数 1、解:1)、拉氏指数的编制 销售量指数 21242039.2 ? ?q ?q 10 p0p0 ? 560?1.60?250?2.00?320?1.00?170?2.40550?1.60?224?2.00?308?1.00?168?2.40 ??104.16% 价格指数2196.82039.2 ? ?q?q 00 p1p0 ? 550?1.80?224?1.90?308?0.90?168?3.00550?1.60?224?2.00?308?1.00?168?2.40 ??107.73% 2)、帕氏指数的编制 销售量指数 ? ? 22812196.8 ?q ?q 10 p1p1 ? 560?1.80?250?1.90?320?0.90?170?3.00550?1.80?224?1.90?308?0.90?168?3.00 ?103.83% 价格指数22812124 ? ?q?q 1 p1p0 ? 560?1.80?250?1.90?320?0.90?170?3.00560?1.60?250?2.00?320?1.00?170?2.40 1 ??107.39% 2、 解:以单位成本为同度量因素的产量指数: ?q?q?q?q 1 p1 p01 ? 340?50?35?800?150?330270?50?32?800?190?330 ? 94500101800 ?92.83% 以销售价格为同度量因素的产量指数: 1 p1 p01 ? 340?65?35?1000?150?400270?65?32?1000?190?400 ? 117100125550 ?93.27% 3、1)、用基期加权的算术平均指数: ?kqp ?qp 00 ? 880?1.125?448?0.95?308?0.9?403.2?1.25 2039.2 ? 2196.82039.2 ?107.73% 2)、用计算期加权的调和平均指数: ?q? 3)、(略) 1 p1 q1p1k ? 1008?475?288?51010081.125 ?4750.95 ?2880.9 ?5101.25 ? 22812124 ?107.39% 4、解:指数体系的建立为: 指数体系1)、: ?q?q 1 p1p0 ? ?q?q 2281 10 p0p0 ? ?q?q 1 p1p0 1 111.86%( 2039.2 )?104.16%?107.39 (2124-2039.2)+(2281-2124) 即: 107.36% 指数体系2): ?q?q 1 p1 p00 ? ?q?q 1 p1 p01 q?? ?q p1 p00 111.86%=103.83%×107.73% (2281-2196.8)+(2196.8-2039.2) 即: 111.86%=103.83%×107.73% 241.8=84.2+157.6 5、1)、农民因交售农副产品增加的收入为: 360×12%=43.2亿元 2)、农副产品增长率为:1.12%÷1.05%-1=6.7% 由此增加的收入为:360×(1+12%)÷1.05-360=24(亿元) 3)、农副产品的价格上升5%,提高的农民的收入为: 360×(1+12%)-360×(1+12%)÷1.05=19.2(亿元) 变动的平衡公式为: 43.2(总变动)=24(价格变动)+19.2(产量变动) 第 1章 统计和统计数据 第 2章 1.1 指 出 下 面 的 变 量 类 型 。 (1) 年 龄 。 (2) 性 别 。 (3) 汽 车 产 量 。 (4) 员 工 对 企 业 某 项 改 革 措 施 的 态 度(赞 成 、中 立 、反 对 )。 (5) 购 买 商 品 时 的 支 付 方 式 (现 金 、 信 用 卡 、 支 票 ) 。 详 细 答 案 : (1) 数 值 变 量 。 (2) 分 类 变 量 。 (3) 数 值 变 量 。 (4) 顺 序 变 量 。 (5) 分 类 变 量 。 1.2 一 家 研 究 机 构 从 IT 从 业 者 中 随 机 抽 取 1000人 作 为 样 本 进 行 调 查 , 其 中 60%回 答 他 们 的 月 收 入 在 5000元 以 上 , 50%的 人 回 答 他 们 的 消 费 支 付 方 式 是 用 信 用 卡 。 (1) 这 一 研 究 的 总 体 是 什 么 ? 样 本 是 什 么 ? 样 本 量 是 多 少 ? (2) “ 月 收 入 ” 是 分 类 变 量 、 顺 序 变 量 还 是 数 值 变 量 ? (3) “ 消 费 支 付 方 式 ” 是 分 类 变 量 、 顺 序 变 量 还 是 数 值 变 量 ? 详 细 答 案 : (1)总 体 是 “ 所 有 IT 从 业 者 ” , 样 本 是 “ 所 抽 取 的 1000名 IT 从 业 者 ” , 样 本 量 是 1000。 (2) 数 值 变 量 。 (3) 分 类 变 量 。 1.3 一 项 调 查 表 明 , 消 费 者 每 月 在 网 上 购 物 的 平 均 花 费 是 200元 , 他 们 选 择 在 网 上 购 物 的 主 要 原 因 是 “ 价 格 便 宜 ” 。 (1) 这 一 研 究 的 总 体 是 什 么 ? (2) “ 消 费 者 在 网 上 购 物 的 原 因 ” 是 分 类 变 量 、 顺 序 变 量 还 是 数 值 变 量 ? 详 细 答 案 : (1) 总 体 是 “ 所 有 的 网 上 购 物 者 ” 。 (2) 分 类 变 量 。 1.4 某 大 学 的 商 学 院 为 了 解 毕 业 生 的 就 业 倾 向 , 分 别 在 会 计 专 业 抽 取 50人 、 市 场 营 销 专 业 抽 取 30、 企 业 管 理 20人 进 行 调 查 。 (1) 这 种 抽 样 方 式 是 分 层 抽 样 、 系 统 抽 样 还 是 整 群 抽 样 ? (2) 样 本 量 是 多 少 ? 详 细 答 案 : (1) 分 层 抽 样 。 (2) 100。 第 2章 用图表展示数据 第 3章 用统计量描述数据 3.1 随 机 抽 取 25个 网 络 用 户 , 得 到 他 们 的 年 龄 数 据 如 下 (单 位 :周 岁 ) : 计 算 网 民 年 龄 的 描 述 统 计 量 , 并 对 网 民 年 龄 的 分 布 特 征 进 行 综 合 分 析 。 详 细 答 案 : 网 民 年 龄 的 描 述 统 计 量 如 下 : 从 集 中 度 来 看 , 网 民 平 均 年 龄 为 24岁 , 中 位 数 为 23岁 。 从 离 散 度 来 看 , 标 准 差 在 为 6.65岁 , 极 差 达 到 26岁 , 说 明 离 散 程 度 较 大 。 从 分 布 的 形 状 上 看 , 年 龄 呈 现 右 偏 , 而 且 偏 斜 程 度 较 大 。 3.2 某 银 行 为 缩 短 顾 客 到 银 行 办 理 业 务 等 待 的 时 间 , 准 备 采 用 两 种 排 队 方 式 进 行 试 验 。一 种 是 所 有 顾 客 都 进 入 一 个 等 待 队 列 ;另 一 种 是 顾 客 在 3个 业 务 窗 口 处 列 队 3排 等 待 。 为 比 较 哪 种 排 队 方 式 使 顾 客 等 待 的 时 间 更 短 , 两 种 排 队 方 式 各 随 机 抽 取 9名 顾 客 ,得 到 第 一 种 排 队 方 式 的 平 均 等 待 时 间 为 7.2分 钟 ,标 准 差 为 1.97分 钟 ,第 二 种 排 队 方 式 的 等 待 时 间(单 位 :分 钟 ) 如 下 : (1)计 算 第 二 种 排 队 时 间 的 平 均 数 和 标 准 差 。 (2)比 两 种 排 队 方 式 等 待 时 间 的 离 散 程 度 。 (3)如 果 让 你 选 择 一 种 排 队 方 式 , 你 会 选 择 哪 一 种 ? 试 说 明 理 由 。 详 细 答 案 : (1) (岁 ) ; (岁 ) 。 (2) ; 。 第 一 中 排 队 方 式 的 离 散 程 度 大 。 (3) 选 方 法 二 , 因 为 平 均 等 待 时 间 短 , 且 离 散 程 度 小 。 3.3 在 某 地 区 随 机 抽 取 120家 企 业 , 按 利 润 额 进 行 分 组 后 结 果 如 下 : 计 算 120家 企 业 利 润 额 的 平 均 数 和 标 准 差(注 :第 一 组 和 最 后 一 组 的 组 距 按 相 邻 组 计 算 ) 。 详 细 答 案 : =426.67(万 元 ) ; (万 元 ) 。 3.4 一 家 公 司 在 招 收 职 员 时 , 首 先 要 通 过 两 项 能 力 测 试 。 在 A 项 测 试 中 , 其 平 均 分 数 是 100分 ,标 准 差 是 15分 ;在 B 项 测 试 中 ,其 平 均 分 数 是 400分 , 标 准 差 是 50分 。 一 位 应 试 者 在 A 项 测 试 中 得 了 115分 , 在 B 项 测 试 中 得 了 425分 。 与 平 均 分 数 相 比 , 该 位 应 试 者 哪 一 项 测 试 更 为 理 想 ? 详 细 答 案 : 通 过 计 算 标 准 化 值 来 判 断 , , ,说 明 在 A 项 测 试 中 该 应 试 者 比 平 均 分 数 高 出 1个 标 准 差 , 而 在 B 项 测 试 中 只 高 出 平 均 分 数 0.5个 标 准 差 , 由 于 A 项 测 试 的 标 准 化 值 高 于 B 项 测 试 , 所 以 A 项 测 试 比 较 理 想 。 3.5 一 种 产 品 需 要 人 工 组 装 , 现 有 3种 可 供 选 择 的 组 装 方 法 。 为 检 验 哪 种 方 法 更 好 , 随 机 抽 取 15个 工 人 , 让 他 们 分 别 用 3种 方 法 组 装 。 下 面 是 15个 工 人 分 别 用 3种 方 法 在 相 同 的 时 间 内 组 装 的 产 品 数 量 (单 位 :个 ) : 1. 你 准 备 用 哪 些 统 计 量 来 评 价 组 装 方 法 的 优 劣 ? 2. 如 果 让 你 选 择 一 种 方 法 , 你 会 做 出 怎 样 的 选 择 ? 试 说 明 理 由 。 详 细 答 案 : 评 价 。从 集 中 度 看 , 方 法 A 的 平 均 水 平 最 高 , 方 法 C 最 低 ; 从 离 散 度 看 , 方 法 A 的 离 散 系 数 最 小 , 方 法 C 最 大 ; 从 分 布 的 形 状 看 , 方 法 A 和 方 法 B 的 偏 斜 程 度 都 不 大 , 方 法 C 则 较 大 。 (2)综 合 来 看 ,应 该 选 择 方 法 A ,因 为 平 均 水 平 较 高 且 离 散 程 度 较 小 。 第 4章 概率分布 4.1 消 费 者 协 会 经 过 调 查 发 现 , 某 品 牌 空 调 器 有 重 要 缺 陷 的 产 品 数 出 现 的 概 率 分 布 如 下 : 根 据 这 些 数 值 , 分 别 计 算 : (1)有 2到 5个 (包 括 2个 与 5个 在 内 ) 空 调 器 出 现 重 要 缺 陷 的 概 率 。 (2)只 有 不 到 2个 空 调 器 出 现 重 要 缺 陷 的 概 率 。 (3)有 超 过 5个 空 调 器 出 现 重 要 缺 陷 的 概 率 。 详 细 答 案 : (1) 0.724。 (2) 0.171。 (3) 0.105。 4.2 设 是 参 数 为 和 的 二 项 随 机 变 量 。 求 以 下 概 率 : (1) ; (2) 。 详 细 答 案 : (1) 0.375。 (2) 0.6875。 4.3 求 标 准 正 态 分 布 的 概 率 : (1 ) ; (2 ) ; (3 ) 。 详 细 答 案 : (1) 0.3849。 (2) 0.1844。 (3) 0.0918。 4.4 由 30辆 汽 车 构 成 的 一 个 随 机 样 本 , 测 得 每 百 公 里 的 耗 油 量 数 据 如 下 (单 位 :公 升 ) 绘 制 正 态 概 率 图 , 判 断 该 种 汽 车 的 耗 油 量 是 否 近 似 服 从 正 态 分 布 ? 详 细 答 案 : 正 态 概 率 图 如 下 : 由 正 态 概 率 图 可 以 看 出 , 汽 车 耗 油 量 基 本 服 从 正 态 分 布 。 4.5 从 均 值 为 200、标 准 差 为 50的 总 体 中 ,抽 取 的 简 单 随 机 样 本 , 用 样 本 均 值 估 计 总 体 均 值 。 (1)的 期 望 值 是 多 少 ? (2)的 标 准 差 是 多 少 ? (3)的 概 率 分 布 是 什 么 ? 详 细 答 案 : (1) 200。 (2) 5。 (3) 近 似 正 态 分 布 。 4.6 从 的 总 体 中 , 抽 取 一 个 容 量 为 500的 简 单 随 机 样 本 。 (1 ) 的 期 望 值 是 多 少 ? (2 ) 的 标 准 差 是 多 少 ? (3 ) 的 分 布 是 什 么 ? 详 细 答 案 : (1) 0.4。 (2) 0.0219 。 (3) 近 似 正 态 分 布 。 4.7 假 设 一 个 总 体 共 有 8个 数 值 , 54, 55, 59, 63, 64, 68, 69, 70。 从 该 总 体 中 按 重 复 抽 样 方 式 抽 取 的 随 机 样 本 。 (1)计 算 出 总 体 的 均 值 和 方 差 。 (2)一 共 有 多 少 个 可 能 的 样 本 ? (3)抽 出 所 有 可 能 的 样 本 , 并 计 算 出 每 个 样 本 的 均 值 。 (4)画 出 样 本 均 值 的 正 态 概 率 图 , 判 断 样 本 均 值 是 否 服 从 正 态 分 布 ? (5)计 算 所 有 样 本 均 值 的 平 均 数 和 标 准 差 , 并 与 总 体 的 均 值 和 标 准 差 进 行 比 较 , 得 到 的 结 论 是 什 么 ? 详 细 答 案 : (1 ) , 。 (2) 共 有 64个 样 本 。 (3) 所 有 样 本 的 样 本 均 值 如 下 : (4) 样 本 均 值 的 正 态 概 率 图 如 下 : 从 正 态 概 率 图 可 以 看 出 , 样 本 均 值 近 似 服 从 正 态 分 布 。 (5) , 。样 本 均 值 的 平 均 数 等 于 总 体 平 均 数 , 样 本 均 值 的 标 准 差 等 于 总 体 标 准 差 的 。 第 5章 参数估计 5.1 某 快 餐 店 想 要 估 计 每 位 顾 客 午 餐 的 平 均 花 费 金 额 , 在 为 期 3周 的 时 间 里 选 取 49名 顾 客 组 成 了 一 个 简 单 随 机 样 本 。 (1)假 定 总 体 标 准 差 为 15元 , 求 样 本 均 值 的 标 准 误 差 。 (2)在 95%的 置 信 水 平 下 , 求 估 计 误 差 。 (3)如 果 样 本 均 值 为 120元 , 求 总 体 均 值 的 95%的 置 信 区 间 。 详 细 答 案 : (1) 。 (2) E=4.2。 (3) (115.8, 124.2) 。 5.2 利 用 下 面 的 信 息 , 构 建 总 体 均 值 的 置 信 区 间 。 (1)总 体 服 从 正 态 分 布 , 且 已 知 , , , 置 信 水 平 为 95%。 (2)总 体 不 服 从 正 态 分 布 , 且 已 知 , , , 置 信 水 平 为 95%。 (3)总 体 不 服 从 正 态 分 布 , 未 知 , , , , 置 信 水 平 为 90%。 (4)总 体 不 服 从 正 态 分 布 , 未 知 , , , , 置 信 水 平 为 99%。 详 细 答 案 : (1) (8647, 9153) 。 (2) (8734, 9066) 。 详 细 答 案 : (4.06, 24.35) 。 5.10 某 超 市 想 要 估 计 每 个 顾 客 平 均 每 次 购 物 花 费 的 金 额 。根 据 过 去 的 经 验 , 标 准 差 大 约 为 120元 , 现 要 求 以 95%的 置 信 水 平 估 计 每 个 顾 客 平 均 购 物 金 额 的 置 信 区 间 ,并 要 求 估 计 误 差 不 超 过 20元 ,应 抽 取 多 少 个 顾 客 作 为 样 本 ? 详 细 答 案 : 139。 5.11 假 定 两 个 总 体 的 标 准 差 分 别 为 : , ,若 要 求 估 计 误 差 不 超 过 5, 相 应 的 置 信 水 平 为 95%, 假 定 , 估 计 两 个 总 体 均 值 之 差 时 所 需 的 样 本 量 为 多 大 ? 详 细 答 案 : 57。 5.12 假 定 , 估 计 误 差 , 相 应 的 置 信 水 平 为 95%, 估 计 两 个 总 体 比 例 之 差 时 所 需 的 样 本 量 为 多 大 ? 详 细 答 案 : 769。 第 6章 假设检验 6.1 一 项 包 括 了 200个 家 庭 的 调 查 显 示 , 每 个 家 庭 每 天 看 电 视 的 平 均 时 间 为 7.25小 时 ,标 准 差 为 2.5小 时 。据 报 道 , 10年 前 每 天 每 个 家 庭 看 电 视 的 平 均 时 间 是 6.70小 时 。 取 显 著 性 水 平 , 这 个 调 查 能 否 证 明 “ 如 今 每 个 家 庭 每 天 收 看 电 视 的 平 均 时 间 增 加 了 ” ? 详 细 答 案 : , =3.11, , 拒 绝 , 如 今 每 个 家 庭 每 天 收 看 电 视 的 平 均 时 间 显 著 地 增 加 了 。 6.2 为 监 测 空 气 质 量 , 某 城 市 环 保 部 门 每 隔 几 周 对 空 气 烟 尘 质 量 进 行 一 次 随 机 测 试 。已 知 该 城 市 过 去 每 立 方 米 空 气 中 悬 浮 颗 粒 的 平 均 值 是 82微 克 。 在 最 近 一 段 时 间 的 检 测 中 , 每 立 方 米 空 气 中 悬 浮 颗 粒 的 数 值 如 下 (单 位 :微 克 ) : 根 据 最 近 的 测 量 数 据 , 当 显 著 性 水 平 时 , 能 否 认 为 该 城 市 空 气 中 悬 浮 颗 粒 的 平 均 值 显 著 低 于 过 去 的 平 均 值 ? 详 细 答 案 : , =-2.39, , 拒 绝 , 该 城 市 空 气 中 悬 浮 颗 粒 的 平 均 值 显 著 低 于 过 去 的 平 均 值 。 6.3 安 装 在 一 种 联 合 收 割 机 的 金 属 板 的 平 均 重 量 为 25公 斤 。 对 某 企 业 生 产 的 20块 金 属 板 进 行 测 量 , 得 到 的 重 量 数 据 如 下 : 假 设 金 属 板 的 重 量 服 从 正 态 分 布 , 在 显 著 性 水 平 下 , 检 验 该 企 业 生 产 的 金 属 板 是 否 符 合 要 求 ? 详 细 答 案 : , , , 不 拒 绝 , 没 有 证 据 表 明 该 企 业 生 产 的 金 属 板 不 符 合 要 求 。 6.4 在 对 消 费 者 的 一 项 调 查 表 明 , 17%的 人 早 餐 饮 料 是 牛 奶 。 某 城 市 的 牛 奶 生 产 商 认 为 , 该 城 市 的 人 早 餐 饮 用 牛 奶 的 比 例 更 高 。 为 验 证 这 一 说 法 , 生 产 商 随 机 抽 取 550人 的 一 个 随 机 样 本 , 其 中 115人 早 餐 饮 用 牛 奶 。 在 显 著 性 水 平 下 , 检 验 该 生 产 商 的 说 法 是 否 属 实 ? 详 细 答 案 : , , , 拒 绝 , 该 生 产 商 的 说 法 属 实 。 6.5 某 生 产 线 是 按 照 两 种 操 作 平 均 装 配 时 间 之 差 为 5分 钟 而 设 计 的 , 两 种 装 配 操 作 的 独 立 样 本 产 生 如 下 结 果 : 对 =0.02, 检 验 平 均 装 配 时 间 之 差 是 否 等 于 5分 钟 。 详 细 答 案 : , =-5.145 , ,拒 绝 , 两 种 装 配 操 作 的 平 均 装 配 时 间 之 差 不 等 于 5分 钟 。 6.6 某 市 场 研 究 机 构 用 一 组 被 调 查 者 样 本 来 给 某 特 定 商 品 的 潜 在 购 买 力 打 分 。 样 本 中 每 个 人 都 分 别 在 看 过 该 产 品 的 新 的 电 视 广 告 之 前 与 之 后 打 分 。 潜 在 购 买 力 的 分 值 为 0~10分 ,分 值 越 高 表 示 潜 在 购 买 力 越 高 。原 假 设 认 为 “ 看 后 ” 平 均 得 分 小 于 或 等 于 “ 看 前 ” 平 均 得 分 , 拒 绝 该 假 设 就 表 明 广 告 提 高 了 平 均 潜 在 购 买 力 得 分 。 对 =0.05的 显 著 性 水 平 , 用 下 列 数 据 检 验 该 假 设 , 并 对 该 广 告 给 予 评 价 。 详 细 答 案 : 设 , 。 , =1.36, , 不 拒 绝 , 广 告 提 高 了 平 均 潜 在 购 买 力 得 分 。 6.7 某 企 业 为 比 较 两 种 方 法 对 员 工 进 行 培 训 的 效 果 , 采 用 方 法 1对 15名 员 工 进 行 培 训 ,采 用 方 法 2 对 12名 员 工 进 行 培 训 。培 训 后 的 测 试 分 数 如 下 : 两 种 方 法 培 训 得 分 的 总 体 方 差 未 知 且 不 相 等 。 在 显 著 性 水 平 下 , 检 验 两 种 方 法 的 培 训 效 果 是 否 有 显 著 差 异 ? 详 细 答 案 : , , , 拒 绝 , 两 种 方 法 的 培 训 效 果 是 有 显 著 差 异 。 6.8 为 研 究 小 企 业 经 理 们 是 否 认 为 他 们 获 得 了 成 功 ,在 随 机 抽 取 100个 小 企 业 的 女 性 经 理 中 ,认 为 自 己 成 功 的 人 数 为 24人 ;而 在 对 95个 男 性 经 理 的 调 查 中 , 认 为 自 己 成 功 的 人 数 为 39人 。 在 的 显 著 性 水 平 下 , 检 验 男 女 经 理 认 为 自 己 成 功 的 人 数 比 例 是 否 有 显 著 差 异 ? 详 细 答 案 : 设 , 。 , , , 拒 绝 , 男 女 经 理 认 为 自 己 成 功 的 人 数 比 例 有 显 著 差 异 。 6.9 为 比 较 新 旧 两 种 肥 料 对 产 量 的 影 响 , 以 便 决 定 是 否 采 用 新 肥 料 。 研 究 者 选 择 了 面 积 相 等 、 土 壤 等 条 件 相 同 的 40块 田 地 , 分 别 施 用 新 旧 两 种 肥 料 , 得 到 的 产 量 数 据 如 下 : 取 显 著 性 水 平 , 检 验 : (1) 新 肥 料 获 得 的 平 均 产 量 是 否 显 著 地 高 于 旧 肥 料 ? 假 定 条 件 为 : ① 两 种 肥 料 产 量 的 方 差 未 但 相 等 , 即 。 ② 两 种 肥 料 产 量 的 方 差 未 且 不 相 等 , 即 。 (2) 两 种 肥 料 产 量 的 方 差 是 否 有 显 著 差 异 ? 详 细 答 案 : (1) 设 , 。 , , ,拒 绝 ,新 肥 料 获 得 的 平 均 产 量 显 著 地 高 于 旧 肥 料 。 (2) , 拒 绝 , 新 肥 料 获 得 的 平 均 产 量 显 著 地 高 于 旧 肥 料 。 (3) , 。 , , 两 种 肥 料 产 量 的 方 差 有 显 著 差 异 。 6.10 生 产 工 序 中 的 方 差 是 工 序 质 量 的 一 个 重 要 测 度 , 通 常 较 大 的 方 差 就 意 味 着 要 通 过 寻 找 减 小 工 序 方 差 的 途 径 来 改 进 工 序 。某 杂 志 上 刊 载 了 关 于 两 部 机 器 生 产 的 袋 茶 重 量 的 数 据(单 位 :克 )如 下 ,检 验 这 两 部 机 器 生 产 的 袋 茶 重 量 的 方 差 是 否 存 在 显 著 差 异 (a =0.05) 。 详 细 答 案 : , 。 =8.28, ,拒 绝 ,两 部 机 器 生 产 的 袋 茶 重 量 的 方 差 存 在 显 著 差 异 。 第 8章 一元线性回归 第 9章 多元线性回归 9.1 根 据 下 面 的 数 据 用 Excel 进 行 回 归 , 并 对 回 归 结 果 进 行 讨 论 , 计 算 、 时 y 的 预 测 值 。 详 细 答 案 : 由 Excel 输 出 的 回 归 结 果 如 下 : 得 到 的 回 证 方 程 为 : 。 表 示 , 在 不 变 的 条 件 下 , 每 变 化 一 个 单 位 , y 平 均 下 降 0.04971个 单 位 ; 表 示 , 在 不 变 的 条 件 下 , 每 变 化 一 个 单 位 , y 平 均 增 加 1.928169个 单 位 。 判 定 系 数 , 表 示 在 因 变 量 y 的 变 差 中 能 够 被 y 与 和 之 间 的 线 性 关 系 所 解 释 的 比 例 为 21.09%。由 于 这 一 比 例 很 低 ,表 明 回 归 方 程 的 拟 合 程 度 很 差 。 估 计 标 准 误 差 , 预 测 误 差 也 较 大 。 方 差 分 析 表 显 示 , Significance F=0.436485>a=0.05, 表 明 y 与 和 之 间 的 线 性 关 系 不 显 著 。用 于 回 归 系 数 检 验 的 P 值 均 大 于 a=0.05,两 个 回 归 系 数 均 不 显 著 。 当 =200 、 =7时 , y 的 预 测 值 为 : 9.2 根 据 下 面 Excel 输 出 的 回 归 结 果 , 说 明 模 型 中 涉 及 多 少 个 自 变 量 ? 多 少 个 观 察 值 ? 写 出 回 归 方 程 , 并 根 据 F 、 、 及 调 整 的 的 值 对 模 型 进 行 讨 论 。 详 细 答 案 : 模 型 中 涉 及 2个 自 变 量 , 15对 观 察 值 。 估 计 的 回 归 方 程 为 : 。 从 判 定 系 数 和 调 整 的 判 定 系 数 可 以 看 出 ,回 归 方 程 的 拟 合 程 度 一 般 。 估 计 标 准 误 差 , 预 测 误 差 比 较 大 。 从 方 差 分 析 表 可 知 , Significance F=0.002724 不 显 著 , 其 他 两 个 自 变 量 都 是 显 著 的 。 这 可 能 意 味 着 模 型 中 存 在 多 重 共 线 性 。 9.3 根 据 两 个 自 变 量 得 到 的 多 元 回 归 方 程 为 , 并 且 已 知 n=10, SST =6724.125, SSR =6216.375, , 。 (1) 在 a=0.05的 显 著 性 水 平 下 , 、 与 y 线 性 关 系 是 否 显 著 ? (2) 在 a=0.05的 显 著 性 水 平 下 , 是 否 显 著 ? (3) 在 a=0.05的 显 著 性 水 平 下 , 是 否 显 著 ? 详 细 答 案 : (1) 提 出 假 设 : : :至 少 有 一 个 不 等 于 0 计 算 检 验 的 统 计 量 F 当 a=0.05时 , 。 由 于 , 所 以 拒 绝 原 假 设 , 表 明 、 与 y 线 性 关 系 显 著 。 (2) 提 出 假 设 : : : 计 算 检 验 的 统 计 量 t 当 a=0.05 , , 由 于 , 所 以 拒 绝 原 假 设 , 表 明 显 著 。 (3) 提 出 假 设 : : : 计 算 检 验 的 统 计 量 t 当 a=0.05 , , 由 于 , 所 以 拒 绝 原 假 设 , 表 明 显 著 。 9.4 一 家 电 气 销 售 公 司 的 管 理 人 员 认 为 , 每 月 的 销 售 额 是 广 告 费 用 的 函 数 , 并 想 通 过 广 告 费 用 对 月 销 售 额 作 出 估 计 。下 面 是 近 8个 月 的 销 售 额 与 广 告 费 用 数 据 (1) 用 电 视 广 告 费 用 作 自 变 量 , 月 销 售 额 作 因 变 量 , 建 立 估 计 的 回 归 方 程 。 (2) 用 电 视 广 告 费 用 和 报 纸 广 告 费 用 作 自 变 量 , 月 销 售 额 作 因 变 量 , 建 立 估 计 的 回 归 方 程 。 (3) 上 述 (1) 和 (2) 所 建 立 的 估 计 方 程 , 电 视 广 告 费 用 的 系 数 是 否 相 同 ? 对 其 回 归 系 数 分 别 进 行 解 释 。 (4)根 据 问 题(2) 所 建 立 的 估 计 方 程 , 在 销 售 收 入 的 总 变 差 中 ,被 估 计 的 回 归 方 程 所 解 释 的 比 例 是 多 少 ? (5) 根 据 问 题 (2) 所 建 立 的 估 计 方 程 , 检 验 回 归 系 数 是 否 显 著(a=0.05) 。 详 细 答 案 : (1) 由 Excel 输 出 的 回 归 结 果 如 下 : 估 计 的 回 归 方 程 为 :。 (2) 由 Excel 输 出 的 回 归 结 果 如 下 : 估 计 的 回 归 方 程 为 :。 (3) 不 相 同 。 在 月 销 售 收 入 与 电 视 广 告 费 用 的 方 程 中 , 回 归 系 数 表 示 电 视 广 告 费 用 每 增 加 1万 元 , 月 销 售 额 平 均 增 加 1.603865万 元 ; 在 月 销 售 收 入 与 电 视 广 告 费 用 和 报 纸 广 告 费 用 的 方 程 中 , 回 归 系 数 表 示 在 报 纸 广 告 费 用 不 变 的 条 件 下 ,电 视 广 告 费 用 每 增 加 1万 元 , 月 销 售 额 平 均 增 加 2.290184万 元 。 (4) , 。表 明 在 销 售 收 入 的 总 变 差 中 ,被 估 计 的 回 归 方 程 所 解 释 的 比 例 为 88.665% (5 ) 的 P-Value=0.000653 , 的 P-Value=0.009761,均 小 于 a=0.05, 两 个 回 归 系 数 均 显 著 。 9.5 某 农 场 通 过 试 验 取 得 早 稻 收 获 量 与 春 季 降 雨 量 和 春 季 温 度 的 数 据 如 下 (1) 试 确 定 早 稻 收 获 量 对 春 季 降 雨 量 和 春 季 温 度 的 二 元 线 性 回 归 方 程 。 (2) 解 释 回 归 系 数 的 实 际 意 义 。 (3) 根 据 你 的 判 断 , 模 型 中 是 否 存 在 多 重 共 线 性 ? 详 细 答 案 : 早 稻 收 获 量 对 春 季 降 雨 量 和 春 季 温 度 的 二 元 线 性 回 归 方 程 为 : (2)回 归 系 数 表 示 ,降 雨 量 每 增 加 1mm ,小 麦 收 获 量 平 均 增 加 22.3865kg/hm2; 回 归 系 数 表 示 , 温 度 每 增 加 1, 小 麦 收 获 量 平 均 增 加 327.6717kg/mh2。 (3) 从 降 雨 量 和 温 度 与 收 获 量 的 关 系 看 , 两 个 变 量 与 收 获 量 之 间 都 存 在 较 强 的 关 系 ,而 且 温 度 与 降 雨 量 之 间 也 存 在 较 强 的 关 系 ,因 此 ,模 型 中 可 能 存 在 多 重 共 线 性 。 9.6 一 家 房 地 产 评 估 公 司 想 对 某 城 市 的 房 地 产 销 售 价 格(y )与 地 产 的 评 估 价 值()、房 产 的 评 估 价 值()和 使 用 面 积()建 立 一 个 模 型 , 以 便 对 销 售 价 格 作 出 合 理 预 测 。 为 此 , 收 集 了 20栋 住 宅 的 房 地 产 评 估 数 据 用 Excel 进 行 回 归 , 回 答 下 面 的 问 题 : (1) 写 出 估 计 的 多 元 回 归 方 程 。 转载请注明出处范文大全网 » 统计学原理第三版课后习题答案范文二:统计学第三版课后答案
范文三:《统计学》第三版习题答案
范文四:统计学第三版答案(1)
范文五:统计学第三版答案