范文一:统计学基础+(大作业)
一. 综合题 (每小题20分,共60分)
1.某金融机构拟对全国各城市的居民个人家庭理财状况进行调查,调查内容主要包括:家庭月收入状况,其中用于消费与投资的比例;投资理财选取的主要方式;理财资金中用于储蓄、证券、银行理财产品、基金、期货、房地产、贵金属的比例;选择理财方式所考虑的前三个主要因素;个人对理财风险的承受程度以及对理财产品的风险度选择;理财时选择金融机构的种类以及所考虑的主要因素。对自己理财总体水平的评价以及满意度;是否需要专业理财师的帮助,有关个人家庭理财问题对金融机构的建议等。
答:调查问卷:
1. 您的家庭月收入是多少?有多少用于投资?多少用于消费?
2. 在您的理财项目中?用于储蓄、证券、银行理财产品、基金、期货、房地产、贵金属的投资分别是多少?
3. 您在选择理财方式所考虑的前三个主要因素是什么?
4. 您可以承受的理财风险的最大是多少?您目前选择的理财产品的风险度是多少?
5. 您所选择的理财机构的种类是什么?您选择此类理财机构所考虑的主要因素是什么?
6. 评价一下您的理财总体水平;您对这种水平的满意程度是多少?
7. 您是否需要专业理财师的帮助?
8. 请就个人家庭理财问题对金融机构提出建议。
2. 某高校经济管理类专业2011届本科毕业生的毕业去向情况如下:考研及出国深造:30%,国企:25%,政府机关:25%,金融业及投资机构:10%,外企及合资企业:5%,,民企、自主创业及其他:5% 。根据这些数据,画出相应的条形图与饼图。
答:
条形图如下:
饼图如下:
范文二:统计学大作业
宁波大红鹰学院
工商管理分院
《应用统计学》 实验(践)报告
专业: 工商管理专业
班级:
学生姓名:
同组人员:
无
任课老师: 黄涛
2017年6月12日
目录
实验(一) SPSS安装.......................................................................................................................... 2 实验(二) 统计数据的搜集与整理 ....................................................................................................... 6 实验(三)统计数据的图表描述 ............................................................................................................ 9 实验四 统计数据的度量 ......................................................................................................................16 实验五 统计抽样与参数估计.................................................................................................................19 实验六 相关与回归分析 ......................................................................................................................24 实验七 统计数据的动态分析 ...............................................................................................................33 实验八 统计指数分析 .........................................................................................................................35
1
实验(一) SPSS安装
一、实验名称:SPSS安装
二、实验目的:学会安装spss软件及有关操作
三、实验步骤:SPSS的安装和启动
在启动SPSS软件之前,需要先在计算机上进行安装。
其安装方法主要有两种:一是直接使用SPSS安装光盘进行 安装;二是通过网络下载SPSS安装程序进行安装。本小节图 二 使用第二种方法详细介绍SPSS的安装步骤(以IBM SPSS 3.单击“下一步”,切换到用户协议对话框。在该对话框中19.0为例)。 接受用户协议,然后单击“下一步”,如图三所示。 1.打开计算机,找到已经下载到计算机上的SPSS安装程序。
如图一
图 三
4.单击“下一步”,显示客户信息。在该对话框中填写好用图 一
户姓名与单位,然后单击“下一步”,如图四所示。 2.单击该图标,按照顺序下去,直到出现如下界面,单击“下
一步”,则弹出对话框;个人用户选择第一个“单个用户许
可证”,如果图二所示。
图 四
5.单击“下一步”,语言选择。选择“英语”,然后单击“下
一步”,如图五所示。
2
图 五 图 七 6.在弹出的对话框中是选择文件安装位置,如图六所示。在8.此时则弹出正在安装的界面,如图八所示。 该对话框中单击“更改”,可调整软件的安装位置。
图 八
9.在以上安装程序完后,则弹出授权许可证的对话框。把框
中的勾去掉,单击“确定”,如图九所示。
图 九
10.此时则弹出产品授权对话框,选择“启用以用于临时使图 七
用”按钮,单击“下一步”,如图十所示。 7.在选择文件安装对话框中单击“下一步”,在弹出的对话
框中单击“安装”即可,如图七所示。
3
13.再找到已经下载到计算机上的SPSS安装程序的补丁,双
击该程序,单击“下一步”,如图十三所示。
图 十
11.单击“”按钮,选择文件“temp.txt”,再单
图 十三 击“打开”,如图十一所示。
14.确认好安装文件夹路径,单击“下一步”, 便开始安装,
如图十四所示。
图 十四
安装完成后,便可以启动SPSS软件了。启动SPSS软
件的方法主要有以下三种:
(1)单击“开始”菜单中的IBM SPSS 19.0命令,
如图十五所示。 图十一
12.单击“下一步”,弹出临时使用期已启用对话框,单击“完
成”。如图十二所示。
图 十五 图 十二
(2)双击.sav格式的文件,因为SPSS的默认文件格
4
式为.sav。 快捷菜单,可双击桌面上的快速启动图标
四、实验后记(必写) (3)从安装程序直接启动。如果在桌面创建了SPSS
问题:在spss安装过程中一些具体过
出现的错误与解程细节没有注意,导致出现安装失败。
决(概述) 解决方法:具体研究实验指导书要求及
方法并请教老师,重新安装直至成功。
利用好SPSS软件,让其真正帮助平时 希 望 的生活及学习中。
5
实验(二) 统计数据的搜集与整理
一、实验名称:统计数据的搜集与整理 法取得,也可以用(上年年末人口数+本年出生人数-本年死
二、实验内容:上网搜集反映我国历年国民经济发展情亡人数+本年迁入人数-本年迁出人数)求得。 况的主要统计数据(包括:国内生产总值、固定资产投资总人均可支配收入:指居民家庭全部收入中,可用于支付生活额、进出口额、社会商品零售总额、能源消耗量、年末人口费用的收入。人均可支配收入是按家庭全部人口计算的平均总数、人均可支配收入、铁路货运量、居民消费价格指数、每人生活费收入。它包括居民家庭所有成员的工资、奖金、人口出生率、城镇人口数和农村人口数)。 津贴、洗理费、书报费、交通补贴、价格补贴、独生子女费
三、实验步骤 以及离、退休者收入、赡养赠送收入、出售财物收入、利息
收入、稿费、讲课费等全部经常和一次性收入,但应扣除赡1、请说出上述统计指标的含义。
养、赠送支出、记帐补贴、个种税金(个人所得税、车船使国内生产总值:是指一个国家或者地区所有常驻单位在一定
用税等) 时期内生产的所有最终产品和劳务的市场价值。GDP是国民
铁路货运量:货运量是指设计线(或区段)一年内单方向需经济核算的核心指标,也是衡量一个国家或地区总体经济状
要运输的货物吨数。 况重要指标。
居民消费价格指数:CPI(Consumer Price Index),即居民固定资产投资总额:以货币表现的建造和购置固定资产活动
消费价格指数,指在反映一定时期内居民所消费商品及服务的工作量,它是反映固定资产投资规模、速度、比例关系和
项目的价格水平变动趋势和变动程度。居民消费价格水平的使用方向的综合性指标。
变动率在一定程度上反映了通货膨胀(或紧缩)的程度。居进出口额:指实际进出我国国境的货物总金额。进出口总额
民消费价格指数是度量居民生活消费品和服务价格水平随用以观察一个国家在对外贸易方面的总规模。我国规定出口
着时间变动的相对数,综合反映居民购买的生活消费品和服货物按离岸价格统计,进口货物按到岸价格统计。
务价格水平的变动情况。是进行国民经济核算、宏观经济分社会商品零售总额:指各种经济类型的批发零售贸易业、餐
析和预测、实施价格总水平调控的一项重要指标,并且世界饮业、制造业和其他行业对城乡居民和社会集团的消费品零
各国一般用消费价格指数作为测定通货膨胀的主要指标。 售额和农民对非农业居民零售额的总和。
人口出生率:指某地在一个时期内(通常指一年)出生人数能源消耗量:指能源使用单位在报告期内实际消费的一次能
与平均人口之比,它反映了人口的出生水平,一般用千分数源二次能源的数量。
表示。 年末人口总数:是指某年12月31日24时的人口数,或者是下
城镇人口数:是指居住于城市、集镇的人口,主要依据人群年l月1日零时的人口数,即下年的年初人口数。年末人口数
的居住地和所从事的产业进行归类。“城镇人口”的特点所或下年年初人口数通过人口经常登记或抽样调查推算的办
6
从事的产业为非农业生产性产业(自然经济)为主的人群及农村人口数:包括农业人口和一部分非农业人口。中国现行其家庭;一般认为城镇人口占有率的高低反应出一个地区的统计制度规定:农村人口包括:?国营农场户数中的常住人工业化、城镇化或城市化水平。在中国大陆,“城镇人口”口。?乡村户数中的常住人口。其中包括常住农村的外出民自1990年代前后在统计学领域渐渐使用较多的用语,以代替工、工厂临时工、户口在农村的外出学生,但不包括户口在之前非农业人口。 农村的国家职工。
2、请将相关数据整理至一张表格中
2003-2013年数据表:
年末人均城镇农村国内固定资社会商铁路居民人口能源消人口可支人口人口时生产产投资进出口品零售货运消费出生耗量总数配收数数间 总值总额额(亿) 总额量价格率(吨) (万入(万(万(亿) (亿) (亿) (吨) 指数 (‰) 人) (元) 人) 人) 2001374255566.70483.552516.197083.129228472.22424101.12.4523776853 2.0 61 0 3 00 7 2 8 2 1 6 1 2001618470477.95539.159501.230281.129989421.24901103.12.2542875704 0.2 43 0 0 00 8 6 7 9 9 3 5 2001873188773.116921.68352.261369.130751049326929101.12.4562174545 8.9 61 80 6 00 6 .0 6 8 0 2 4 20021943109998140974.79145.286467.131441175928822101.12.0582873166 8.5 .16 00 2 00 8 .5 4 5 9 8 0 20027023137323166924.93571.311442.132121378531423104.12.1606371497 2.3 .94 10 6 00 9 .8 7 8 0 3 6 20031951172828179921.114830320611.132801578033035105.12.1624070398 5.5 .40 47 .1 00 2 .8 4 9 4 3 9 20034908224598150648.133048336126.13345171743333411.96451689399.3 9 1.4 .77 06 .2 00 0 .7 8 5 2 8 20141303251683201722.158008360648.134091910936427103.11.9669767110 0.3 .77 15 .0 00 1 .4 1 3 0 8 3 20148930311485236401.187205387043.134732180939326105.11.9690765651 0.6 .13 99 .8 00 5 .8 3 4 3 9 6 20154036374694244160.214432402138.135402456439043102.12.1711864222 7.4 .74 21 .7 00 4 .7 8 6 0 2 2 20159524446294258168.242842416913.1360739669102.12.07311629626467 3 4.4 .09 89 .8 00 2 7 6 8 1 1
2、相关数据表格
7
3、请指出所搜集到的各组数据有何特征和规律。
答:逐年上涨的趋势,每年的数据都在不断地攀升,经济不断发展。
4、投资、出口、内需是拉动GDP增长的三驾马车,从数据中能否看出谁的贡献最大,为什么,
答:从数据中看出是投资的贡献最大。原因从数据观察看出投资的增长量最大,且增长速度最快,影响力最大。今后我国应大力发展内需,使投资、出口、内需三者达到均衡。
5、GDP与人均可支配收入、铁路货运量存在什么关系,
答:人均可支配收入越高铁路货运量也越大。
6.请计算我国历年的城镇化率。
四、实验后记(必写)
在实验过程当中经常会忘记勾选显示正态图,导致后面要再去修改,非常浪费时出现的错误与解决(概述) 间。
希望能够熟练掌握spss软件,不用看着视频来做,操作起来更方便、更快。 希 望
8
实验(三)统计数据的图表描述 习题2.1结果分析
描述性统计表
从表2.1中可以读出以下信息:有效样本为50个,没有缺失值。学生的平均体重为62.782,标准差为6.7214,最大值是76.2,最小值是48.3等等。
频数分布
表2.2给出了学生体重的频数分布。该表中从左到右分别是有效样本值、频数、频数占总数的百分比、有效数占总数的百分比、累计百分比。
表2.1 描述 表2.2 频性统计表
数分布
(1) 带正态曲线的直方图
图2.1是学生体重的直方图,从图中可以看出学生体重近似服从正态分布,而且集中趋势是集中在63。
9
图2.1 正态曲 线分布图 习题2.2结果分析
如表2.3所示,样本个数为50个,极差为27,最小值是154,最大值是181,均值为169.72,均值的标准误是0.989,标准差是6.993,方差是48.900,偏度系数是-0.446,峰度系数是-0.760。
表2.3 描述
性分析结果
描述性统计分析有一个特色是,它可以将原始数据转换成标准化的取值并以变量的形式存入当前的数据库。如图2.2所示。
图
2.2
10
习题2.3分析结果
(1) 数据记录统计表
从表2.4中可以读出以下信息:粤东气温组有12个样本,粤西气温组也是12个样本,都没有缺失值记录。
表案例处理摘要
2.4 案例
有效 缺失 合计
地区 N 百分比 N 百分比 N 百分比 降雨量 粤东 12 100.0% 0 .0% 12 100.0%
粤西 12 100.0% 0 .0% 12 100.0% (2) 城市分组的各组描述统计量
从表2.5中可以看到各组的描述统计量,包括均值、标准差、最大值、最小值、极差等。
表
2.5
(3) M估计量
M估计量可以用来判别数据中有无明显异常值。Spss输出的M估计量有4种,分别是Huber、Tukey、Hampel、Andrews提出来的,其区别似乎使用的权重不同。从表2.6中可以看到4种不同权重下的最大似然数。容易发现,粤东和粤西的降雨量的4个M估计量离平均数和中位数都很近,这就说明数据中应该没有明显的异常值。 表
2.6
(4) 分组后的百分位数
11
百分位数是一种位置指标,它将一组观察值分为两部分。比如百分位数5代表的值就表示理论上有5%的观察值比该值小,有95%的观察值比该值大。表2.7中可以看出分组后的各个百分位数。
表
2.7 百分位数
百分位数
地区 5 10 25 50 75 90 95
加权平均:定义 1: 降雨量 粤东 1369.100 1381.070 1409.625 1499.450 1859.325 2178.100 .
粤西 1222.600 1235.740 1377.450 1922.800 2304.375 2391.200 .
Tukey 的枢纽 降雨量 粤东 1409.650 1499.450 1770.750
粤西 1382.500 1922.800 2294.250 (5) 最大值最小值(TOP5)
表2.8给出了分组后的5个极大值和极小值。
表
2.8
(6) 正态分布的检验结果
如表2.9所示,两组的显著性都很低,正态分布特征不明显。
表
正态性检验 2.9
a Kolmogorov-Smirnov Shapiro-Wilk
地区 统计量 df Sig. 统计量 df Sig. 降雨量 粤东 .302 12 .003 .775 12 .005
粤西 .224 12 .098 .849 12 .036 a. Lilliefors 显著水平修正
(7) 直方图
12
两个地区降雨量的直方图如图2.3所示,容易发现两组各年降雨量都无明显集中趋势。
图 (8) 茎叶图 2.3
图2.4所示是两组数据的茎叶图。从左往右分别是频数、茎、叶三部分。其中茎代表数值的整数部分,叶代表数值的小数部分。每行的茎叶构成的数字再乘以茎宽,则为实际数据的近似值。
图(9) 正态概率图 2.4 图2.5是粤东和粤西降雨量的正态概率图,其中的斜线表示正态分布的标准线,点表示实际数据的分布,各点越接近于直线,则数据的分布越接近于正态分布。本例中两个地区的分布拟合度都不是很好,说明正态分布并不明显。
图
13 2.5
(10) 去除掉趋势的正态概率图
图2.6是去除掉趋势的正态概率图。去掉趋势的正态概率图反映的是按正态分布计算的理论值和实际值之差(也就是残差)的分布情况。如果数据从正态分布,数据应该均与的分布在中间标准线的上下。本例中,数据点的分布不仅不均匀,还存在着一定的波动趋势,所以正态分布特征不明显。
图
2.6 (11) 箱图
图2.7给出了粤东降雨量和粤西降雨量的箱图。其中箱分为四分位间距的范围。所谓四分位间距救市百分位75代表的值减去百分位数25代表的值。中间的粗线表示平均数,上面和下面的细线分别表示最大值和最数
小值。
图
2.7
习题2.4结果分析
本例的数据信息
如表2.10所示,样本数1799,没有缺失值。
表2.10
案例处理摘要
案例
有效的 缺失 合计
N 百分比 N 百分比 N 百分比 学校 * 升学 1799 100.0% 0 .0% 1799 100.0% (1) 列联表
如表2.11所示,X中学的升学率是97.5%,未升学率是2.5%。
表2.11 14
(2) 卡方检验结果
如表2.12所示,卡方检验的结果是不显著的,说明两个学校的升学率之间差别不明显。
表2.12
图2.8
频数分布图分组下的频数分布如图2.8所示。
15
实验四 统计数据的度量
一、实验名称:统计数据的度量
二、实验目的:
在掌握相对指标和平均指标基本理论和方法的基础上,能运用SPSS对统计数据进行描述性分析。通过训练,了解统计方法的实际应用。从而提高统计方法实际应用的技能水平。
表A 公司2011年的主要业务数据
保险项目 保险金额(亿元) 保费收入(万元) 赔款及付给(万元) 企业财产险 149042.1 1332148.6 649303.2 家庭财产险 8250.1 106035.9 53260.9 机动车辆险 17161.0 1900886.6 1202605.3 船舶险 13646.8 132516.4 79410.9 货物运输险 14373.8 1103719.4 540278.6 卫星及核能险 1249.2 14504.1 8038.9 建筑、安装工程险 1849.7 116656.3 76575.0 其他险 1746.4 29111.6 15234.1 合计 207319.1 4735578.9 2624706.9
表B 公司200名业务员月销售额统计数据 (单位:千元)
25.05 17.48 13.80 25.29 15.42 16.22 21.09 17.93 26.51 22.28 8.81 42.38 23.40 27.93 28.64 15.56 13.22 21.72 17.52 17.75 24.26 17.57 21.66 25.53 23.94 17.07 21.19 17.97 18.69 22.65 9.64 17.57 18.73 12.37 15.48 17.14 17.16 18.02 15.43 15.88 11.05 15.64 26.74 25.83 16.98 21.25 31.31 32.40 17.57 13.85 19.05 15.64 14.52 26.07 18.78 30.31 8.40 18.24 13.61 23.27 25.64 17.61 41.81 14.26 17.79 15.13 15.88 24.87 18.96 15.84 19.27 25.46 32.78 26.70 15.76 18.22 18.29 27.39 43.16 21.92 12.96 25.77 18.28 17.84 30.61 17.25 41.64 13.51 19.25 23.50 31.16 30.70 34.92 26.93 15.82 21.53 13.97 18.33 11.43 15.15 17.25 23.16 15.08 17.66 31.53 17.34 35.34 23.45 19.35 23.76 13.33 27.75 21.42 29.76 15.86 19.46 14.61 36.42 31.34 17.62 17.25 35.71 13.25 31.16 17.16 17.41 31.88 37.51 17.43 24.20 13.61 29.50 35.27 19.45 22.84 23.65 17.96 17.48 19.55 12.74 31.40 37.90 38.94 30.34 15.99 37.43 38.55 18.63 19.91 24.80 13.68 25.40 15.37 22.55 36.16 22.13 22.16 18.64 44.03 9.24 10.8 20.9 29.8 34.2 11.5 20.3 28.1 29.1 10.8 15.4
16
14.3 20.4 24.6 35.3 34.2 30.5 30.4 12.6 17.6 15.4
42.3 18.3 19.5 20.0 22.1 24.3 17.2 19.2 20.4 22.5
20.6 19.7 21.6 22.6 21.6 19.7 18.0 17.6 16.5 15.6
三、实验步骤:
1、对公司2011年主要业务数据(表A)进行结构分析。并作简要文字说明
统计量
建筑、安装工 企业财产险家庭财产险机动车辆险船舶险货物运输险卫星及核能险其他险合计程险
有效333333333N缺失000000000均值710164.633355848.96671040217.6375191.3667552790.67930.73336502715364.03332522534.967中值649303.253260.91202605.379410.9540278.68038.97657515234.12624706.9众数149042.18250.11716113646.814373.81249.21849.71746.4207319.1标准差593896.736148944.24621952303.96959547.03013544780.5726628.1119958267.9678613683.06272265858.233
极小值149042.18250.11716113646.814373.81249.21849.71746.4207319.1极大值1332148.6106035.91900887132516.41103719.414504.1116656.329111.64735578.9和2130493.9167546.93120653225574.11658371.823792.219508146092.17567604.9 保险项目企业财产险家庭财产险机动车辆险船舶险货物运输险卫星及核能险建筑、安装工程险其他险保险金额(万元)71.89%3.98%8.28%6.58%6.93%0.60%0.89%0.84%保费收入(万元)28.13%2.24%40.14%2.80%23.31%0.31%2.46%0.61%
赔款及付给(万元)24.74%2.03%45.82%3.03%20.58%0.31%2.92%0.58%
该公司2011年度保险项目保险金额第一的是企财产险高达149042.1(万元)占总保险金额的71.89%,
第二的为机动车辆险,金额为17161(万元),占总金额的8.28%。两者所占份额相差巨大。
保费收入第一的是机动车辆险价值为1900886.6(万元)占总保险收入的40.14%;保险收入第二是企
业财产险为1332148.6(万元),占总保险收入的28.13%。
保险项目赔款及付给第一的是机动车辆险为1202605.3(万元)占总赔款付给的45.82%;第二的是企
业财产险为649303.29(万元),占总赔款付给的24.74%
综上所述,企业财产险和车辆险的市场份额多于其他。
2、对(表B)数据进行编码、录入,建立SPSS数据文件。
3、利用SPSS,计算有关统计量(均值、中位数、众数、四分位数、极差、四分位差、标准差、偏度和峰
17
度),并生成直方图和箱线图。
统计量
月销售额
峰度有效2000.26N峰度的标准误缺失00.342均值极小值21.8958.4均值的标准误极大值0.5417344.03中值和19.5254379a众数2517.002517.25
标准差7.66122百分位数5019.525方差58.6947525.815a. 存在多个众数。显示最小值
均值:21.8950、中位数:19.5250、众数:17.25、四分位数:25%的数:17.0025、50%的数:19.5250、75%的数:25.8150、极差:35.99、四分位差:8.8125、标准差:7.66122、偏度:0.883、峰度:0.260
四、实验后记(必写)
对于结构分析不理解,只能根据自己字面理解意思来做题 出现的错误与解决(概述)
多多练习提高自己
希 望
18
实验五 统计抽样与参数估计
一、实验名称:统计抽样与参数估计
二、实验内容:
通过实训,掌握利用SPSS统计软件进行区间估计的基本步骤。
第一题:背景资料:有几位大学生组成的调查组,为了解他们所在地区居民的收入情况,作为匡算某种商品需求量的依据之一,从该地区230万居民中随机抽取了500人进行调查,取得有关收入数据如表所示。 样本数据 单位:万元
第二题:背景资料:近期有多家超市接到顾客投诉,反映国内某品牌直饮净水器的使用寿命太短。国家规定该规格直饮净水器的平均使用寿命不低于1200升。为了检验该产品的质量,超市随机抽取100件该
19
品牌直饮净水器进行使用寿命的测试,测得结果如表所示。
样本数据 单位:升
三、实验步骤:
第一题:
(1)利用SPSS统计软件,在95%概率保证下,估计该地区全部居民人均收入的置信区间。 案例处理摘要
案例
有效 缺失 合计
N 百分比 N 百分比 N 百分比 居民收入 500 100.0% 0 .0% 500 100.0%
描述
统计量 标准误
居民收入 均值 2.8115 0.04428
均值的 下限 2.7245
95% 置信 上限 2.8985 区间
方差 0.98
标准差 0.99011
偏度 0.374 0.109
峰度 0.651 0.218
如上图所示在95%概率保证下,该地区全部居民人均收入的置信区间为2.7245—2.8985。
20
(2)如果估计的误差不超过0.12万元,在同样的置信度下应该抽取多少人进行调查。
单个样本统计量
N 均值 标准差 均值的标准误
居民收入 500 2.8115 .99011 .04428
单个样本检验
检验值 = 0.12
差分的 95% 置信区间
t df Sig.(双侧) 均值差值 下限 上限 居民收入 60.785 499 .000 2.69150 2.6045 2.7785 在同样的置信度下应该抽取61人进行调查。
第二题:
利用SPSS统计软件,对该直饮净水器的平均使用寿命(出水量)进行区间估计,要求推断的把握程度为95%。
案例处理摘要
案例
有效 缺失 合计
N 百分比 N 百分比 N 百分比 直饮净水器使命寿命 100 100.0% 0 .0% 100 100.0%
描述
统计量 标准误
直饮净水均值 1197.2 6.611
器使命寿均值的 下限 1184.08
命 95% 置信上限 1210.32 区间
标准差 66.111
21
案例处理摘要
案例
有效 缺失 合计
N 百分比 N 百分比 N 百分比
极小值 803
该直饮净水器的平均使用寿命(出水量)区间为:1184.08—1210.32 (2)结合直方图或正态分布图及箱线图对顾客提出的意见加以分析说明。
根据直方图分析得:该品牌直饮净水器平均使用寿命低于国家规定该规格直饮净水器的平均使用寿命1200升。
根据箱线图分析得:虽然众数大于1200,但是还存在下限大大低于1200、平均数低于1200很多的产品,所以此品牌直饮净水器的不合格率高,是问题的产品。
提意见:
超市:严格把关净水器品质,禁止质量低下的商品进入超市。对不合格商品,要求厂商退货或者相应的赔偿。
厂商:对出厂商品严格把关,进行抽样检测保证合格率。
消费者:要有维权意识,发现有问题商品及时曝光及时维权。
市场监管部门:加强市场监管,提高市场准入原则。
22
四、实验后记(必写)
在操作中还是不会分析,对于数据不是很理解 出现的错误与解决(概述)
尽快学会数据分析
希 望
23
实验六 相关与回归分析 一、实验名称:相关与回归分析
二、实验内容:
第一题:
一家汽车销售商的经理认为,汽车的销量与投入的广告费用有着密切的关系。为研究他们之间的
关系,这位经理搜集了过去10年的数据
表5-18 2001,2010年汽车销量与广告费用资料
年份 序号 汽车销售量(辆) 广告费用(万元) 2001 1 1100 385 2002 2 1250 420 2003 3 1280 406 2004 4 1360 490 2005 5 1480 525 2006 6 1500 602 2007 7 1720 651 2008 8 1800 735 2009 9 1890 721 2010 10 2100 840
你认为汽车销量与广告费相关吗,有关
根据散点图判断,你认为汽车销量与广告费是数目关系,Y=392.217+2.001X 若2011年和2012年广告费用投入1000万元和1250万元,汽车销量可能为多少辆,
24
Y,292.217,2.001*1000,2293.217X,1000
Y,292.217,2.001*1250,2793.467X,1250 第二题:
通过实训使学生在理解相关分析与回归分析基本理论的基础上,能熟练运用SPSS统计软件进行相关
与回归分析。
前景资料:投资、消费、出口是拉动经济增长的三驾马车,以下是1991,2011年我国固定资产
投资额和国内生产总值统计资料:
表5-18 1991,2011年我国固定资产投资额和国内生产总值统计资料 年份 序号 固定资产投资额(亿元) 国内生产总值(亿元) 1991 1 5278.00 21781.50 1992 2 7582.00 26923.50 1993 3 11829.00 35333.90 1994 4 15926.00 48197.90 1995 5 19445.00 60793.70 1996 6 23660.00 71176.60 1997 7 25300.00 78973.00 1998 8 28406.00 84402.30 1999 9 29855.00 89677.10 2000 10 32918.00 99214.60 2001 11 37213.00 109655.20 2002 12 43500.00 120332.70 2003 13 55567.00 135822.80 2004 14 70477.00 159878.30 2005 15 88774.00 184937.40 2006 16 109998.00 216314.40 2007 17 137324.00 265810.30 2008 18 172828.00 314045.40 2009 19 224599.00 340902.80 2010 20 278122.00 401202.00 2011 21 311022.00 471564.00 资料来源:《中国统计年鉴2011》、2011年全国年度统计公报。
三、实验步骤:
第二题:
25
1、 用SPSS软件,通过绘制相关图和计算相关系数,对我国固定资产投资额与国内生产总值
进行相关分析
答:我国笃定资产投资与国内生产总值具有高度相关性。
相关系数值为0.989
相关性
固定资产投资国内生产总值 额:亿元: :亿元:
**固定资产投资额:亿元: Pearson 相关性 1 .989
显著性:双侧: .000
N 21 21
**国内生产总值:亿元: Pearson 相关性 .989 1
显著性:双侧: .000
N 21 21 **. 在 .01 水平:双侧:上显著相关。
2、利用SPSS软件建立我国固定资产投资额与国内生产总值的回归方程,并说明我国固定资产投资额与国内生产总值两者的数量变动比率。
a系数
非标准化系数 标准系数 模型 B 标准 误差 试用版 t Sig.
1 (常量) 43558.224 5879.148 7.409 .000
固定资产投资额:亿元: 1.400 .048 .989 28.914 .000 a. 因变量: 国内生产总值:亿元:
答:回归方程:Y=43558.224+1.4X
回归方程表明固定资产投资每增加一个单位,国内生产总值增加43559.624个单位。 3、根据SPSS输出结果,对所建立的回归方程进行评价和检验。
模型汇总
模型 R R 方 调整 R 方 标准 估计的误差
a1 .989 .978 .977 13973.73027 a. 预测变量: (常量), 国内生产总值(亿元)。
答:判定系数R方=0.978,接近于1,表明回归方程对于数据的拟合程度好。
bAnova
模型 平方和 df 均方 F Sig.
a1 回归 1.632E11 1 1.632E11 836.004 .000
残差 3.710E9 19 1.953E8
总计 1.670E11 20
26
bAnova
模型 平方和 df 均方 F Sig.
a1 回归 1.632E11 1 1.632E11 836.004 .000
残差 3.710E9 19 1.953E8
总计 1.670E11 20
a. 预测变量: (常量), 国内生产总值:亿元:。
b. 因变量: 固定资产投资额:亿元:
答:根据F检验,因为Sig值小于0.05,所以回归方程的线性关系是存在的。
a系数
非标准化系数 标准系数
模型 B 标准 误差 试用版 t Sig.
1 (常量) -28581.991 4901.193 -5.832 .000
国内生产总值:亿元: .698 .024 .989 28.914 .000 a. 因变量: 固定资产投资额:亿元:
根据t检验,两个Sig都小于0.5,表明我国固定资产投资额对国内生产总值线性效果明显。 4、用SPSS软件选择合适的趋势方程,计算2012年和2013年我国固定资产投资额的趋势值。
系数
未标准化系数 标准化系数 t Sig.
B 标准误 Beta
个案顺序 13031.666 2009.754 .885 6.484 .000 个案序列 ** 2 -1814.453 209.699 -2.791 -8.653 .000 个案序列 ** 3 92.606 6.275 2.926 14.758 .000
:常数: -10218.610 5226.641 -1.955 .067 Y=-10218.61+92.606X^3-1814.453X^2+13031.666X 2012年我国固定资产投资额趋势值为384352.30159
2013年我国固定资产投资额趋势值为456402.21592
5、根据计算得到的趋势值,用SPSS软件预测2012年和2013年我国内生产总值的置信区间,要求置信水平为95%。
2012置信区间:[369160.39299,399544.21019]
2013置信区间:[437821.64984,474982.78199]
描述性统计分析综合实验
实验内容和要求:请根据数据资料(employee data.sav),就该企业的人员薪资情况展开综合性描述分析。要求结合图、表和文字进行分析,不少于1000字。
27
1.频数分析
图 1当前薪资水平
从图1可以看出当前薪资水平集中于$25,000到$50,000的区间内。
图 2开始薪资水平
从图2可以看出开始薪资多数都少于$20,000。
综上所述当前薪资水平与开始薪资水平差距较大。
2.描述性分析
表 1薪资描述性统计表
描述统计量
N极小值极大值均值标准差方差偏度峰度
统计量统计量统计量统计量统计量统计量统计量标准误统计量标准误当前薪资水474$15,750$135,000$34,419.57$17,075.66291578214.52.1250.1125.3780.224平开始薪资水474$9,000$79,980$17,016.09$7,870.6461946944.962.8530.11212.390.224平有效的 N:列表状474态: 由表1可得开始薪资和当前薪资的统计量都为474。
开始薪资均值为$17,016.09当前薪资均值为$34,419.57,当前薪资均值大于开始薪资。
28
开始薪资的极大值为$79,980极小值为$9,000当前薪资的极小值$15,750极大值$135,000,所以开始薪资
的极大极小值均小于当前薪资。
当前薪资的标准差为$17,075.66开始薪资的标准差是$7,870.64,说明当前薪资的大部分数值和其平均值
之间差异大于开始薪资。
3.当前薪资与性别关系:
图 3当前薪资与性别关系图
从图1可以看到当前薪资水平跟性别有关系:男员工的当前薪资均值高于女性员工。 4.当前薪资与雇员类型关系
图 4当前薪资与雇员类型关系图
表 2各类型雇员当前薪资表
当前薪资水平
N均值标准差
文员363278397568
管理员27309392115
经理846397818245结合图4和表2可以看出文员的平均工资为27839,管理员的平均工资为30939,经理的平均工资为
29
63978,是非管理层员工平均工资的2倍以上。不同雇员的薪资平均水平总体上是经理>管理员>文员。 5.当前薪资与受教育程度关系
图 5当前薪资与受教育程度关系图
表 3当前薪资水平图
当前薪资水平
管理员均
教育程度 文员均值 经理均值 总计均值
值
8 22316.25 30807.69 24399.06
12 25276.19 31580.77 59400.00 25887.16
14 31625.00 31625.00
15 31175.77 24300.00 47662.50 31685.00
16 36281.04 56416.71 48225.93
17 32100.00 69812.50 59527.27
18 55412.50 67903.57 65127.78
19 36000.00 73925.00 72520.37
20 64312.50 64312.50
21 65000.00 65000.00
总计 27838.54 30938.89 63977.80 34419.57 结合图5和表3可以得出相同雇员的薪资平均水平总体随着教育年限的增加而增加,虽然有个别特殊,
但不影响总体趋势。受教育程度越高获得高职位的可能性越大,相应获得的工资越久越高。 6.当前薪资与就业时间
30
图 6当前薪资与就业时间关系图
表 4当前薪资与就业时间相关性分析表 相关性
Pearson显著性相关性
就业时间
与当前薪0.0840.067
资水平
既往就业从表4和图6可知就业时间与员工当前工资的显著性概率p,0.05,即二者相互独立,不具有相关关系;
时间与当0.034-0.097既往就业时间与当前薪资的显著性概率p,0.05,说明员工之前的工作经历对员工的当前工资没有影响。 前薪资水
平7.当前薪资与民族
图 7当前薪资与民族关系图
从图7可以看出在这个样本范围内少数民族的员工人数少于汉族员工。少数民族员工与非少数民族员
工的工资具有差异。
表 5当前薪资与民族相关系数表
相关性
Pearson 相关性显著性
民族与当前薪资水平-0.1770 民族与当前工资的Eta值分别为-0.177,显著性概率p均小于0.01,少数民族与非少数民族员工工资具
有差异,但值仅为0.177,说明二者相关性极其微弱。
31
结论:
表 6员工当前薪资水平影响因素相关性分析图
相关性
Pearson 相显著性关性
性别与当前0-0.45薪资水平
教育程度与
当前薪资水0.6610
平
雇员类别与
当前薪资水0.780
平
开始薪资与
当前薪资水0.880
平
(1)开始工资与当前工资具有很强的正相关关系,相关系数为0.880,即开始工资越高,其薪资水平就业时间与
当前薪资水0.0840.067越高,反之,则越低。 平
既往就业时(2)性别与当前工资的相关比率为-0.450,说明不同性别的员工平均工资具有显著差异,性别影响企
间与当前薪-0.0970.034
业员工收入。 资水平
民族与当前0(3)雇员类别与当前薪资的Eta值为0.780,雇员类别影响企业员工的当前薪资收入且相关性显著。-0.177薪资水平
其显著差异体现在管理层和非管理层的工资收入差距上。
(4)教育程度与当前薪资的Eta为0.661,即教育程度影响企业员工的当前薪资收入。且教育程度与
当前薪资水平的相关关系较强。表明受教育年限越高,其薪资水平越高;反之,则越低。 (5)就业时间和既往就业时间对企业员工的当前工资没有影响。
(6)少数民族员工与非少数民族员工的工资具有差异,但民族与当前工资的相关强度很微弱。 四、实验后记(必写)
通过实验可以加强我统计数据的认知和运用,更好的学习统计学的知识 出现的错误与解决
(概述)
以后在实验前应该先将所涉内容梳理一遍,带着问题和知识点去做实验希 望 可以让实验过程不在那么枯燥无谓。
32
实验七 统计数据的动态分析
一、实验名称:统计数据的动态分析
二、实验内容:
通过实训,掌握各种动态分析指标的计算方法,进一步理解每一个动态分析指标的含义及相互关系。
通过实训,掌握利用SPSS统计软件趋势分析。
背景资料:以(表6-1)2001,2010年我国分主要经济数据作为资料。
1、分别计算国内生产总值、城镇居民家庭人均可支配收入、农村居民家庭人均可支配收入、全国人均消费水平、年底总人口数等数据的平均发展水平、逐 期增减量、累计增减量、发展速度、增长速度、平均发展速度和平均增长速度;
2、利用计算所得到的平均增减量、平均发展速度或平均增长速度预测2013年和2014年我国国内生产总值、城镇居民家庭人均可支配收入、农村居民家庭人均可支配收入、全国人均消费水平和年底总人口数。
三、实验步骤:
1、利用SPSS统计软件分别对国内生产总值、城镇居民家庭人均可支配收入、农村居民家庭人均可支配收入、全国人均消费水平、年底总人口数等动态数列进行趋势分析,生成趋势图描述其趋势;
国内生产总值、城镇居民家庭人均可支配收入、农村居民家庭人均可支配收入、全国人均消费水平、年底总人口数均呈逐渐上升趋势。
3、选择一条合适的趋势线分别对数据进行拟合;
33
均采用二次趋势线对数据进行拟合 4、利用趋势方程分别计算2013年和2014年的国内生产总值、城镇居民家庭人均可支配收入、农村居
民家庭人均可支配收入、全国人均消费水平、年底总人口数的预测值。
国内生产总值2013年和2014年预测值为753349.63818,834712.12545 人均可支配收入2013年和2014年预测值为55027.33345,60783.79011 居民消费价格指数2013年和2014年预测值为101.98545,101.45510 年底总人口数2013年和2014年预测值为137240.50909,137827.67972 四、实验后记(必写)
数据源有部分缺失 出现的错误与解(概述)
今后的学习生活中,我也会温故知新,继续对统计学的学习。 希 望
34
实验八 统计指数分析
一、实验名称:统计指数分析
二、实验目的:
1、能根据已知资料编制综合指数和平均指数
2、利用SPSS统计软件编制指数并进行因素分析
三、实验步骤:用spss软件进行指数的计算与分析
某商店三种商品销售资料如下:
商品名计量单销售量 价格
称 位 第一年 第二年 第一年 第二年
甲 公斤 300 360 42 45
乙 件 200 200 30 36
丙 套 1400 1600 20 28
试根据上述资料,采用拉氏综合指数法计算三种商品的销售量总指数,采用帕氏综合指数法计算价格总指数。
具体步骤:
(1)根据上述资料中所给原始数据创建新的data文件“出口商品.sav”,其变量情况如图所示:
(2)单击“转换”,选择“计算变量”,进入“计算变量”对话框;根据已知的q0、q1、p0和p1,分别求p0q0、p1q1和p0q1,现以求p0q0为例,在“目标变量”栏输入p0q0,在“数字表达式”框中通过按钮输入p0和q0,中间用“*”号相连,如图所示:
35
(3)点击“确定”按钮,即可得输出结果,根据此法依次求得p1q1和p0q1的值,如图所示:
(4)根据拉氏综合指数法和帕氏综合指数法即可求得相关指数如下:
(1)甲、乙、丙商品的销售总指数计算:
pq68200,11,,,146.35%Ipqpq46600,00
(2)甲、乙、丙商品的销售数量综合指数计算:
pq53120,01,,,113.99%Iqpq46600,00
(3)甲、乙、丙商品销售价格综合指数计算
pq68200,11,,,128.39%Ippq53120,01
因素分析:根据总指数可知,该商店销售额增加了46.35%,绝对增加了21600,其中,由于销售量的变动,使得销售额增加了13.99%,绝对增加了6520;由于销售价格的变动,使得销售增加了28.39%,绝对增加了1508。
四、实验后记(必写)
对于公式的输入不是很熟练,全靠百度
出现的错误与解决(概述) 对于指数计算并不能快速反应
加强练习,能够熟练运用spss 希 望
36
结束语
几次的实验课,我每次都有不一样的体会,在做实验的时候难免会有很多问题。不奇怪的是试验好多人也都是不明白,操作不好,不因为内容比较多又是一些没接触过的东西。我个人感觉是蛮有有挑战性也很有意思,关于统计学这个东西必须认真听认真看,稍微走神就会什么都不知道,很显然刚开始我是遇到了麻烦。还好在老师的再次讲解下我终于大致明白了。
综合评定: 得分:
37
范文三:统计学大作业
统计学大作业
一、对 2001年受访者接受教育的程度(ER33616)进行如下描述统计分析。
(1)作直方图,设定组宽为 1。剔除掉无效观测值,然后计算其均值、最小值、最大值、 标准差。
(2) 对 2007年受访者接受教育的程度(ER33917)进行如下描述统计分析。
作直方图,设定组宽为 1。剔除掉无效观测值,然后计算其均值、最小值、最大值、标 准差。
(3) 比较 2001年、 2007年的受访者接受教育的程度(ER33616、 ER33917)的波动是否有明 显差异(方差比检验) 。
结论:拒绝 原假设
(4)计算 2001年、 2007年的受访者接受教育的均值的差异及其 95%置信区间; 并检验这种差 异是否有显著性。
结论:拒绝 原假设 , 即差异具有显著性 .
(5)计算 2007年受访者中学生所占的比重(ER33615==1) ,并计算其 95%的置信区间。
即 2007年受访者中学生所占的比重为 0.06050136
即 95%的置信区间为 (0.05766836, 0.06333436)
(6)检验 2007年受访者的出生月份(ER33905)是否服从均匀分布。
因为 (
)574. 4112
5. 02=>χχ, 所以 拒绝 原假设。 (7) 2007年的工作职位(ER33913)分为 0~9不同的等级,婚姻状况(ER33907)分为 0~4不同的情况。制作两个变量的列联表;并进行相关性检验(给出每个类别的期望频数)。
结论:拒绝 原假设 ,既认为工作职位与婚姻状况不存在相关性
2. Gdp.csv是 1992年 1季度至 2009年 4季度某地区 GDP 的季度数据。完成如下分析。 (1) 计算 GDP 的对数,并做出 GDP 和对数 GDP 的趋势图。
(2) 计算 GDP 的同比增长率和环比增长率,并作图。 x1为同比增长率; x2为环比增长率
(3) 对 GDP 环比增长率进行方差分析, 检验各季度的环比增长率是否存在显著差异。 并进 行最小显著性检验。
注:Season 这个变量是手动输入的 。
(4) 对各个季度的 GDP 的同比增长率作箱线图。 如果出现异常值, 在图形中将其明确标出 来(即异常值位于哪一年的哪一季度)。
范文四:统计学大作业
一 . 小组成员分配表
二 . 调查背景,意义及其可行
选题背景及研究意义:
步入大学的我们,学习的压力不再那么大,竞争意识不断增强,生存的压力 和工作的前途越来越逼近我们。但是,对于丰富的周末时间,我校的学生怎么 安排,做什么事情,我小组组织了一次调查。
通过这次调查我们可以更好的了解同学们的周末课余时间安排,对于我们如 何合理的安排自己的课余时间有借鉴指导意义,并学会安排自己的课余时间做 一些积极有益的事。
研究的可行性分析:
1、研究团队了解大学生周末时间安排及其状况,设计调查问卷、在大学里实施 比较方便,从而能够获取可靠数据。
2、研究团队学习了应用统计学,掌握了获取数据的有效方法,能够撰写大学生 周末时间安排调查报告。
3、能够利用 Excel 统计软件处理数据,达到预期目的。
三 . 具体实施计划
第一部分 调查方案设计
1. 调查方案
a) 调查目的:通过调查了解大学生的周末时间安排的主要状况,使同学们树 立科学合理的时间观,合理安排周末时间,使同学们能够度过充实的有意义 的周末生活。
b) 调查对象:济南大学在校生
c) 调查单位:抽取的样本学生
d) 调查程序:
① 设计调查问卷,明确调查方向和内容。
② 分发调查问卷。随机抽取山东科技大学在校大。
③ 大一大二大三各 30人左右作为调查单位。
2. 根据回收有效问卷进行数据分析,具体内容如下:
(一)大学生时间安排按各年级分析
( 二)课余时间安排结构分析
1.看书复习 2.兼职 3.娱乐 4.社团活动 5. 其他
3主要思路 :
1) 根据样本的时间分配安排,分布状况的均值、置信区间等分布的数字特 征,推断大学生总体分布的相应参数。
2) 根据时间结构安排的各项时间花费安排进行均值之差的比较以及方差比 的区间估计 .
3) 根据大一、大二、大三进行三个总体娱乐及学习和其他时间安排均值之 差及方差比的区间估计 .
4) 根据对时间安排主要分配结构的分析算出频数频率
5) 作出结论
4调查时间 :2015年 5月
第二部分 调查问卷设计
大学生周末时间安排状况问卷调查
您好,我是会计学专业的学生,为了解大学生的周末课余时间安排状况,帮助大学 生树立科学合理的时间观,我们为此进行了一次社会调查。我们的调查需要您的配 合,此问卷采用匿名填写方式,调查对象采用简单随机抽样的方法随机挑选。若无特 殊说明,均为单选。您的参与对我们的调查十分重要,谢谢。
1. 您的性别() A、男 B、女
2. 您所在的年级() A、大一 B、大二 C、大三
3. 您每周周末时间都做什么()(此项多选)
A .看书学习 B. 兼职 C. 娱乐 D. 社团活动 E. 其他
4. 看书学习的时间() A 、 3小时以下 B 、 3~6小时 C 、 6~9小时 D 、 9~12 小时 E 、 12小时以上
5. 兼职() A 、 3小时以下 B 、 3~6小时 C 、 6~9小时 D 、 9~12 小时 E 、 12小 时以上
6. 娱乐() A 、 3小时以下 B 、 3~6小时 C 、 6~9小时 D 、 9~12 小时 E 、 12小 时以上
7. 社团活动() A 、 3小时以下 B 、 3~6小时 C 、 6~9小时 D 、 9~12 小时 E 、 12小时以上
8. 其他() A 、 3小时以下 B 、 3~6小时 C 、 6~9小时 D 、 9~12 小时 E 、 12小 时以上
9. 您的时间安排会不会受其他同学影响() A. 会 B.不会
10.您对周天时间有没有规划() A 、经常计划 B、偶尔 C、从不
11. 您自认为您周天时间分配合理吗()
A 、非常合理 B、较为合理 C、基本合理
D 、较为不合理 E、 非常不合理
非常感谢您的合作!
●第三部分问卷发放
本次调查我们采取分层抽样,对在校本科生各个年级发放问卷;我们在大 一、大二、大三共发放问卷 90份,回收问卷 90份,现将各年级男女生回收有 效问卷具体情况介绍如下:
●第四部分数据整理见附件
●第五部分数据分析
(一)调查样本的总体分析
1. 总体时间分配消费表
2各项目总体时间分布直方图
3. 总体时间消费区间分析
4. 总体时间花费折线图
(二)学习复习时间的时间花费分析 1. 学习复习时间表
2. 学习复习分布折现图
3. 学习复习分析表
1. 总体时间表
2. 娱乐时间分配折线图
3. 娱乐时间分析
1. 总体时间安排表
2. 分布折线图
3. 数据分析表
1. 时间的花费总表
2. 折线图
3. 数据分析表
(六 ) 各项目人数比例分析 1. 各项目人数安排情况
2. 饼状图
3. 结论 :由图可知在所有项目组中娱乐选择人数比例最多,图为大样本分析。
第六部分 统计推断
(一)区间估计(显著性水平 95%)
1. 总体
2. 学习
3,娱乐
4. 兼职
5. 其他
(二)方差分析
1. 提出假设
H0:μ1=μ2=μ3=μ4=μ5
H1 :μ1≠ μ2≠ μ3≠ μ4≠ μ5
2.
37 43 48 35 10
合计 173 均值 6.92 容量 5 5 5 5 5 25
SSA 0.392 394.272 26.912 199.712 1.352 622.64 SSE 38.44 116.64 21.16 0.36 5.76 182.36 3. 分析如下
平方和 自由度 均方 F 值
误差来
源 SS DF MS
组间 622.64 4 155.66 143.4025
组内 182.36 168 1.085476
总和 805 172
结论 :Fα(4,168) =3.72
F 远大于 F α, 则拒绝原假设 H0, 即 H0:μ1=μ2=μ3=μ4=μ5不成立 , 表明 μi 之间的 差异是显著地 , 也就是说所检验的因素 (安排的活动 ) 对观测值 (时间的安排 ) 是有 显著影响的。
第七部分总结性分析
第一,对于总体时间分配的分析结果
◆ 由以上分析得知,大学生的课余时间安排比较丰富整体为近似正态分布。各 类指标如图表所示。
◆ 各个项目比较,娱乐所占比重较大,为 79%,学习占 36%,其余依次是其 他、兼职和社团活动。
◆ 对于总体时间花费我们认为在 95%的水平上时间花费的均值在 5.7~6.7之 间,方差为 9.2~14.7
第二,对于学习时间的分析结果
◆ 描述统计的结果显示,随着学习时间的逐渐提高,学习的人数逐渐减少,由 折线图显示呈一种逐渐下降的趋势。各类指标如图表所示。
◆ 在 95%的显著性水平上其总体均值在 3.4~5.4之间,方差为 6.8~17.6 第三,对于娱乐时间花费的分析结果
◆描述统计的结果显示,娱乐时间一开始随时间的逐渐上升而上升,达到一定时 间点后,娱乐时间随时间的逐渐上升而下降。由折线图显示呈一种先上升后下 降的趋势。各类指标如图表所示。
◆各个时间段比较, 6-9小时所占人数比重较大,说明大部分大学生的娱乐时间 为 6-9小时
◆ ◆在 95%的显著性水平上其总体均值在 6.4~7.2之间,方差为 6.9~13.2
第四.对于兼职时间的分析结果
◆描述统计的结果显示,兼职时间一开始随时间的上升人数逐渐变多,达到一定 时间后人数开始下降,下降到一定程度后人数开始变平稳,再后来人数又开始 逐渐减少。各类指标如图表所示。
◆各个时间段比较发现 3-6小时人数比重较大,说明这个时间段兼职人数较多。 ◆在 95%的显著性水平上其总体均值在 4.96~7之间,方差为 3.66~12.54 第五,对于其他项的时间的分析结果
◆描述统计的结果显示,其他时间的变化趋势呈一种先下降再上升再下降的趋 势。各类指标如图表所示
◆在 95%的显著性水平上其总体均值在 5.47~8.15之间,方差为 9.6~26.3 四 . 结论
◆全体学生对于时间安排多数人会有选性的进行个项目的时间安排,但对于 个项目的的比例及各项指标分析得出大学生娱乐学习及活动的情况希望同 学们能够正确看待自己的周末时间安排问题,让自己度过更有意义的周末 时间。
◆衷心希望我们所研究的课题对大家时间生活方面有所帮助,并希望大家对 我们的不足之处做出批评及指正,谢谢!
21
范文五:统计学作业答案
《统计学》作业答案
客观题部分:
一、选择题(每题1分,共15题)
参考答案:
1. ABCD 2.ABC 3. B 4. ABCD 5. ABD
6. CD 7.ABCD 8. AD 9. ABCD 10. B
11. ABCD 12. ABCD 13. AB 14. ABCD 15. AD 主观题部分:
一、简答题(每题2.5分,共2题)
1、什么是统计指标,统计指标有哪些要素?
答案要点:描述总体特征的名称,称为统计指标。构造一个统计指标需要注意六个方面的问题,一般称为统计指标的六要素。
(1)指标名称。
(2)计量单位。
(3)计算方法。
(4)时间限制。
(5)空间限制。
(6)指标数值。
2、什么是概率抽样,概率抽样有哪些主要形式?
答案要点:概率抽样指总体中的单位以确定的概率进入样本。包括以下几种类型:
(1)简单随机抽样。
(2)分层抽样。
(3)等距抽样。
(4)整群抽样。
(5)多阶段抽样。
二、论述题(每题5分,共2题)
1、平均指标有哪些类型?
答案要点:平均指标指同类社会经济现象在一定时间、地点条件下所达到的一般水平。
ix(1)算术平均数也称均值,用公式表示如下:=n
M(2)调和平均数,公式为:H=M∑x
(3)几何平均数,公式为:Gii i=∏xi
(4)众数,是一组数据中出现次数最多的变量值。
(5)中位数,计算公式为N+1 2
(6)分位数,是指将一列数据K等分的各种数。
(7)截尾均值,是指在一个数列中,去掉两端的极端值后所计算的算术平均数。
2、什么是探索性数据分析,试阐述探索性数据分析的四大主题。
答案要点:探索性数据分析是从复杂的数据中分离出数据的基本模式和特点,让分析者发现其中的规律,以便选择分析方法。对于在探索性数据分析中发现的数据规律,分析者需要使用特定的统计模型进行证实分析,以确定规律是否正确。探索性数据分析有四大主题,分别是:
(1)耐抗性。
(2)残差。
(3)重新表达。
(4)图示。
再详细阐释即可。
转载请注明出处范文大全网 » 统计学基础+(大作业)