范文一:统计中级职称考试
统计中级职称考试
引用
资兴会计 的 会计初中级职称考试报名13问答
(资兴会计根据网络、文件、实际工作经验整理)
【问】我的“会计从业资格证书”目前尚未办妥申领手续,能否报名参加考试?【答】不能。根据全国考办规定,报考人员在办理报名手续时,必须具备会计从业资格,持有会计从业资格证书。但对于已在省级财政部门会计人员管理系统可以查到会计从业资格证号码但还没领取到手的可视同已发证处理。【问】对报名参加考试人员的学历有何规定?【答】(1)报名参加会计专业技术初级资格考试的人员,必须具备高中或中专毕业以上学历。(2)报名参加会计专业技术中级资格考试的人员,必须具备大专(含)以上学历。且须具备一定会计工作年限,如:大专学历,会计工作满五年;本科学历,会计工作满四年等等。【问】报名年度是指何年度?【答】报名年度一般为考试年度的前一年,计算年限的截止日为该年度的12月31日。2100年考试的报名年度为2009年。【问】对通过全国统一考试,取得经济、统计、审计等专业技术中级资格的人员,如何报名参加中级考试?【答】应持有会计从业资格证书,对从事会计工作年限不作要求。【问】香港、澳门居民要报名参加考试,应具备什么条件?【答】港澳居民报名参加会计专业技术资格考试,应根据相应级别报名条件规定,具有中华人民共和国教育行政主管部门认可的高中以上学历或学士以上学位证书、会计从业资格证书、从事会计工作年限证明、居民身份证明等证明材料。【问】关于“会计工作年限”如何理解?【答】(1)根据2000年7月1日起施行的《中华人民共和国会计法》第38条规定,“从事会计工作的人员,必须取得会计从业资格证书。”因此,自新修订的《中华人民共和国会计法》施行后,无证上岗属违法行为,不能作为合法的会计工作年限。(2)根据财政部2000年11月21日《关于会计专业技术资格考试报名条件中学历与会计工作年限问题的通知》(财会〔2000〕16号)规定,有关会计工作年限的要求,是指报考人员取得规定学历前后从事会计工作时间的总和。因此,有效会计工作年限可累计计算。
【问】请问今年网上报名的方式、时间?【答】今年会计专业技术资格考试采取网上报名,在网上报名时须牢记报名注册号、密码,网上报名开通时间由各省在全国统一规定的关闭时间一律在2009年10月31日,但县市一般在28-29日前完成,其它两天时间为到地州审核时
?SPAN lang=EN-US10月31日后全国网上报名系统自动关闭。【问】如何区分首次、非首次考生?【答】非首次报考考生是指2009年度已经报考过“全国会计专业技术资格考试”中级并有通过科目的考生,此类考生的有关信息可在报名数据库中搜索查找。其余考生均视为首次考生。
【问】对违纪违规的考生,将如何处理?【答】根据财政部、人事部《关于修订印发〈会计专业技术资格考试暂行规定〉及其实施办法的通知》(财会〔2000〕11号)和人事部《专业技术人员资格考试违纪违规行为处理规定》(人事部3号令)规定,对伪造学历、会计从业资格证书或资历证明的考生,将由会计考试管理机构吊销其会计专业技术资格,由发证机关收回其会计专业技术资格证书,两年内不得再参加会计专业技术资格考试。【问】对考试合格人员的颁证,有何规定?【答】对考试合格人员,将依据报名条件的相关条款,继续实行验证领取
合格证书的规定。对不符合报名条件的考生,将不予颁发合格证书。【问】网上报名须注意哪些事项?【答】(1)考试报名前本人须仔细阅读相关文件要求,慎重报考,缴费确认后,不再办理退考; (2)考试报名实行告知承诺制,报考人员应对通过网上输入信息的真实有效性负责; (3)考生不得以他人身份进行报名,否则由此引起的纠纷,由考生承担全部责任; (4)考生不能同时使用新、旧两个身份证,报名与考场使用的身份证必须一致; (5)登录网页提交报名信息并得到“报名已确认”信息时,方为报名成功,逾期则视为放弃报名; (6)考生报名信息可在报名期间内上网自行修改,一旦缴费确认后,不允许再改动报名信息。【问】考生报名照片如何获取?如何上传照片?
【答】上传照片的要求和用途统提供的拍照程序自行拍摄报名照片后上传。实在没有条件的考生可咨询当地会计管理部门或到当地会计管理部门拍照。
【问】到报名点现场审核确认需要带什么资料?
【答】包括:
?《全国会计资格考试网上报名考生信息表》(需要单位盖章)
?第二代居民身份证(原件及复印件一份)
?学历或学位证书(原件及复印件一份)
?会计从业资格证书(原件及复印件一份)
?一寸近期彩照二张(将用于办理合格证)
?单位盖章的“全国会计专业技术资格考试登记表”(本表考生可从湖南省财政厅政务网中的http://www.hnczt.gov.cn/Info.aspx?ModelId=1Id=6355直接下载)。
【问】实行全国网上报名后是不是所有考生可以异地报名,
【答】为加强会计人员管理,考生在网上报名后仍然在考生原会计从业资格证发证部门加以确认和核准。
统计中级职称考试
发展方向:企业事业单位,会计、审计
根据现行会计职称管理规定,通过中级会计职称考试后可以评定会计师职称。会计师指具有一定会计专业水平,经考核取得证书、可以接受当事人委托,承办有关审计、会计、咨询、税务等方面业务的会计人员。在西方国家,会计师同律师、医师、工程师一样,都是自由职业者。在中国,会计师,又是会计干部的技术职称之一。
中级证书样本 (中级)会计专业技术资格实行全国统一组织、统一考试时间、统一考试大纲、统一考试命题、统一合格标准的考试制度。会计专业技术资格考试,原则上每年举行一次。 在国家机关、社会团体、企业、事业单位和其他组织中从事会计工作,并符合报名条件的人员,均可报考。 会计专业技术中级资格考试合格者,颁发人事部统一印制,人事部、财政部用印的《会计专业技术资格证书》,该证书在全国范围内有效。用人单位可根据工作需要和德才兼备的原则,从获得会计专业技术资格的会计人员中择优聘任。
考试级别
会计专业技术中级资格考试级别代码是1。
考试科目
会计专业技术中级资格考试设《财务管理》、《经济法》、《中级会计实务》三个科目。
《财务管理》、《经济法》为2.5小时,《中级会计实务》为3小时。
报名条件
(一)报名参加会计专业技术资格考试的人员,应具备下列基本条件: 1、坚持原则,具备良好的职业道德品质; 2、认真执行《中华人民共和国会计法》和国家统一的会计制度,以及有关财经法律、法规、规章制度,无严重违反财经纪律的行为; 3、履行岗位职责,热爱本职工作; 4、具备会计从业资格,持有会计从业资格证书。 (二)报名参加会计专业技术中级资格考试的人员,除具备以上基本条件外,还必须具备下列条件之一: 1、取得大学专科学历,从事会计工作满五年。 2、取得大学本科学历,从事会计工作满四年。 3、取得双学士学位或研究生班毕业,从事会计工作满二年。 4、取得硕士学位,从事会计工作满一年。 5、取得博士学位。 (三)对通过全国统一的考试,取得经济、统计、审计专业技术中、初级资格的人员,并具备以上基本条件,均可报名参加相应级别的会计专业技术资格考试。 (四)报名条件中所规定的从事会计工作年限是指取得规定学历前、后从事会计工作的合计年限,其截止日期为考试报名年度当年年底前。
报名流程
报名时间 报名时间一般安排在考试年度上一年的10月份开始。 2012年全国报名时间:2011年10月17日至11月7日。补报名时间:2011年12月5日至15日。 参考信息:2012年全国会计职称考试报名汇总
考试时间
考试时间一般安排在考试年度的5月份。(以当年公布的报名时间、考试时间为准)
2012年考试时间:2012年5月12、13日。
考试日期 初级资格 中级资格 5月12日 9:00—11:30 经济法基础 9:00—11:30 财务管理 14:00—17:00 初级会计实务 14:00—17:00 中级会计实务 5月13日 —— —— 9:00—11:30 经济法
考场设置
考场原则上设在省辖市以上中心城市或行政专员公署所在地的大、中专院校或高考定点学校。考生比较集中,考场安排困难,确需在县设置初级资格考场的,须经省级会计专业技术资格考试管理机构批准,并报全国会计考试办公室备案。考试大纲
全国会计专业技术资格考试领导小组办公室(以下简称全国会计考办)将修订印发全国会计专业技术资格考试大纲,用于本年度的考试。 根据《关于印发2012年度全国会计专业技术资格考试考务日程安排》的通知,全国会计专业技术资格考试领导小组办公室(以下简称全国会计考办)将修订印发全国会计专业技术资格考试大纲,用于2012年度考试。
考试纪律 要严格执行考试考务工作的有关规章和纪律,切实做好试卷的命题、印刷、发送和保管过程中的保密工作,必须严格遵守保密制度,严防泄密。要严肃考场纪律。考试工作人员要坚决执行回避制度。对于违反考试纪律和有关规定者,要严肃处理,并追究领导责任。 财政部将对考试考务工作制定一系列规章、制度,保证会计专业技术资格考试工
作健康有序的进行。 成绩及证书管理
参加会计专业技术中级资格考试的人员,在连续的两个考试年度内,全部科目考试均
合格者,可获得会计专业技术中级资格证书。
范文二:[教材]统计中级职称考试统计方法复习要点
2(观测数据和实验数据第一章统计和数据
观测数据是对客观现象进行实地观测所取得的数据,在数据取 复习要点
得的过程中一般没有人为的控制和条件约束。在社会经济问题研究 一、基本含义
中,观测是取得数据最主要的方法。 1(统计就是用来处理数据的,它是关于数据的一门学问。
实验数据一般是在科学实验环境下取得的数据。在实验中,实 验环境是受到严格控制的,数据的产生一定是某一约束条件下的结 2(统计学是用以收集数据,分析数据和由数据得出结论的一
果。自然科学研究中所用的数据多为实验数据。组概念、原则和方法。统计分析数据的方法大体上可分为描述统计
和推断统计两大类。
三、数据的来源 描述统计星研究数据搜集、处理和描述的统计学方法。其内容
从使用者的角廑看。统计数据资料的来源主要有两种渠道:一包括如何取得研究所需要的数据。如何用图表形式对数据进行处理
种是通过直接的调查或实验获得的原始数据,这是统计数据的直接和展示,如何通过对数据的综合、概括与分析,得出所关心的数据
来源,一般称之为原始或第一手统计数据;特征。
推断统计则是研究如何利用样本数据来推断总体特征的统计
另一种是别人调查的数据,并将这些数据进行加工和汇总后公学方法,内容包括参数估计和假设检验两大类。
布的数据,通常称之为次级数据或第二手间接的统计数据(一切间 接的统计数据都是从原始的、第一手数据过渡而来的。 3(统计的应用。
几乎所有的领域都应用统计,但是在应用中应注意分辨被误用
1(原始数据。搜集数据最基本的形式就是进行统计调查或进与滥用的现象。
行实验活动,统计调查或进行实验就是统计数据的直接来源。 二、数据类型
统计数据是对客观现象特征的反映,而由于客观现象的复杂
统计调查是指根据统计研究预定的目的、要求和任务,运用科性,在反映这些现象特征时可从不同的角度进行采集,从而得到不
学的方法,有计划、有组织地向容观实际搜集资料的过程。通过统同类型的数据。
计调查得到的数据,一般称为观测数据。 1(定性变量(数据)与定量变量(数据)
实验法是通过实验法得到的数据就是实验数据。运用实验法要 注意的是,首先,实验组和对照组的产生应当是随机的,研究对象 (1)定性变量的观察结果称为定性数据。这类数据的最大特
的不同单位应当被随机地分配到实验组或对照组,而不应是经过有点是它只能反映现象的属性特点,而不能说明具体量的大小和差
意识的挑选的。其次,实验组和对照组还应当是匹配的,也就是研异,只有分类特征,没有量的特征;这种只能反映现象分类特征的
究对象的背景资料应当是大体相同的,至少不要差异太大。变量又称为分类变量,分类变量的观察结果就是分类数据。如果类
别具有一定的顺序,这样的变量称为顺序变量,相应的观察结果就
不论是统计调查还是实验,所搜集的数据都是原始数据,这是是顺序数据。
统计数据最基本的来源。2(次级数据。次级数据(第二手数据) 分类变量没有数值特征,所以不能对其数据进行数学运算。由
是指由其他人搜集和整理得到的统计数据,这种自他人调查整理基此可见,定性数据只能用来区分事物,而不能用来表明事物之间的
础上的数据我们把它称为数据的间接来源。大小、优劣关系。
顺序变量比分类变量向前进了一步,它不仅能用来区分客观现
数据的间接来源常用的有以下一些:?公开出版的统计数据,象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。
主要来自官方的统计部门和政府、组织、学校、科研机构。?尚未显然,顺序数据的功能比分类数据要强一些,对事物的划分也更精
公开发表的统计数据,如各企业的经营报表数据、专业调查咨询机细了一些。
构未公开发布的调查结果数据。 (2)具有明确的数值含义,不仅能分类而且能测量出来具体
需要注意的是,如果公开引用未公开发表的数据需要征得数据大小和差异的变量就是定量变量,也称为数值变量,定量变量的观
所有者的同意,同时要为自己发布的数据负责。察结果成为定量数据。
作为统计研究的主要资料,数值型数据的特征在于它们都是以
在应用时要注意:?是否了解并正确理解了间接数据中变量的数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差
含义、计算口径、计算方法,以防止误用、错用他人的数据。?引(绝对距离),而有些数值型数据不仅可以计算数据之间的绝对差,
用间接数据时要注明数据来源,尊重他人的劳动成果和知识产权。还可以计算数据之间的相对差(相对距离)。显然,数值型数据的
计量功能要远大于前面介绍的两种定性数据,其计量精度也远远高
四、统计调查 于定性数据。因此,在统计研究中,数值型数据有着最广泛的用途。
统计调查是根据调查的目的与要求,运用科学的调查方法,有 按照报送周期,统计报表主要有月报、季报、年报组成,月报计划、有组织地搜集统计数据资料的过程。内容简单,时效性强,年报则内容比较全面。
1(普查是专门组织的一次性的全面调查,用来调查属于一定 统计报表的内容包括表式和填表说明。时点上或一定时期内的社会现象总量。它适于搜集某些不能或不适
宜于定期的全面统计报表搜集的统计资料,以摸清重大的国情、国 4(重点调查:是在调查对象中选择一部分重点单位进行的一力。普查的特点为:它是一种全面调查,具有资料包括范围全面、种非全面调查。这些重点单位虽然数目不多,但它们具有所研究现详尽、系统的优点;它是一次性的专门调查,因为普查的工作量大,象的总量在总体总量中占据绝大部分的特点。耗资也多,时间周期较长,一般不宜经常举行。
5(典型调查:是一种非全面的专门调查,它是根据调查的目
目前,我国通过普查进行的统计调查内容和时间周期已经规范的与要求,在对被调查对象进行全面分析的基础上,有意识地选择化、制度化,具体包括: 若干具有典型意义的或有代表性的单位进行的调查。
(1)人口普查。每10年进行一次,逢"0"的年份进行;
第二章数据描述
(2)农业普查,每l0年进行一次,逢"7"的年份进行; 复习要点
本章重点介绍如何简单地利用统计图表和少数数据来概括某
(3)经济普查,2004年进行了中国第一次经济普查。些事物的基本特征。
一、定性数据的图表展示
2(抽样调查 定性效据包括分类数据和顺序数据,通常可以用频数分布表和
抽样调查是一种非全面调查,它是按照随机原则从总体中抽取图形来描述。 一部分单位作为样本进行观察研究,以抽样样本的指标去推算总体 1(生成频数分布表 指标的一种调查。随机原则要求所有调查单位都有一定的概率被抽 定性数据本身就是对事物的一种分类,因此,只要先把所有的取。 类别都列出来,然后统计出每一类别的频数,就得到一张频数分布
抽样调查具有的特点:第一,样本单位按随机原则抽取,排除表。频数分布表中落在某一特定类别的数据个数称为频数。通过频了主观因素对选取样本单位的影响。第二,能够根据部分调查的实数分布可以观察不同类型数据的分布情况。际资料对调查对象的总体的数量特征进行推断,从而达到对调查总
体的认识。第三,在抽样调查中会存在抽样误差,但是这个误差可 注意运用Excel生成频数分布表的过程。以事先计算并加以控制。
抽样调查既能节省人力、物力、财力,又可以提高资料的时效 2(定性数据的图形表示 性,而且能取得比较正确的全面统计资料,具有许多优点。抽样调 (1)饼图:又称圆饼图、圆形图等,它是利用圆形及圆内扇查是一种非全面的、一次性的或经常性的专门调查,这种调查方法形面积来表示数值大小的图形。饼图主要用于总体中各组成部分所在市场经济条件下,使用非常广泛。 占比重的研究。
抽样两种主要方法:概率抽样和非概率抽样。 (2)条形图:条形图是用宽度相同的条形的高度或长度来表
述数据多少的图形,用于观察不同类别数据的多少或分布情况(绘
概率抽样是根据一个已知的概率随机选取被调查者。常用的概制时,各类别可以放在纵抽,也可以故在横轴。率抽样形式有:简单随机抽样、分层抽样、整群抽样和系统抽样。
(3)环形图:环形图可以用来比较不同变量之间的结构差异。
非概率抽样是没有完全按照随机原则选取样本单位。
二、定量数据用图表展示(
3(统计报表 1(生成频数分布表
统计报表是按照国家统一规定的调查要求与文件(指标、表格 生成定量数据的频数分布表时,首先,要对数据进行分组。以形式、计算方法等)自下而上地提供统计资料的一种调查方式。能够适当观察数据的分布特征为准。一般的分组个数在5-15之间。
按照报送范围,统计报表分为全面报表和非全面报表。全面报 其次,要确定组距。所谓组距是指每个组变量值中的最大值与表要求调查对象种的每一个单位均要填报,非全面报表则只要求一最小值之差。若将最大值称为上限,最小值称为下限,则组距等于部分调查单位填报; 上限与下限之差,即"组距,上限一下限"。确定组距,一是要考虑
各组的划分是否能区分总体肉部各个组成部分的性质差别,二是要
能准确地清晰地反映总体单位的分布特征。 中位数,是数据按照大小排列之后位于中间的那个数(如果样
本重为奇数),或者中间两个数目的平均(如果样本重为偶数)。
在确定组距时,在研究的现象变动比较均匀的情况下,可以采
用等距分组;而当研究的现象变动很不均匀时,一般采用不等距分 众数,就是数据中出现次教或出现频率最多的数值,在定性数组。 据中,由于记录的是频数,因此众数用得多些。
最后,统计出各组的频数及频数分布表。在统计各组频数时,
恰好等于某一组的组限时,则采取上限不在内的原则,即将该频数 2(定量数据的数字特征 计算在与下限相同的组内。 常用的反映定量数据特征的统计量有:
2。定量数据的图形表示
(1)直方图:用横坐标代袁变量分组,纵坐标代表各变量值 反映数据集中趁势的水平度量:平均数、中位数、众数和分位出现的频数,这样,各组与相应的频数就形成了一个矩形,即直方数等;
同。 反映数据离散程度的差异度量:极差、四分位差、标准差和方
(2)折线图:折线图是利用线段的升降来说明显向变动的一差。
种统计图,它主要朋于表示现象在现象的分配情况、现象在时间上 (1)水平的度量 的变化和两个现象之间的依存关系等。 平均数也称为均值,是把某一组数据进行算术平均,用以表述
(3)散点图:散点图也可以反映两个变量的关系。某一事物的平均水平,它在统计中叫做均值。注意简单平均数和加
权平均数的应用。中位数和众数的应用比较简单,结合前边概念学
应特别注意各种图表的生成方式和运用。习即可。
(2)差异的度量
三、用统计表来表示数据 极差又称全距,是一组数据中最夫的标志值和最小的标志值之
统计表是一种用密集的形式归纳数据的方法。它主要是利用行差。它的特点是简单直观,但是容易受数据中极端值的影响,因此,和列中的数据来表述现象特征。人们利用统计表主要出于两种目不能准确地描述数据的分散程度。 的:一是在文章中使用它以支持自己的观点;二是利用它组织数据。 方差是将各个变量值和其均值离差平方的品军数,它反映了样
本中各个观测值到其均值的平均离散程度。标准差是方差的平方
统计表一般由五个部分组成,即表头、行标题;列标题、数字根,它更具量纲性,而且与变量值的计量单位相同,使用的范同更资料和表外附加构成。广泛。
表头应该放在表的上方,它说明的是表的主要内容; 离散系数也称为便变异系数、标准差系数,足将一组数据的标
准差除以其均值,用来测度离散程度的相对数。
行标题和列标题一般放在表的第一行和第一列,它表示的是所
研究的问题类别的名称和指标名称; 标准分数也称作标准化值或Z分数,是变量值与其平均数的离
表的其余部分是具体的数字资料: 差除以标准差后的值,用以测定某一数据在该组数据中的相对位
表外附加通常放在统计表的下方,用来说明资料来源、指标注置。
释和必要的说明等内容。 第三章 参数估计
通常情况下,统计表的左右两边不能封口。复习要点
一、抽样分布
1(总体分布与总体参数 四、用数字来概括数据
针对一组数据的分布特征,可以从两个方面来考查它:一是该总体分布是总体中所有观察值所形成的分布。 组数据的集中趁势,即该组数据的数值向其中心值的靠拢程度。二总体参数是对总体特征的某个概括性的度量。通常有总体平均数是该组数据的离散程度,它反映的是该组数据的各个数值远离其中(μ)、总体方差(σ2)、总体比例(π)等。 心值的趋势和程度。这两个方面反映了数据分布特征的不同侧面,2(统计量与抽样分布
从不同视角来分析统计数据,以达到分析和运用统计数据的目的。统计量是根据样本数据计算的用于推断总体的某些量,是对样本特
征的某个概括性度量。统计量是样本的函数(如样本均值、样本方
差(s2)、样本比例(p)等。 1(定性数据的数字特征
对定性数据的集中趋势常用的方法就是计算比例、百分比、中构成统计量的函数中不能包括未知因素。 位数和众数。 抽样分布是样本统计量所形成的概率分布,如样本均值的分布、样
本比例的分布等。 抽样分布是一种理论分布。 抽样分布构成了推
断总体参数的理论基础。
根据统计量来推断总体参数具有某种不确定性。 不同的样本可以以68(73%的置信水平推断总体参数肛的置信区间为计算出不同的统计量值。
(1)样本均值的抽样分布当总体服从正态分布时,样本均值一定
以95(45%的置信水平推断总体参数肛的置信区间为服从正态分布,即有X,N(μ,σ2)
以99(73%的置信水平推断总体参数肛的置信区间为若总体为未知的非正态分布时,只要样本容量n足够大(通常要求
n?30),样本均值仍会接近正态分布。
如果总体不是正态分布,当n为小样本时(通常n<30),样本均 值的分布则不服从正态分布。="">30),样本均>
2(评价估计量的标准无偏性,是指估计量抽样分布的期望值等于(2)样本比例的抽样分布
被估计的总体参数。无偏估计量的定义。设总体参数为0,所选择比例是指具有某种属性的单位占全部单位数的比重。
总体比例(通常用π表示)是总体中具有某种属性的单位数占全部的估计量为如果E()=θ则称为θ的无偏估计量。 总体单位数的比例,是一个参数,通常是未知的。
χ,P,s2分别是总体均值、总体比例、总体方差的无偏估计量。 样本比例(通常用P表示)是随机抽取的样本中具有某种属性的单
有效性,是指估计量的方差尽可能小。 位数占样本全部单位数的比例,是一个样本统计量,是随机变量,
有效估计量的定义。对同一个总体参数的两个无偏估计量,有更小是可以观察到的。
方差的估计量更有效。有效估计量。一致性,是指随着样本量的增样本比例的抽样分布,是描述所有可能样本比例的概率分布。
大,点估计量的值越来越接近被估计总体的参数。一致估计量。样当样本容量比较大时,样本比例P近似服从正态分布,在重置抽样
本均值是总体均值的一个一致估计量。
3(一个总体均值的区间估计,在对总体均值进行区间估计时,需时,P的分布为在不重置抽样要考虑总体是否为正态分布、总体方差是否已知,用于估计的样本
是大样本还是小样本等情况。
(1)大样本的估计 时,P的分布为P,N 大样本(n?30)情况下,当总体方差σ2已知时,总体均值μ在1—α一般讲,当np?5,n(1一P) ?5时,就可以认为样本容量足够大。置信水平下的置信区间为随着样本容量的增大,样本比例的方差愈来愈小。
3(统计量的标准误差
大样本情况下,统计量的标准误差也称为标准误,是指样本统计量分布的标准差。
当总体方差σ2未知时,总体均值μ在1一α置信水平下的置信区可用于衡量样本统计量的离散程度。
在参数估计中,它是用于衡量样本统计量与总体参数之间差距的一
个重要尺度。 间为
(2)小样本的估计小样本(n<30)情况下,当正态总体的方差σ2样本均值的标准误计算公式为>30)情况下,当正态总体的方差σ2样本均值的标准误计算公式为><>
情况下,当总体方差σ2未知时,总体均值μ在1一n置信水平下
二、参数估计
的置信区间为总体均参数估计就是用样本统计量去倍计总体的参数。
值的置信区间是由样本均值和估计误差两部分组成的。4(一个总用样本统计量来估计总体参数有两种方法:点估计和区间估计
体比例的区间估计大样本条件下,当总体比例π已知时,在1一α1(点估计与区间估计
的置信水平下,总体比例的置信区间为点估计,是用样本统计量的实现值来近似相应的总体参数。
区间估计,是根据估计可靠程度的要求,利用随机抽取的样本的统
计量值确定能够覆盖总体参数的可能区间的一种估计方法。
首先,要提出一个原假设和备择假设。原假设(或零假设)H0,备
择假设(或备选假设)H1
第二,确定检验统计量。计算z统计量或计算t统计量 在大样本条件下(当总体比例π未知时,在1一α的置信水平下,第三,确定显著性水平α(第一类错误和第二类错误
总体比例的置信区间为第四,根据数据计算检验统计量值和与这个统计量值对应的概率
值,并进行决策。
4(检验决策准则:
双侧检验:,统计量的值,>临界值,拒绝原假设 总体比例的置信区间是由样本比例和估计误差两部分组成的。 左侧检验:统计量的值<临界值,拒绝原假设>临界值,拒绝原假设>
三、样本量的确定 右侧检验:统计量的值>临界值,拒绝原假设
在进行参数估计时,样本量要适当。 5(假设检验总结:假设检验依据的是小概率原理。 样本量过大会增加调查费用,花费更多的人力;样本量过小,样本小概率标准在抽样前依需要确定。假设检验的结果只能是拒绝或不没有足够的代表性,统计量的标准误差会增大,对总体参数的估计拒绝原来假设,而不能证明原假设成立。统计假设检验的结果不是
会不准确。 绝对正确。
1(估计总体均值时样本量的确定 二、总体均值的假设检验
在重置抽样条件下,设E代表允许的估计误差,则样本量计算公式在对总体均值进行假设检验时,采用什么检验统计量取决于所抽取
的样本是否是大样本还是小样本,还需要考虑总体是否为正态分
布、总体方差是否已知等。
1(大样本(n>30)的检验当总体方差已知时,总体均值检验的统为:
如果总体标准差盯未知,可以用样本标准差s来代替;也可以用试计量为 验调查的办法,选择一个初始样本,以该样本的标准差s作为总体
标准差盯的估计值。
当总体方差未知时,总体均值检验的统计量为 样本量与置信水平成正比,与总体方差成正比,与允许的估计误差
的平方成反比。 2(小样本(n<>
2(估计总体比例时样本量的确定
在重置抽样条件下。设E代表允许的估计误差,则样本量计算公式
计量为
为: 当总体方差未知时,总体均值检验的统计量为 样本量越大,估计误差就越小,估计的精度就越高。估计洪差由使 三、总体比例的假设检验
用者预先确定。 生活中经常需要对总体的某些比例进行检验,以证明某种观点能否
大多数情况下,估计误差的取值一般应小于0(1。 被否定。
如果总体比例π的值不知道,可以用样本比例s来代替,或者取π一个总体比例的检验,基本形式有以下三种:
,0(5,使得π(1一π)达到最大。第四章 假设检验 双侧检验:H0:π,π0,H1?π。
复习要点 左侧检验:H0:π?π0,Hl#:π<π0>π0>
一、假设检验 右侧检验:H0:π?π0,Hl:π>π0在大样本时,样本比例会近似服假设检验是先对总体参数或分布形式提出某种假设,然后利用样本从正态分布。检验统计量用Z统计量,其基本形式为信息和相关统计量的分布特征去检验这个假定,做出是否拒绝原来
假设的结论。
参数估计是依据样本信息推断未知的总体参数。
第五章 相关分析和回归分析 1、为什么要进行假设检验:找出样奉均值与总奉均值之间存在误
复习要点 差的原因。 2(如何进行假设检验:小概率事件,是指在一次事件中几乎不可 一、相关关系
能发生的事件。一般称之为“显著性水平”,用α表示。显著性水平变量之间存在着密切的联系但又不是严格的、确定的关系称为相关一般取值为α,0(05或α,5%。 关系。相关分析的主要内容包括以下几个方面: 3(假设检验的过程; (一)确定现象之间有无关系,这是相关分析的起点;
(二)确定相关关系的表现形式; X与Y一定有因果关系。
(三)测定相关关系的密切程度。 检验:相关系数的检验可以用t分布检验进行。检验的具体步骤如
二、相关表和散点图 下: 对于两个变量戈和Y,通过观察或实验,我们可以得到若干组数据,首先确定原假设 记为(xi,Yi)(i,1,2,…,n),将这些数据按x值由大到小编:两变量之间不存在线性关系(H0:ρ,0)瑟。:两变量之间存
(或由小到大)以序列表表示,即构成相关表。 在线性关系(H。:ρ?0)
将一一对应的(xi,Yi)描点于坐标系上,即构成散点图,又称为相关图。通过散点图所反映出的坐标点的分布状况可以直观地判断其次,计算统计量t值 变量之间是否存在相关关系,以及相关的形态、方向。
最后,利用其对应的概率值进行判断,如果概率值小于或等于指定 三、相关的形态(线性相关和非线性相关)
的显著性水平(一般α,0(05),则我们可以拒绝原假设,接受若变量Y与变量x的相关关系表现为线性组合,或绘制的散点图近
备择假设,即两变量之间存在线性相关关系。否则不能拒绝原假设,似地表现为一条直线或直线带,则称之为线性相关。
可以认为两变量之间不存在显著的相关关系。 若变量Y与变量x是非线性组合,或绘制的散点图近似地表现为一
六、一元线性回归分析 条曲线,则称之为非线性相关或曲线相关。
1(相关分析和回归分析的区别: 四、相关的方向(正相关和负相关)
相关分析旨在测度变量之间关系的密切程度,它所实用的测定工具当两个变量的变动方向总体上相同,即一个变量增加,另一个变量
就是相关系数。而回归分析则是考察若干自变量X与因变量Y之也相应地增加,或一个变量减少,另一个变量也相应地减少时,两
间的数量变化规律的统计方法和技术。 个变量之间的关系属于正相关。
2(回归分析的主要内容: 若两个变量变动的方向总体上相反,即一个变量增加的同时,另一
(1)从样本数据出发,确定变量之间的数学关系式; 个变量随之减少时,两个变量之间的关系属于负相关。
(2)估计回归模型参数; 五、Pearson相关系数
(3)对所确定的关系式进行各种统计检验,并从影响某一特定变相关系数是测定变量之间关系密切程度的量,它能够以数字准确地
量的诸多变量中找出影响显著的变量。 描述变量之间的相关程度。要反映不同类型变量数据的相关程度,
3(一元线性回归模型 有不同的相关系数。重点介绍Pear—son相关系数。
理论回归模型:Y,βo,β1x,ε 1(定义:Pearson相关系数是用来度量两个定量变量x和Y之间的
估计的回归方程:y,b0,b1x 线性相关程度,如人均可支配收入与消费支出的相关程度、身高与
4(参数的最小二乘估计 体重之间的相关程度等等。
用普通最小二乘法得到参数估计值的具体计算公式为:2(公
式:
5(回归系数的含义:Y,b0,b1x中的b0是直线的结局,表示当
解释变量为零时Y的平均值。回归系数b1是直线的斜率,表示解
释变量x每增加一个单位,被解释变量将相应地平均变化b1个单3(性质:(1)r的取值范围在一1,1,即一1?r?1。r>0表明x
位。 与Y之间存在正线性相关关系;r<>
6(回归系数的检验和评价 关关系;r值越接近l(或一l)就越正(或负)相关,越接近0,
(1)经济意义检验 利用相关的经济学原理及我们所积累的丰富就越不相关。r,1或r,一1表明2与Y之间为完全相关关系(实
的经验,对所估计的回归方程的回归系数进行分析与判断,看其能际上就是函数关系)。
否得到合理的解释。 (2)r具有对称性。x与Y之间的相关系数rxy和y与x之间的相
(2)同归方程的统计检验 关系数ryx相等,即rxy,ryx。
包括回归方程的显著性检验(F检验)和对同归系数的检验(t检(3)r数值大小与x和Y的数据原点及计量尺度无关。改变x和Y
验)。一冗线性回归分析时,由于只有一个解释变量,因此t检验的数据原点或计量尺度,并不改变r数值大小。
与F检验的结果是一致的。 (4)r仅仅是X与Y之间线性关系的一个度量,它不能用于描述
(3)回归方程的评价(拟合程度分析) 非线性关系。这意味着,r,0只表示两个变量之间不存在线性关系,
判定系数R2的公式为:并不表明变量之间没有任何关系,比如他们之间可能存在非线性关系。
(5)r虽然是两个变量之间线性关系的一个度量,却不一定意味着
判定系数R2的取值范围是[0,1],R2越接近于l,表明回归平方
和占总变差平方和的比重越大,回归直线于个观测点越接近,回归(1)发展水平是时间数列中对应某个时期(或时点)的指标数值,直线的拟合程度就越好。反之,R2越接近于0,回归直线的拟合程说明现象在各个时期(或时点)上所达到的规模和水平,一般用符度越差。 号Yt(t,1,2,…,n)来表示,其中t表示所对应的时间。
(2)增长量是指时间数列中两个不同时期的发展水平之差,反映
估计标准误差是社会经济现象报告期比基期增加或减少的数量,即:增长量,报告残差平方和的均方根,用Se来表示,其计算公式为: 估计标准误期水平一基期水平。增长量又根据基期水平的不同分为逐期增长量差是度量各观测点在直线周围分散程度的一个统计量,反映了实际和累计增长量。
观测值Yi与回归估计值yi之间的差异程度。若各观测点全部落在(3)平均增长量是某种社会经济现象在一定时期内平均每期增长直线上,则Se,0,此时用自变量来预测因变量是没有误差的。 (或减少)的绝对数量。一般用累计增长量除以增长的时期数目计
七、多元线性回归分析 算。
1(回归模型与回归方程 2(增长率分析:发展速度、增长速度、平均发展速度和平均增长多元线性回归模型:Y,βo,β1x1,… ,βkxk,ε 速度
估计的线性经验回归方程:y,bo,b1x1,…,bk#xk# (1)发展速度是表明现象发展程度的动态相对指标,它是两个不2(参数的最小二乘估计,使残差的平方和最小,即同时期的发展水平对比的结果。
计算公式为:发展速度,报告期水平/基期水平*100%
由于采用的基期不同,发展速度可分为环比发展速度和定基发展速
度。环比发展速 度是报告期水平与前一期水平之比,反映了现象求解b0,b1,…bk的标准程组,即可得到b0,b1,…bk。 逐期发展变化速度;而定基发展速度是 报告期水平同某一固定时3(评价与检验 多元线性回国方程的评价可以根据多重判定系数、期水平之比,表明现象在较长时期内总的发展变化速度,又称 总估计标准误差等统计量来完成。判定系数的公式为:速度。
(2)增长速度是表明现象增长程度的动态相对指标。它是增长量
与基期发展水平 相除的结果。公式为:增长速度,增长量/基期 R2越接
发展水平(增长速度也根据采用的基期 不同,分为环比增长速度近于l,回归直线的拟合程度越好,反之,R2越接近于0,回归直和定基增长速度。 线的拟合程廑越差。 增长速度,发展速度一1 多元线性回归中的估计标准误差是对多元回归模型中误差项ε方差(3)平均发展速度是一定时期内各个环比发展速度的平均数,它的一个估计,公式为:说明某种现象在一个较长时期内逐期平均发展变化的程度。
(4)平均增长速度是各个环比增长速度的平均数,但它不是根据 式中,k是自变各环比增长速度计算的,而是根据平均发展速度计算的。它说明某量的个数。其判定情况同一元线性回归模型。 种现象在一个较长时期内逐期平均增长变化的程度。 多元回归中,t检验和F检验不再等价。线性回归方程的显著性检平均增长速度,平均发展速度一l 验主要是检验因变量同多个自变量的整体线性关系是否显著。回归 三、时间数列影响因素分析 系数的检验则是对每个回归系数分别进行单独的检验,以判断每个一般将社会经济现象时间数列的总变动分解为下列4个主要因素: 自变量对因变量的影响是杏显著。 a)长期趋势(T,Trend) 第六章 时间序列分析 长期趋势是指时间数列在一段长时期的变动,若将其用图形表现,复习要点 可得一长期趋势线。 一、时间序列分析的基本概念 b)季节变动(S,Seasonal variation) 时间序列是指反映社会、经济、自然现象的数据按时间先后顺序记季节变动是时间数列由季节性原因而引起的周期性变动,许多经济录行成的数列。 领域的时间数列都受这种变动的支配。季节变动有三个特点:一是时间序列分析是对一定时间间隔(如1年分为l2个月,或l年分为季节变动每年重复进行;二是季节变动按照一定的周期进行;三是4个季度、或1年)所发生的行为(如每月产品销售额、某地区居每个周期变化强度大体相同。 民每季用煤炭消耗量、或某国家的逐月失业率等),进行动态的跟c)循环变动(C,Cyclical variation) 踪分析,进而研究某些时间序列随时间变化是否有数量上的变化、循环变动是以年度记录的时间数列所表现出来的某种周期性变动。有无统计上的显著性意义。 他与季节变动不同,循环的幅度和周期都可以不很规则。d)不规时间序列数据是指把某一现象的数据按时间先后顺序排列而行成则变动(1,Irregular variation)不规则变动是时间数列除去长期趋的序列。 势、季节变动和循环变动之后余留下来的变动。这种变动分为两种 二、时间序列的分析指标 类型。一是严格的随机变动,它是由许多细小的原因综合引起的,1(增长量分析指标:发展水平、增长量和平均增长量
五、季节变动分析方法 二是不经常出现的某些孤立的或不规则的、但却是强有力的突发性
季节变动分析的方法很多,主要有:一是不考虑长期趋势的季节指活动引起的。
数法;二是考虑长期趋势的回归方程法消除法。 这四种因素的变化构成事物在一定时期的变动。在对时间数列分析
1(不考虑长期趋势一季节指数法 时,首先要明确的是这四种类型因素变动的构成形式,即它们是如季节指数法是一种通过计算各月(或季)的季节指数(又称季节比何结合及相互作用的。对此,通常有两种分解形式:加法模式和乘率),来反映季节变动的一种分析方法。季节比率的计算方法是:法模式。 首先计算出各年同期发展水平的序时平均数,然后将各年同期平均加法模式是假定四种变动因素是相互独立的,则时间数列各期发展数与全时期总平均数对比即得到季节比率。 水平是各个影响因素相加的总和,即有 这种计算方法有两个缺陷,第一,没有考虑长期趋势的影响;第二,Yt,Tt,St,Ct,It 季节比率的高低受各年数值大小的影响。 乘法模式是假定四种变动因素存在着某种相互影响关系,互不独2(考虑长期趋势一回归方程法消除法 立。因此,时间数列各期发展水平是各个影响因素相乘之积,即 注意到一般经济现象都存在一定的长期趋势,为准确反映现象随季Yt,Tt?Ct?It 节变动的特征,应先消除长期趋势的影响,消除的方法很多,这里四、长期趋势分析方法 仅介绍回归方程法消除法。
测定长期趋势分析的方法主要有三种: 步骤如下:
1(回归方程法 第一,利用最小二乘法,求出回归拟合值; 回归方程法就是利用回归分析方法,将时间作为解释变量,建立现第二,用观察值除以拟合值,剔除原时间数列中的长期趋势; 象随时间变化的趋势方程。 第三,计算季节指数。 对于直线趋势方程,我们可以建议一般公式为: 第七章 统计指数 T,a,bt 复习要点 式中:T表示时间数列的长期趋势; 一、统计指数的概念和种类 t表示时间数列中指标所属的时间; 1(统计指数的概念 a、b为待定参数。
广义指数:凡是表明社会经济现象总体数量变动的相对数都是指参数a、b的确定可以用最小二乘法进行估
数。狭义指数:表明复杂社会经济现象总体数量综合变动的相对数。
复杂社会经济现象总体是指那些由于各个部分的不同性质而在研
究其数量特征时不能直接进行加总或直接对比的总体。 计。 2(统计指数的种类
按其反映对象范围的不同,分为个体指数和综合指数 2(简单移动平均法
移动平均法是将时间数列的数据逐项移动,依次计算包含一定期数按其表明的经济指标性质的不同,分为数量指数和质量指数。 的序时平均数,形成一个新的时间数列的方法。通过这种移动,它 二、综合指数
消弱或消除了短期偶然性因素的影响,从而显示出现象发展的基本很多情况下,我们会采用加权综合指数方法将多个现象的变化综合趋势。 得到一个指数,用以比较不同时期的总变化。 采用移动平均法分析时间数列的长期趋势,关键在于平均期数或称拉氏指数:主张不论是物价指数还是物量指数都采用基期作为权数步长的选择。一般地讲,被平均的项数越多,修匀的作用就越大,
但得到的平均数就越少;反之,被平均的项数越少,修匀的作用就的指数。编制方法:拉氏物价指数 越小,而所得的移动平均数就越多。
3(指数平滑法 拉氏物量指数 指数平滑法是对时间数列由近及远采取具有逐步衰减性质的加权派氏指数:主张不论是物价指数还是物量指数都采用报告期作为权处理,对移动平均法做了改进。
一次指数平滑也称简单指数平滑,其公式为: 数的指数,编制方法:派氏物价指数 St,1,αxt,(1,α)St
其中,St表示第t期的一次指数平滑值; 派氏物量指数 Xt表示第t期的观测值; 拉氏指数主要受基期商品(产品)结构的影响,派氏指数主要受报α表示平滑系数,0<><1>1>
义。 值与实际观察值之间的误差达到最小。
三、几种常用的价格指数
1(居民消费价格指数
居民消费价格指数是就居民购买消费品和服务的价格变化编制物价指数,反映其对 应的价格水平变动程度。这种价格指数的编制方法是在众多计量对象中选择代表品,就 这些代表品采集价格数据、计算平均价格和个体物价指数,而后运用加权平均方法逐级 计算类价格指数,直至总价格指数。
居民消费价格指数的作用:
(1)反映城乡居民所购买的生活消费品价格和服务项目价格的变动趋势和程度;
(2)反映通货膨胀状况。通货膨胀的严重程度是用通货膨胀率来反映的,它说明了一定时期内商品价格持续上升的幅度。通货膨胀率一般以居民消费价格指数来表示。计算公式为:
(3)反映货币购买力变动。货币购买力是指单位货币能够购买到的消费品和服务,的数量。居民消费价格指数上涨,货币购买力则下降,反之则上升,因此,居民消费价格指数的倒数就是货币购买力指数。
(4)反映对职工实际工资的影响。利用消费价格指数可以将名义工资转化为实际工资。计算公式为:
实际工资,名义工资(现价工资)/消费价格指数
范文三:统计中级职称考试统计方法复习要点
第一章统计和数据 精度也远远高于定性数据。因此,在统计研究中,数值型数据有
复习要点 着最广泛的用途。
一、基本含义 2(观测数据和实验数据
1(统计就是用来处理数据的,它是关于数据的一门学问。 观测数据是对客观现象进行实地观测所取得的数据,在数据
2(统计学是用以收集数据,分析数据和由数据得出结论的取得的过程中一般没有人为的控制和条件约束。在社会经济问题一组概念、原则和方法。统计分析数据的方法大体上可分为描述研究中,观测是取得数据最主要的方法。 统计和推断统计两大类。 实验数据一般是在科学实验环境下取得的数据。在实验中,
描述统计星研究数据搜集、处理和描述的统计学方法。其内实验环境是受到严格控制的,数据的产生一定是某一约束条件下容包括如何取得研究所需要的数据。如何用图表形式对数据进行的结果。自然科学研究中所用的数据多为实验数据。 处理和展示,如何通过对数据的综合、概括与分析,得出所关心 三、数据的来源
的数据特征。 从使用者的角廑看。统计数据资料的来源主要有两种渠道:
推断统计则是研究如何利用样本数据来推断总体特征的统一种是通过直接的调查或实验获得的原始数据,这是统计数据的计学方法,内容包括参数估计和假设检验两大类。 直接来源,一般称之为原始或第一手统计数据;
3(统计的应用。 另一种是别人调查的数据,并将这些数据进行加工和汇总后
几乎所有的领域都应用统计,但是在应用中应注意分辨被误公布的数据,通常称之为次级数据或第二手间接的统计数据(一用与滥用的现象。 切间接的统计数据都是从原始的、第一手数据过渡而来的。
二、数据类型 1(原始数据。搜集数据最基本的形式就是进行统计调查或
统计数据是对客观现象特征的反映,而由于客观现象的复杂进行实验活动,统计调查或进行实验就是统计数据的直接来源。 性,在反映这些现象特征时可从不同的角度进行采集,从而得到 统计调查是指根据统计研究预定的目的、要求和任务,运用不同类型的数据。 科学的方法,有计划、有组织地向容观实际搜集资料的过程。通
1(定性变量(数据)与定量变量(数据) 过统计调查得到的数据,一般称为观测数据。
(1)定性变量的观察结果称为定性数据。这类数据的最大 实验法是通过实验法得到的数据就是实验数据。运用实验法特点是它只能反映现象的属性特点,而不能说明具体量的大小和要注意的是,首先,实验组和对照组的产生应当是随机的,研究差异,只有分类特征,没有量的特征;这种只能反映现象分类特对象的不同单位应当被随机地分配到实验组或对照组,而不应是征的变量又称为分类变量,分类变量的观察结果就是分类数据。经过有意识的挑选的。其次,实验组和对照组还应当是匹配的,如果类别具有一定的顺序,这样的变量称为顺序变量,相应的观也就是研究对象的背景资料应当是大体相同的,至少不要差异太察结果就是顺序数据。 大。
分类变量没有数值特征,所以不能对其数据进行数学运算。 不论是统计调查还是实验,所搜集的数据都是原始数据,这由此可见,定性数据只能用来区分事物,而不能用来表明事物之是统计数据最基本的来源。2(次级数据。次级数据(第二手数间的大小、优劣关系。 据)是指由其他人搜集和整理得到的统计数据,这种自他人调查
顺序变量比分类变量向前进了一步,它不仅能用来区分客观整理基础上的数据我们把它称为数据的间接来源。 现象的不同类别,而且还可以表明现象之间的大小、高低、优劣 数据的间接来源常用的有以下一些:?公开出版的统计数关系。显然,顺序数据的功能比分类数据要强一些,对事物的划据,主要来自官方的统计部门和政府、组织、学校、科研机构。分也更精细了一些。 ?尚未公开发表的统计数据,如各企业的经营报表数据、专业调
(2)具有明确的数值含义,不仅能分类而且能测量出来具查咨询机构未公开发布的调查结果数据。 体大小和差异的变量就是定量变量,也称为数值变量,定量变量 需要注意的是,如果公开引用未公开发表的数据需要征得数的观察结果成为定量数据。 据所有者的同意,同时要为自己发布的数据负责。
作为统计研究的主要资料,数值型数据的特征在于它们都是 在应用时要注意:?是否了解并正确理解了间接数据中变量以数值的形式出现的,有些数值型数据只可以计算数据之间的绝的含义、计算口径、计算方法,以防止误用、错用他人的数据。对差(绝对距离),而有些数值型数据不仅可以计算数据之间的?引用间接数据时要注明数据来源,尊重他人的劳动成果和知识绝对差,还可以计算数据之间的相对差(相对距离)。显然,数产权。
值型数据的计量功能要远大于前面介绍的两种定性数据,其计量 四、统计调查
1
统计调查是根据调查的目的与要求,运用科学的调查方法, 4(重点调查:是在调查对象中选择一部分重点单位进行的有计划、有组织地搜集统计数据资料的过程。 一种非全面调查。这些重点单位虽然数目不多,但它们具有所研
1(普查是专门组织的一次性的全面调查,用来调查属于一究现象的总量在总体总量中占据绝大部分的特点。 定时点上或一定时期内的社会现象总量。它适于搜集某些不能或 5(典型调查:是一种非全面的专门调查,它是根据调查的不适宜于定期的全面统计报表搜集的统计资料,以摸清重大的国目的与要求,在对被调查对象进行全面分析的基础上,有意识地情、国力。普查的特点为:它是一种全面调查,具有资料包括范选择若干具有典型意义的或有代表性的单位进行的调查。 围全面、详尽、系统的优点;它是一次性的专门调查,因为普查 第二章数据描述 的工作量大,耗资也多,时间周期较长,一般不宜经常举行。 复习要点
目前,我国通过普查进行的统计调查内容和时间周期已经规 本章重点介绍如何简单地利用统计图表和少数数据来概括范化、制度化,具体包括: 某些事物的基本特征。
(1)人口普查。每10年进行一次,逢"0"的年份进行; 一、定性数据的图表展示
(2)农业普查,每l0年进行一次,逢"7"的年份进行; 定性效据包括分类数据和顺序数据,通常可以用频数分布表
(3)经济普查,2004年进行了中国第一次经济普查。 和图形来描述。
2(抽样调查 1(生成频数分布表
抽样调查是一种非全面调查,它是按照随机原则从总体中抽 定性数据本身就是对事物的一种分类,因此,只要先把所有取一部分单位作为样本进行观察研究,以抽样样本的指标去推算的类别都列出来,然后统计出每一类别的频数,就得到一张频数总体指标的一种调查。随机原则要求所有调查单位都有一定的概分布表。频数分布表中落在某一特定类别的数据个数称为频数。率被抽取。 通过频数分布可以观察不同类型数据的分布情况。
抽样调查具有的特点:第一,样本单位按随机原则抽取,排 注意运用Excel生成频数分布表的过程。 除了主观因素对选取样本单位的影响。第二,能够根据部分调查 2(定性数据的图形表示
的实际资料对调查对象的总体的数量特征进行推断,从而达到对 (1)饼图:又称圆饼图、圆形图等,它是利用圆形及圆内调查总体的认识。第三,在抽样调查中会存在抽样误差,但是这扇形面积来表示数值大小的图形。饼图主要用于总体中各组成部个误差可以事先计算并加以控制。 分所占比重的研究。
抽样调查既能节省人力、物力、财力,又可以提高资料的时 (2)条形图:条形图是用宽度相同的条形的高度或长度来效性,而且能取得比较正确的全面统计资料,具有许多优点。抽表述数据多少的图形,用于观察不同类别数据的多少或分布情样调查是一种非全面的、一次性的或经常性的专门调查,这种调况(绘制时,各类别可以放在纵抽,也可以故在横轴。 查方法在市场经济条件下,使用非常广泛。 (3)环形图:环形图可以用来比较不同变量之间的结构差
抽样两种主要方法:概率抽样和非概率抽样。 异。
概率抽样是根据一个已知的概率随机选取被调查者。常用的 二、定量数据用图表展示(
概率抽样形式有:简单随机抽样、分层抽样、整群抽样和系统抽 1(生成频数分布表
样。 生成定量数据的频数分布表时,首先,要对数据进行分组。
非概率抽样是没有完全按照随机原则选取样本单位。 以能够适当观察数据的分布特征为准。一般的分组个数在5-15
3(统计报表 之间。
统计报表是按照国家统一规定的调查要求与文件(指标、表 其次,要确定组距。所谓组距是指每个组变量值中的最大值格形式、计算方法等)自下而上地提供统计资料的一种调查方式。 与最小值之差。若将最大值称为上限,最小值称为下限,则组距
按照报送范围,统计报表分为全面报表和非全面报表。全面等于上限与下限之差,即"组距,上限一下限"。确定组距,一是报表要求调查对象种的每一个单位均要填报,非全面报表则只要要考虑各组的划分是否能区分总体肉部各个组成部分的性质差求一部分调查单位填报; 别,二是要能准确地清晰地反映总体单位的分布特征。
按照报送周期,统计报表主要有月报、季报、年报组成,月 在确定组距时,在研究的现象变动比较均匀的情况下,可以报内容简单,时效性强,年报则内容比较全面。 采用等距分组;而当研究的现象变动很不均匀时,一般采用不等
统计报表的内容包括表式和填表说明。 距分组。
2
最后,统计出各组的频数及频数分布表。在统计各组频数时, 反映数据集中趁势的水平度量:平均数、中位数、众数和分恰好等于某一组的组限时,则采取上限不在内的原则,即将该频位数等;
数计算在与下限相同的组内。 反映数据离散程度的差异度量:极差、四分位差、标准差和
2。定量数据的图形表示 方差。
(1)直方图:用横坐标代袁变量分组,纵坐标代表各变量 (1)水平的度量
值出现的频数,这样,各组与相应的频数就形成了一个矩形,即 平均数也称为均值,是把某一组数据进行算术平均,用以表直方同。 述某一事物的平均水平,它在统计中叫做均值。注意简单平均数
(2)折线图:折线图是利用线段的升降来说明显向变动的和加权平均数的应用。中位数和众数的应用比较简单,结合前边一种统计图,它主要朋于表示现象在现象的分配情况、现象在时概念学习即可。
间上的变化和两个现象之间的依存关系等。 (2)差异的度量
(3)散点图:散点图也可以反映两个变量的关系。 极差又称全距,是一组数据中最夫的标志值和最小的标志值
应特别注意各种图表的生成方式和运用。 之差。它的特点是简单直观,但是容易受数据中极端值的影响,
三、用统计表来表示数据 因此,不能准确地描述数据的分散程度。
统计表是一种用密集的形式归纳数据的方法。它主要是利用 方差是将各个变量值和其均值离差平方的品军数,它反映了行和列中的数据来表述现象特征。人们利用统计表主要出于两种样本中各个观测值到其均值的平均离散程度。标准差是方差的平目的:一是在文章中使用它以支持自己的观点;二是利用它组织方根,它更具量纲性,而且与变量值的计量单位相同,使用的范数据。 同更广泛。
统计表一般由五个部分组成,即表头、行标题;列标题、数 离散系数也称为便变异系数、标准差系数,足将一组数据的字资料和表外附加构成。 标准差除以其均值,用来测度离散程度的相对数。
表头应该放在表的上方,它说明的是表的主要内容; 标准分数也称作标准化值或Z分数,是变量值与其平均数的
行标题和列标题一般放在表的第一行和第一列,它表示的是离差除以标准差后的值,用以测定某一数据在该组数据中的相对所研究的问题类别的名称和指标名称; 位置。
表的其余部分是具体的数字资料: 第三章 参数估计
表外附加通常放在统计表的下方,用来说明资料来源、指标复习要点
注释和必要的说明等内容。 一、抽样分布
通常情况下,统计表的左右两边不能封口。 1(总体分布与总体参数
四、用数字来概括数据 总体分布是总体中所有观察值所形成的分布。
针对一组数据的分布特征,可以从两个方面来考查它:一是总体参数是对总体特征的某个概括性的度量。通常有总体平均数该组数据的集中趁势,即该组数据的数值向其中心值的靠拢程(μ)、总体方差(σ2)、总体比例(π)等。 度。二是该组数据的离散程度,它反映的是该组数据的各个数值2(统计量与抽样分布
远离其中心值的趋势和程度。这两个方面反映了数据分布特征的统计量是根据样本数据计算的用于推断总体的某些量,是对样本不同侧面,从不同视角来分析统计数据,以达到分析和运用统计特征的某个概括性度量。统计量是样本的函数(如样本均值、样数据的目的。 本方差(s2)、样本比例(p)等。
1(定性数据的数字特征 构成统计量的函数中不能包括未知因素。
对定性数据的集中趋势常用的方法就是计算比例、百分比、抽样分布是样本统计量所形成的概率分布,如样本均值的分布、中位数和众数。 样本比例的分布等。 抽样分布是一种理论分布。 抽样分布构成
中位数,是数据按照大小排列之后位于中间的那个数(如果了推断总体参数的理论基础。
样本重为奇数),或者中间两个数目的平均(如果样本重为偶数)。 根据统计量来推断总体参数具有某种不确定性。 不同的样本可
众数,就是数据中出现次教或出现频率最多的数值,在定性以计算出不同的统计量值。
数据中,由于记录的是频数,因此众数用得多些。 (1)样本均值的抽样分布当总体服从正态分布时,样本均值一
2(定量数据的数字特征 定服从正态分布,即有X,N(μ,σ2)
常用的反映定量数据特征的统计量有:
3
以95(45%的置信水平推断总体参数肛的置信区间为若总体为未知的非正态分布时,只要样本容量n足够大(通常要
求n?30),样本均值仍会接近正态分布。
以99(73%的置信水平推断总体参数肛的置信区间为如果总体不是正态分布,当n为小样本时(通常n<>
均值的分布则不服从正态分布。
(2)样本比例的抽样分布 比例是指具有某种属性的单位占全部单位数的比重。
2(评价估计量的标准无偏性,是指估计量抽样分布的期望值等总体比例(通常用π表示)是总体中具有某种属性的单位数占全
于被估计的总体参数。无偏估计量的定义。设总体参数为0,所部总体单位数的比例,是一个参数,通常是未知的。
样本比例(通常用P表示)是随机抽取的样本中具有某种属性的选择的估计量为如果E()=θ则称为θ的无偏估计量。 单位数占样本全部单位数的比例,是一个样本统计量,是随机变
χ,P,s2分别是总体均值、总体比例、总体方差的无偏估计量。 量,是可以观察到的。
有效性,是指估计量的方差尽可能小。 样本比例的抽样分布,是描述所有可能样本比例的概率分布。
有效估计量的定义。对同一个总体参数的两个无偏估计量,有更当样本容量比较大时,样本比例P近似服从正态分布,在重置抽
小方差的估计量更有效。有效估计量。一致性,是指随着样本量
的增大,点估计量的值越来越接近被估计总体的参数。一致估计样时,P的分布为在不重置量。样本均值是总体均值的一个一致估计量。
3(一个总体均值的区间估计,在对总体均值进行区间估计时,
需要考虑总体是否为正态分布、总体方差是否已知,用于估计的抽样时,P的分布为P,N 样本是大样本还是小样本等情况。 一般讲,当np?5,n(1一P) ?5时,就可以认为样本容量足(1)大样本的估计 够大。随着样本容量的增大,样本比例的方差愈来愈小。 大样本(n?30)情况下,当总体方差σ2已知时,总体均值μ在3(统计量的标准误差 1—α置信水平下的置信区间为统计量的标准误差也称为标准误,是指样本统计量分布的标准
差。可用于衡量样本统计量的离散程度。
大样本情况在参数估计中,它是用于衡量样本统计量与总体参数之间差距的
下,当总体方差σ2未知时,总体均值μ在1一α置信水平下的一个重要尺度。
置信区间为 样本均值的标准误计算公式为
(2)小样本的估计小样本(n<>
σ2已知时,总体均值μ在1一α置信水平下的置信区间样本比例的标准误计算公式为
二、参数估计 为小样本
参数估计就是用样本统计量去倍计总体的参数。 (n<30)情况下,当总体方差σ2未知时,总体均值μ在1一n用样本统计量来估计总体参数有两种方法:点估计和区间估计>30)情况下,当总体方差σ2未知时,总体均值μ在1一n用样本统计量来估计总体参数有两种方法:点估计和区间估计>
1(点估计与区间估计
点估计,是用样本统计量的实现值来近似相应的总体参数。
总体均值的置信区区间估计,是根据估计可靠程度的要求,利用随机抽取的样本的
间是由样本均值和估计误差两部分组成的。4(一个总体比例的统计量值确定能够覆盖总体参数的可能区间的一种估计方法。
区间估计大样本条件下,当总体比例π已知时,在1一α的置信以68(73%的置信水平推断总体参数肛的置信区间为
4
水平下,总体比例的置信区间为误差的原因。
2(如何进行假设检验:小概率事件,是指在一次事件中几乎不
可能发生的事件。一般称之为“显著性水平”,用α表示。显著性
水平一般取值为α,0(05或α,5%。 在大样本条件下(当总体比例π未知时,在1一α的置信水平下,3(假设检验的过程;
总体比例的置信区间为首先,要提出一个原假设和备择假设。原假设(或零假设)H0,
备择假设(或备选假设)H1
第二,确定检验统计量。计算z统计量或计算t统计量
第三,确定显著性水平α(第一类错误和第二类错误 总体比例的置信区间是由样本比例和估计误差两部分组成的。 第四,根据数据计算检验统计量值和与这个统计量值对应的概率
三、样本量的确定 值,并进行决策。
在进行参数估计时,样本量要适当。 4(检验决策准则:
样本量过大会增加调查费用,花费更多的人力;样本量过小,样双侧检验:,统计量的值,>临界值,拒绝原假设 本没有足够的代表性,统计量的标准误差会增大,对总体参数的左侧检验:统计量的值<临界值,拒绝原假设>临界值,拒绝原假设>
估计会不准确。 右侧检验:统计量的值>临界值,拒绝原假设
1(估计总体均值时样本量的确定 5(假设检验总结:假设检验依据的是小概率原理。 在重置抽样条件下,设E代表允许的估计误差,则样本量计算公小概率标准在抽样前依需要确定。假设检验的结果只能是拒绝或
不拒绝原来假设,而不能证明原假设成立。统计假设检验的结果
不是绝对正确。
二、总体均值的假设检验 式为:
在对总体均值进行假设检验时,采用什么检验统计量取决于所抽如果总体标准差盯未知,可以用样本标准差s来代替;也可以用取的样本是否是大样本还是小样本,还需要考虑总体是否为正态试验调查的办法,选择一个初始样本,以该样本的标准差s作为分布、总体方差是否已知等。 总体标准差盯的估计值。 1(大样本(n>30)的检验当总体方差已知时,总体均值检验的样本量与置信水平成正比,与总体方差成正比,与允许的估计误
差的平方成反比。 统计量为 2(估计总体比例时样本量的确定
在重置抽样条件下。设E代表允许的估计误差,则样本量计算公
当总体方差未知时,总体均值检验的统计量为
2(小样本(n<>
式为:
统计量为 样本量越大,估计误差就越小,估计的精度就越高。估计洪差由
使用者预先确定。
大多数情况下,估计误差的取值一般应小于0(1。
如果总体比例π的值不知道,可以用样本比例s来代替,或者取当总体方差未知时,总体均值检验的统计量为 π,0(5,使得π(1一π)达到最大。第四章 假设检验 三、总体比例的假设检验
复习要点 生活中经常需要对总体的某些比例进行检验,以证明某种观点能一、假设检验 否被否定。
假设检验是先对总体参数或分布形式提出某种假设,然后利用样一个总体比例的检验,基本形式有以下三种: 本信息和相关统计量的分布特征去检验这个假定,做出是否拒绝双侧检验:H0:π,π0,H1?π。
原来假设的结论。 左侧检验:H0:π?π0,Hl#:π<π0 参数估计是依据样本信息推断未知的总体参数。="" 右侧检验:h0:π?π0,hl:π="">π0在大样本时,样本比例会近似1、为什么要进行假设检验:找出样奉均值与总奉均值之间存在
5
服从正态分布。检验统计量用Z统计量,其基本形式为与Y之间存在正线性相关关系;r<>
相关关系;r值越接近l(或一l)就越正(或负)相关,越接近
0,就越不相关。r,1或r,一1表明2与Y之间为完全相关关 系(实际上就是函数关系)。
第五章 相关分析和回归分析 (2)r具有对称性。x与Y之间的相关系数rxy和y与x之间的
复习要点 相关系数ryx相等,即rxy,ryx。
一、相关关系 (3)r数值大小与x和Y的数据原点及计量尺度无关。改变x变量之间存在着密切的联系但又不是严格的、确定的关系称为相和Y的数据原点或计量尺度,并不改变r数值大小。 关关系。相关分析的主要内容包括以下几个方面: (4)r仅仅是X与Y之间线性关系的一个度量,它不能用于描(一)确定现象之间有无关系,这是相关分析的起点; 述非线性关系。这意味着,r,0只表示两个变量之间不存在线性(二)确定相关关系的表现形式; 关系,并不表明变量之间没有任何关系,比如他们之间可能存在(三)测定相关关系的密切程度。 非线性关系。
二、相关表和散点图 (5)r虽然是两个变量之间线性关系的一个度量,却不一定意味对于两个变量戈和Y,通过观察或实验,我们可以得到若干组数着X与Y一定有因果关系。
据,记为(xi,Yi)(i,1,2,…,n),将这些数据按x值由检验:相关系数的检验可以用t分布检验进行。检验的具体步骤大到小(或由小到大)以序列表表示,即构成相关表。 如下:
将一一对应的(xi,Yi)描点于坐标系上,即构成散点图,又称首先确定原假设
为相关图。通过散点图所反映出的坐标点的分布状况可以直观地编:两变量之间不存在线性关系(H0:ρ,0)瑟。:两变量之判断变量之间是否存在相关关系,以及相关的形态、方向。 间存在线性关系(H。:ρ?0)
三、相关的形态(线性相关和非线性相关)
若变量Y与变量x的相关关系表现为线性组合,或绘制的散点其次,计算统计量t值 图近似地表现为一条直线或直线带,则称之为线性相关。
若变量Y与变量x是非线性组合,或绘制的散点图近似地表现最后,利用其对应的概率值进行判断,如果概率值小于或等于指为一条曲线,则称之为非线性相关或曲线相关。 定的显著性水平(一般α,0(05),则我们可以拒绝原假设,
四、相关的方向(正相关和负相关) 接受备择假设,即两变量之间存在线性相关关系。否则不能拒绝当两个变量的变动方向总体上相同,即一个变量增加,另一个变原假设,可以认为两变量之间不存在显著的相关关系。 量也相应地增加,或一个变量减少,另一个变量也相应地减少时, 六、一元线性回归分析
两个变量之间的关系属于正相关。 1(相关分析和回归分析的区别: 若两个变量变动的方向总体上相反,即一个变量增加的同时,另相关分析旨在测度变量之间关系的密切程度,它所实用的测定工一个变量随之减少时,两个变量之间的关系属于负相关。 具就是相关系数。而回归分析则是考察若干自变量X与因变量Y
五、Pearson相关系数 之间的数量变化规律的统计方法和技术。 相关系数是测定变量之间关系密切程度的量,它能够以数字准确2(回归分析的主要内容:
地描述变量之间的相关程度。要反映不同类型变量数据的相关程(1)从样本数据出发,确定变量之间的数学关系式; 度,有不同的相关系数。重点介绍Pear—son相关系数。 (2)估计回归模型参数;
1(定义:Pearson相关系数是用来度量两个定量变量x和Y之间(3)对所确定的关系式进行各种统计检验,并从影响某一特定的线性相关程度,如人均可支配收入与消费支出的相关程度、身变量的诸多变量中找出影响显著的变量。 高与体重之间的相关程度等等。 3(一元线性回归模型
2(公理论回归模型:Y,βo,β1x,ε
式: 估计的回归方程:y,b0,b1x
4(参数的最小二乘估计
用普通最小二乘法得到参数估计值的具体计算公式为:
3(性质:(1)r的取值范围在一1,1,即一1?r?1。r>0表明x
6
5(回归系数的含义:Y,b0,b1x中的b0是直线的结局,表示方差的一个估计,公式为:
当解释变量为零时Y的平均值。回归系数b1是直线的斜率,表
式中,k是自示解释变量x每增加一个单位,被解释变量将相应地平均变化
变量的个数。其判定情况同一元线性回归模型。 b1个单位。
多元回归中,t检验和F检验不再等价。线性回归方程的显著性6(回归系数的检验和评价
检验主要是检验因变量同多个自变量的整体线性关系是否显著。(1)经济意义检验 利用相关的经济学原理及我们所积累的丰
回归系数的检验则是对每个回归系数分别进行单独的检验,以判富的经验,对所估计的回归方程的回归系数进行分析与判断,看
断每个自变量对因变量的影响是杏显著。 其能否得到合理的解释。
第六章 时间序列分析 (2)同归方程的统计检验
复习要点 包括回归方程的显著性检验(F检验)和对同归系数的检验(t
一、时间序列分析的基本概念 检验)。一冗线性回归分析时,由于只有一个解释变量,因此t
时间序列是指反映社会、经济、自然现象的数据按时间先后顺序检验与F检验的结果是一致的。
记录行成的数列。 (3)回归方程的评价(拟合程度分析)
时间序列分析是对一定时间间隔(如1年分为l2个月,或l年分判定系数R2的公式为:
为4个季度、或1年)所发生的行为(如每月产品销售额、某地
区居民每季用煤炭消耗量、或某国家的逐月失业率等),进行动判定系数R2的取值范围是[0,1],R2越接近于l,表明回归平态的跟踪分析,进而研究某些时间序列随时间变化是否有数量上方和占总变差平方和的比重越大,回归直线于个观测点越接近,的变化、有无统计上的显著性意义。 回归直线的拟合程度就越好。反之,R2越接近于0,回归直线时间序列数据是指把某一现象的数据按时间先后顺序排列而行的拟合程度越差。 成的序列。
二、时间序列的分析指标
估计标准误差1(增长量分析指标:发展水平、增长量和平均增长量 是残差平方和的均方根,用Se来表示,其计算公式为: 估计标(1)发展水平是时间数列中对应某个时期(或时点)的指标数准误差是度量各观测点在直线周围分散程度的一个统计量,反映值,说明现象在各个时期(或时点)上所达到的规模和水平,一了实际观测值Yi与回归估计值yi之间的差异程度。若各观测点般用符号Yt(t,1,2,…,n)来表示,其中t表示所对应的时全部落在直线上,则Se,0,此时用自变量来预测因变量是没有间。
误差的。 (2)增长量是指时间数列中两个不同时期的发展水平之差,反
七、多元线性回归分析 映社会经济现象报告期比基期增加或减少的数量,即:增长量,1(回归模型与回归方程 报告期水平一基期水平。增长量又根据基期水平的不同分为逐期多元线性回归模型:Y,βo,β1x1,… ,βkxk,ε 增长量和累计增长量。
估计的线性经验回归方程:y,bo,b1x1,…,bk#xk# (3)平均增长量是某种社会经济现象在一定时期内平均每期增2(参数的最小二乘估计,使残差的平方和最小,即长(或减少)的绝对数量。一般用累计增长量除以增长的时期数
目计算。
2(增长率分析:发展速度、增长速度、平均发展速度和平均增
长速度
求解b0,b1,…bk的标准程组,即可得到b0,b1,…bk。 (1)发展速度是表明现象发展程度的动态相对指标,它是两个3(评价与检验 多元线性回国方程的评价可以根据多重判定系不同时期的发展水平对比的结果。 数、估计标准误差等统计量来完成。判定系数的公式为:计算公式为:发展速度,报告期水平/基期水平*100%
由于采用的基期不同,发展速度可分为环比发展速度和定基发展
速度。环比发展速 度是报告期水平与前一期水平之比,反映了 R2越
现象逐期发展变化速度;而定基发展速度是 报告期水平同某一接近于l,回归直线的拟合程度越好,反之,R2越接近于0,回固定时期水平之比,表明现象在较长时期内总的发展变化速度,归直线的拟合程廑越差。 又称 总速度。
多元线性回归中的估计标准误差是对多元回归模型中误差项ε(2)增长速度是表明现象增长程度的动态相对指标。它是增长
7
对于直线趋势方程,我们可以建议一般公式为: 量与基期发展水平 相除的结果。公式为:增长速度,增长量/
a,bt T,基期发展水平(增长速度也根据采用的基期 不同,分为环比增
式中:T表示时间数列的长期趋势; 长速度和定基增长速度。
t表示时间数列中指标所属的时间; 增长速度,发展速度一1
a、b为待定参数。 (3)平均发展速度是一定时期内各个环比发展速度的平均数,参数a、b的确定可以用最小二乘法进行估它说明某种现象在一个较长时期内逐期平均发展变化的程度。
(4)平均增长速度是各个环比增长速度的平均数,但它不是根
据各环比增长速度计算的,而是根据平均发展速度计算的。它说
明某种现象在一个较长时期内逐期平均增长变化的程度。 计。
平均增长速度,平均发展速度一l 2(简单移动平均法
三、时间数列影响因素分析 移动平均法是将时间数列的数据逐项移动,依次计算包含一定期一般将社会经济现象时间数列的总变动分解为下列4个主要因数的序时平均数,形成一个新的时间数列的方法。通过这种移动,素: 它消弱或消除了短期偶然性因素的影响,从而显示出现象发展的a)长期趋势(T,Trend) 基本趋势。
长期趋势是指时间数列在一段长时期的变动,若将其用图形表采用移动平均法分析时间数列的长期趋势,关键在于平均期数或
称步长的选择。一般地讲,被平均的项数越多,修匀的作用就越现,可得一长期趋势线。
大,但得到的平均数就越少;反之,被平均的项数越少,修匀的b)季节变动(S,Seasonal variation)
作用就越小,而所得的移动平均数就越多。 季节变动是时间数列由季节性原因而引起的周期性变动,许多经
3(指数平滑法 济领域的时间数列都受这种变动的支配。季节变动有三个特点:
指数平滑法是对时间数列由近及远采取具有逐步衰减性质的加一是季节变动每年重复进行;二是季节变动按照一定的周期进
权处理,对移动平均法做了改进。 行;三是每个周期变化强度大体相同。
一次指数平滑也称简单指数平滑,其公式为: c)循环变动(C,Cyclical variation) St,1,αxt,(1,α)St 循环变动是以年度记录的时间数列所表现出来的某种周期性变其中,St表示第t期的一次指数平滑值; 动。他与季节变动不同,循环的幅度和周期都可以不很规则。d)Xt表示第t期的观测值; 不规则变动(1,Irregular variation)不规则变动是时间数列除去α表示平滑系数,0<><1 长期趋势、季节变动和循环变动之后余留下来的变动。这种变动使用指数平滑法的关键是确定一个合适的平滑系数α(因为不同分为两种类型。一是严格的随机变动,它是由许多细小的原因综的平滑系数α对预测结果有直接影响。α取值越接近1时,近期合引起的,二是不经常出现的某些孤立的或不规则的、但却是强数据作用最大,各期历史数据的作用迅速减弱。实际应用中α的有力的突发性活动引起的。="" 大小需要反复比较确定,确定的依据是α的取值要使计算得到的这四种因素的变化构成事物在一定时期的变动。在对时间数列分各期预测值与实际观察值之间的误差达到最小。="" 析时,首先要明确的是这四种类型因素变动的构成形式,即它们="" 五、季节变动分析方法="">1>
是如何结合及相互作用的。对此,通常有两种分解形式:加法模季节变动分析的方法很多,主要有:一是不考虑长期趋势的季节
指数法;二是考虑长期趋势的回归方程法消除法。 式和乘法模式。
1(不考虑长期趋势一季节指数法 加法模式是假定四种变动因素是相互独立的,则时间数列各期发
季节指数法是一种通过计算各月(或季)的季节指数(又称季节展水平是各个影响因素相加的总和,即有
比率),来反映季节变动的一种分析方法。季节比率的计算方法Yt,Tt,St,Ct,It
是:首先计算出各年同期发展水平的序时平均数,然后将各年同乘法模式是假定四种变动因素存在着某种相互影响关系,互不独
期平均数与全时期总平均数对比即得到季节比率。 立。因此,时间数列各期发展水平是各个影响因素相乘之积,即
这种计算方法有两个缺陷,第一,没有考虑长期趋势的影响;第Yt,Tt?Ct?It 二,季节比率的高低受各年数值大小的影响。 四、长期趋势分析方法
2(考虑长期趋势一回归方程法消除法 测定长期趋势分析的方法主要有三种:
注意到一般经济现象都存在一定的长期趋势,为准确反映现象随1(回归方程法
季节变动的特征,应先消除长期趋势的影响,消除的方法很多,回归方程法就是利用回归分析方法,将时间作为解释变量,建立
这里仅介绍回归方程法消除法。 现象随时间变化的趋势方程。
8
步骤如下: (2)反映通货膨胀状况。通货膨胀的严重程度是用通货膨胀率第一,利用最小二乘法,求出回归拟合值; 来反映的,它说明了一定时期内商品价格持续上升的幅度。通货第二,用观察值除以拟合值,剔除原时间数列中的长期趋势; 膨胀率一般以居民消费价格指数来表示。计算公式为:第三,计算季节指数。
第七章 统计指数
复习要点
一、统计指数的概念和种类 (3)反映货币购买力变动。货币购买力是指单位货币能够购买1(统计指数的概念 到的消费品和服务,的数量。居民消费价格指数上涨,货币购买广义指数:凡是表明社会经济现象总体数量变动的相对数都是指力则下降,反之则上升,因此,居民消费价格指数的倒数就是货数。狭义指数:表明复杂社会经济现象总体数量综合变动的相对币购买力指数。
数。复杂社会经济现象总体是指那些由于各个部分的不同性质而(4)反映对职工实际工资的影响。利用消费价格指数可以将名在研究其数量特征时不能直接进行加总或直接对比的总体。 义工资转化为实际工资。计算公式为: 2(统计指数的种类 实际工资,名义工资(现价工资)/消费价格指数 按其反映对象范围的不同,分为个体指数和综合指数
按其表明的经济指标性质的不同,分为数量指数和质量指数。
二、综合指数
很多情况下,我们会采用加权综合指数方法将多个现象的变化综
合得到一个指数,用以比较不同时期的总变化。
拉氏指数:主张不论是物价指数还是物量指数都采用基期作为权
数的指数。编制方法:拉氏物价指数
拉氏物量指数
派氏指数:主张不论是物价指数还是物量指数都采用报告期作为
权数的指数,编制方法:派氏物价指数
派氏物量指数
拉氏指数主要受基期商品(产品)结构的影响,派氏指数主要受
报告期商品(产品)结构的影响。在实际应用中,由于派氏指数
要求每期更换权数资料,计算比较麻烦,而拉氏指数的权数固定
在基期,在编制长期连续性指数数列时比较方便,因此,拉氏指
数更得到普遍应用。但是从实际意义上看,派氏物量指数的解释
更符合现实意义。
三、几种常用的价格指数
1(居民消费价格指数
居民消费价格指数是就居民购买消费品和服务的价格变化编制
物价指数,反映其对 应的价格水平变动程度。这种价格指数的
编制方法是在众多计量对象中选择代表品,就 这些代表品采集
价格数据、计算平均价格和个体物价指数,而后运用加权平均方
法逐级 计算类价格指数,直至总价格指数。
居民消费价格指数的作用:
(1)反映城乡居民所购买的生活消费品价格和服务项目价格的
变动趋势和程度;
9
范文四:统计中级职称考试统计方法复习要点
第一章统计和数据 复习要点
一、基本含义 关于数据的一门学问。
现象的属性特点,而不能说明具体量的大 统计调查是指根据统计研究预定的小和差异,只有分类特征,数值型数据有着最广泛的用途。 这种只能反映现象分类特征的变量又称
2.观测数据和实验数据
目的、要求和任务,运用科学的方法,有计划、有组织地向容观实际搜集资料的过程。通过统计调查得到的数据,一般称为
1.统计就是用来处理数据的,它是为分类变量,分类变量的观察结果就是分 观测数据是对客观现象进行实地观
类数据。如果类别具有一定的顺序,这样测所取得的数据,在数据取得的过程中一观测数据。
济问题研究中,观测是取得数据最主要的是实验数据。运用实验法要注意的是,首
先,实验组和对照组的产生应当是随机的,研究对象的不同单位应当被随机地分
2.统计学是用以收集数据,分析数的变量称为顺序变量,相应的观察结果就般没有人为的控制和条件约束。在社会经 实验法是通过实验法得到的数据就据和由数据得出结论的一组概念、原则和是顺序数据。 描述统计和推断统计两大类。
方法。统计分析数据的方法大体上可分为 分类变量没有数值特征,所以不能对方法。
其数据进行数学运算。由此可见,定性数 实验数据一般是在科学实验环境下
描述统计星研究数据搜集、处理和描据只能用来区分事物,而不能用来表明事取得的数据。在实验中,实验环境是受到配到实验组或对照组,而不应是经过有意述的统计学方法。其内容包括如何取得研物之间的大小、优劣关系。 进行处理和展示,如何通过对数据的综 推断统计则是研究如何利用样本数括参数估计和假设检验两大类。 3.统计的应用。
严格控制的,数据的产生一定是某一约束识的挑选的。其次,实验组和对照组还应
应当是大体相同的,至少不要差异太大。 不论是统计调查还是实验,所搜集的
究所需要的数据。如何用图表形式对数据 条件下的结果。自然科学研究中所用的数当是匹配的,也就是研究对象的背景资料
据多为实验数据。
合、概括与分析, 三、数据的来源
优劣关系。显然,顺序数据的功能比分类 从使用者的角廑看。统计数据资料的数据都是原始数据,这是统计数据最基本一些。
调查或实验获得的原始数据,这是统计数手数据)是指由其他人搜集和整理得到的统计数据;
数据我们把它称为数据的间接来源。
据来推断总体特征的统计学方法,内容包数据要强一些,对事物的划分也更精细了来源主要有两种渠道:一种是通过直接的的来源。2.次级数据。次级数据(第二
(2)具有明确的数值含义,不仅能据的直接来源,一般称之为原始或第一手统计数据,这种自他人调查整理基础上的
几乎所有的领域都应用统计,但是在分类而且能测量出来具体大小和差异的 二、数据类型
量变量的观察结果成为定量数据。
变量就是定量变量,也称为数值变量,定 另一种是别人调查的数据,并将这些 数据的间接来源常用的有以下一些:
数据进行加工和汇总后公布的数据,通常①公开出版的统计数据,主要来自官方的
统计部门和政府、组织、学校、科研机构。经营报表数据、专业调查咨询机构未公开
②尚未公开发表的统计数据,如各企业的
作为统计研究的主要资料,数值型数称之为次级数据或第二手间接的统计数而由于客观现象的复杂性,在反映这些现据的特征在于它们都是以数值的形式出得到不同类型的数据。 据)
象特征时可从不同的角度进行采集,从而现的,有些数值型数据只可以计算数据之第一手数据过渡而来的。
间的绝对差(绝对距离),而有些数值型 1.原始数据。搜集数据最基本的形发布的调查结果数据。 可以计算数据之间的相对差(相对距离)计调查或进行实验就是统计数据的直接
发表的数据需要征得数据所有者的同意,同时要为自己发布的数据负责。
1.定性变量(数据)与定量变量(数数据不仅可以计算数据之间的绝对差,还式就是进行统计调查或进行实验活动,统 需要注意的是,如果公开引用未公开 (1)定性变量的观察结果称为定性显然,数值型数据的计量功能要远大于前来源。 数据。这类数据的最大特点是它只能反映面介绍的两种定性数据,其计量精度也远
1
在应用时要注意:①是否了解并正确 抽样调查是一种非全面调查,它是按 统计报表是按照国家统一规定的调理解了间接数据中变量的含义、计算口数据。②引用间接数据时要注明数据来 四、统计调查
照随机原则从总体中抽取一部分单位作
定性效据包括分类数据和顺序数据,
查要求与文件(指标、表格形式、计算方通常可以用频数分布表和图形来描述。
定性数据本身就是对事物的一种分
径、计算方法,以防止误用、错用他人的为样本进行观察研究,以抽样样本的指标法等)自下而上地提供统计资料的一种调 1.生成频数分布表
去推算总体指标的一种调查。随机原则要查方式。
源,尊重他人的劳动成果和知识产权。 按照报送范围,统计报表分为全面报类,因此,只要先把所有的类别都列出来,
抽样调查具有的特点:第一,样本单表和非全面报表。全面报表要求调查对象然后统计出每一类别的频数,就得到一张
类别的数据个数称为频数。通过频数分布可以观察不同类型数据的分布情况。 程。
2.定性数据的图形表示
(1)饼图:又称圆饼图、圆形图等,
位按随机原则抽取,排除了主观因素对选种的每一个单位均要填报,非全面报表则频数分布表。频数分布表中落在某一特定运用科学的调查方法,有计划、有组织地取样本单位的影响。第二,能够根据部分只要求一部分调查单位填报; 搜集统计数据资料的过程。
调查的实际资料对调查对象的总体的数
按照报送周期,统计报表主要有月
1.普查是专门组织的一次性的全面量特征进行推断,从而达到对调查总体的报、季报、年报组成,月报内容简单,时 注意运用Excel生成频数分布表的过调查,用来调查属于一定时点上或一定时认识。第三,在抽样调查中会存在抽样误效性强,年报则内容比较全面。 期内的社会现象总量。它适于搜集某些不差,但是这个误差可以事先计算并加以控 统计报表的内容包括表式和填表说能或不适宜于定期的全面统计报表搜集
制。
明。
抽样调查既能节省人力、物力、 4.重点调查:是在调查对象中选择它是利用圆形及圆内扇形面积来表示数普查的特点为:它是一种全面调查,具有又可以提高资料的时效性,而且能取得比值大小的图形。饼图主要用于总体中各组这些重点单位虽然数目不多,但它们具有成部分所占比重的研究。 它是一次性的专门调查,因为普查的工作抽样调查是一种非全面的、一次性的或经所研究现象的总量在总体总量中占据绝量大,耗资也多,时间周期较长,一般不常性的专门调查,这种调查方法在市场经大部分的特点。 宜经常举行。
济条件下,使用非常广泛。
(2)条形图:条形图是用宽度相同的条形的高度或长度来表述数据多少的
5.典型调查:是一种非全面的专门图形,用于观察不同类别数据的多少或分被调查对象进行全面分析的基础上,有意也可以故在横轴。 识地选择若干具有典型意义的或有代表性的单位进行的调查。
第二章数据描述 复习要点
本章重点介绍如何简单地利用统计图表和少数数据来概括某些事物的基本特征。
一、定性数据的图表展示
2
目前,我国通过普查进行的统计调查 抽样两种主要方法:概率抽样和非概调查,它是根据调查的目的与要求,在对布情况.绘制时,各类别可以放在纵抽,内容和时间周期已经规范化、制度化,具率抽样。 体包括:
逢"0"的年份进行; 逢"7"的年份进行; 第一次经济普查。 2.抽样调查
概率抽样是根据一个已知的概率随有:简单随机抽样、分层抽样、整群抽样 非概率抽样是没有完全按照随机原 3.统计报表
(3)环形图:环形图可以用来比较不同变量之间的结构差异。 二、定量数据用图表展示. 1.生成频数分布表
生成定量数据的频数分布表时,首先,要对数据进行分组。以能够适当观察数据的分布特征为准。一般的分组个数在5-15之间。
(1)人口普查。每10机选取被调查者。常用的概率抽样形式 (2)农业普查,每l0年进行一次,和系统抽样。 (3)经济普查,2004年进行了中国则选取样本单位。
其次,要确定组距。所谓组距是指每 应特别注意各种图表的生成方式和个组变量值中的最大值与最小值之差。若运用。
将最大值称为上限,最小值称为下限,则 三、用统计表来表示数据 组距等于上限与下限之差,即"组距=上 统计表是一种用密集的形式归纳数的划分是否能区分总体肉部各个组成部映总体单位的分布特征。
布特征的不同侧面,从不同视角来分析统 极差又称全距,是一组数据中最夫的计数据,以达到分析和运用统计数据的目标志值和最小的标志值之差。它的特点是的。
1.定性数据的数字特征
简单直观,但是容易受数据中极端值的影响,因此,不能准确地描述数据的分散程度。
限一下限"。确定组距,一是要考虑各组据的方法。它主要是利用行和列中的数据 对定性数据的集中趋势常用的方法
来表述现象特征。人们利用统计表主要出 方差是将各个变量值和其均值离差自己的观点;二是利用它组织数据。
值到其均值的平均离散程度。标准差是方或者中间两个数目的平均(如果样本重为差的平方根,它更具量纲性,而且与变量
值的计量单位相同,使用的范同更广泛。
众数,就是数据中出现次教或出现频 离散系数也称为便变异系数、标准差的是频数,因此众数用得多些。 2.定量数据的数字特征 有:
值,用来测度离散程度的相对数。 标准分数也称作标准化值或Z分数,是变量值与其平均数的离差除以标准差后的值,用以测定某一数据在该组数据中第三章 参数估计 复习要点 一、抽样分布
1.总体分布与总体参数
分的性质差别,二是要能准确地清晰地反于两种目的:一是在文章中使用它以支持 中位数,是数据按照大小排列之后位平方的品军数,它反映了样本中各个观测 在确定组距时,在研究的现象变动比 统计表一般由五个部分组成,即表当研究的现象变动很不均匀时,一般采用加构成。 不等距分组。
最后,统计出各组的频数及频数分布表的主要内容;
表。在统计各组频数时,恰好等于某一组 行标题和列标题一般放在表的第一将该频数计算在与下限相同的组内。 2。定量数据的图形表示
别的名称和指标名称;
较均匀的情况下,可以采用等距分组;而头、行标题;列标题、数字资料和表外附偶数)。
表头应该放在表的上方,它说明的是率最多的数值,在定性数据中,由于记录系数,足将一组数据的标准差除以其均
的组限时,则采取上限不在内的原则,即行和第一列,它表示的是所研究的问题类 常用的反映定量数据特征的统计量
表的其余部分是具体的数字资料: 反映数据集中趁势的水平度量:平均的相对位置。
(1)直方图:用横坐标代袁变量分 表外附加通常放在统计表的下方,用数、中位数、众数和分位数等; 组,纵坐标代表各变量值出现的频数,这来说明资料来源、指标注释和必要的说明 反映数据离散程度的差异度量:极样,各组与相应的频数就形成了一个矩形,即直方同。
等内容。
差、四分位差、标准差和方差。
通常情况下,统计表的左右两边不能 (1)水平的度量
(2)折线图:折线图是利用线段的封口。
升降来说明显向变动的一种统计图,它主 四、用数字来概括数据 在时间上的变化和两个现象之间的依存关系等。 个变量的关系。
平均数也称为均值,是把某一组数据总体分布是总体中所有观察值所形成的进行算术平均,用以表述某一事物的平均分布。
要朋于表示现象在现象的分配情况、现象 针对一组数据的分布特征,可以从两水平,它在统计中叫做均值。注意简单平总体参数是对总体特征的某个概括性的
个方面来考查它:一是该组数据的集中趁均数和加权平均数的应用。中位数和众数度量。通常有总体平均数(μ)、总体方势,即该组数据的数值向其中心值的靠拢的应用比较简单,结合前边概念学习即的是该组数据的各个数值远离其中心值的趋势和程度。这两个方面反映了数据分
3
差(σ2)、总体比例(π)等。 2.统计量与抽样分布
统计量是根据样本数据计算的用于推断总体的某些量,是对样本特征的某个概括
(3)散点图:散点图也可以反映两程度。二是该组数据的离散程度,它反映可。
(2)差异的度量
性度量。统计量是样本的函数.如样本均样本中具有某种属性的单位数占样本全值、样本方差(s2)、样本比例(p 部单位数的比例,是一个样本统计量,是 随机变量,是可以观察到的。 抽样分布是样本统计量所形成的概率分
样本比例的抽样分布,是描述所有可能样
样本比例的标准误计算公式为量抽样分布的期望值等于被估计的总体参数。无偏估计量的定义。设总体参数为
二、参数估计
0,所选择的估计量为
称
如果E()=θ则
布,如样本均值的分布、样本比例的分布本比例的概率分布。
等。 抽样分布是一种理论分布。 抽样分当样本容量比较大时,样本比例P近似服布构成了推断总体参数的理论基础。 根据统计量来推断总体参数具有某种不确定性。 不同的样本可以计算出不同的统计量值。
(1)样本均值的抽样分布当总体服从正抽样时,P的分布为P~即有X~N(μ,σ2)
N
在不重置
从正态分布,在重置抽样时,P的分布为
为θ的无偏估计量。
参数估计就是用样本统计量去倍计总体χ,P,s2分别是总体均值、总体比例、总
的参数。 体方差的无偏估计量。 用样本统计量来估计总体参数有两种方
法:点估计和区间估计 1.点估计与区间估计
有效性,是指估计量的方差尽可能小。 有效估计量的定义。对同一个总体参数的两个无偏估计量,有更小方差的估计量更
点估计,是用样本统计量的实现值来近似有效。有效估计量。一致性,是指随着样相应的总体参数。 本量的增大,点估计量的值越来越接近被估计总体的参数。一致估计量。样本均值利用随机抽取的样本的统计量值确定能
是总体均值的一个一致估计量。
一般讲,当np≥5,n(1一P) ≥5时,
就可以认为样本容量足够大。随着样本容够覆盖总体参数的可能区间的一种估计3.一个总体均值的区间估计,在对总体
方法。 量的增大,样本比例的方差愈来愈小。 均值进行区间估计时,需要考虑总体是否
以68.73%的置信水平推断总体参数肛的为正态分布、若总体为未知的非正态分布时,只要样本3.统计量的标准误差 总体方差是否已知,用于估
是指样容量n足够大(通常要求n≥30),样本统计量的标准误差也称为标准误,计的样本是大样本还是小样本等情况。 均值仍会接近正态分布。
本统计量分布的标准差。可用于衡量样本
如果总体不是正态分布,当n为小样本时统计量的离散程度。 大样本(n≥30)情况下,当总体方差σ2
45%的置信水平推断总体参数肛的它是用于衡量样本统计量以95.(通常n<>
与总体参数之间差距的一个重要尺度。 从正态分布。 的置信区间为(2)样本比例的抽样分布
比例是指具有某种属性的单位占全部单位数的比重。
总体比例(通常用π表示)是总体中具有某种属性的单位数占全部总体单位数的比例,是一个参数,通常是未知的。 样本比例(通常用P表示)是随机抽取的
4
置信区间为
(1)大样本的估计
样本均值的标准误计算公式为
置信区间为
以99.73%的置信水平推断总体参数肛的
置信区间为
2.评价估计量的标准无偏性,是指估计
大样本情况下,当总体方差σ2未知时, 总体均值μ在1一α置信水平下的置信区
间为
计误差两部分组成的。 三、样本量的确定
在进行参数估计时,样本量要适当。
于0.1。 双侧检验:︳统计量的值︳>临界值,拒
如果总体比例π的值不知道,可以用样本绝原假设
比例s来代替,或者取π=0.5,使得π左侧检验:统计量的值<>
(2)小样本的估计小样本(n<30)情况样本量过大会增加调查费用,花费更多的(1一π)达到最大。第四章 假设检验="">30)情况样本量过大会增加调查费用,花费更多的(1一π)达到最大。第四章>
下,当正态总体的方差σ2已知时,总体人力;样本量过小,样本没有足够的代表复习要点 右侧检验:统计量的值>临界值,拒绝原均值μ在1一α置信水平下的置信区间性,统计量的标准误差会增大,对总体参一、假设检验 假设
数的估计会不准确。 1.估计总体均值时样本量的确定
为小样本(n<>
的置信区间为
误差,则样本量计算公式为:
假设检验是先对总体参数或分布形式提
5.假设检验总结:假设检验依据的是小
出某种假设,然后利用样本信息和相关统概率原理。 否拒绝原来假设的结论。
参数估计是依据样本信息推断未知的总体参数。
值与总奉均值之间存在误差的原因。
验的结果只能是拒绝或不拒绝原来假设,而不能证明原假设成立。统计假设检验的结果不是绝对正确。
在对总体均值进行假设检验时,采用什么
在重置抽样条件下,设E代表允许的估计计量的分布特征去检验这个假定,做出是小概率标准在抽样前依需要确定。假设检
1、为什么要进行假设检验:找出样奉均二、总体均值的假设检验
如果总体标准差盯未知,可以用样本标准2.如何进行假设检验:小概率事件,是检验统计量取决于所抽取的样本是否是总体均值的置信区间是由样本均值和估差s来代替;也可以用试验调查的办法,
大样本还是小样本,还需要考虑总体是否
计误差两部分组成的。4.一个总体比例选择一个初始样本,以该样本的标准差s
一般称之为“显著性水平”,用α表示。显为正态分布、总体方差是否已知等。
的区间估计大样本条件下,当总体比例π作为总体标准差盯的估计值。 著性水平一般取值为α=0.05或α=5% 1 .大样本(n>30)的检验当总体方差已已知时,在1一α的置信水平下,总体比样本量与置信水平成正比,与总体方差成3.假设检验的过程; 知时,总体均值检验的统计量为
例的置信区间为 首先,要提出一个原假设和备择假设。原
2.估计总体比例时样本量的确定
假设(或零假设)H0,备择假设(或备
在重置抽样条件下。设E代表允许的估计选假设)H1
误差,则样本量计算公式为:第二,确定检验统计量。计算z统计量或
计算t统计量
第三,确定显著性水平α.第一类错误和
样本量越大,估计误差就越小,估计的精
总体比例的置信区间是由样本比例和估
当总体方差未知时,总体均值检验的统计
在大样本条件下.当总体比例π在1一α的置信水平下,总体比例的置信
区间为
量为
第二类错误
2.小样本(n<>
第四,根据数据计算检验统计量值和与这知时,总体均值检验的统计量为 4.检验决策准则:
大多数情况下,估计误差的取值一般应小
5
当总体方差未知时,总体均值检验的统计(i=1,2,…,n),将这些数据按x值Pear—son相关系数。
即构成相关表。
量为
三、总体比例的假设检验 生活中经常需要对总体的某些比例进行检验,以证明某种观点能否被否定。
个度量,却不一定意味着X与Y一定有
1.定义:Pearson相关系数是用来度量两因果关系。
个定量变量x和Y检验:相关系数的检验可以用t分布检验
进行。检验的具体步骤如下: 编:两变量之间不存在线性关系(H0:ρ=0)瑟。:两变量之间存在线性关系(H。:ρ≠0)
其次,计算统计量t值
将一一对应的(xi,Yi)如人均可支配收入与消费支出的相关程图所反映出的坐标点的分布状况可以直
2.公
即构成散点图,又称为相关图。通过散点度、身高与体重之间的相关程度等等。 首先确定原假设 观地判断变量之间是否存在相关关系,以式:
一个总体比例的检验,基本形式有以下三及相关的形态、方向。 种: 三、相关的形态(线性相关和非线性双侧检验:H0:π=π0,H1≠π。 左侧检验:H0:π≥π0,Hl#:π<>
相关)
若变量Y与变量x的相关关系表现为线 右侧检验:H0:π≤π0,Hl:π>π0在大样性组合,利用其对应的概率值进行判断,如或绘制的散点图近似地表现为一3.性质:(1)r的取值范围在一1~1,最后,本时,样本比例会近似服从正态分布。检条直线或直线带,则称之为线性相关。 即一1≤r≤1。r>0表明x与Y之间存在正果概率值小于或等于指定的显著性水平验统计量用Z统计量,其基本形式为r<>
接受备择假设,即两变量之间存在制的散点图近似地表现为一条曲线,则称负线性相关关系;r值越接近l(或一l)假设,
第五章 相关分析和回归分析
复习要点
一、相关关系
变量之间存在着密切的联系但又不是严
就越正(或负)相关,越接近0,就越不线性相关关系。否则不能拒绝原假设,可
r=1或r=一1表明2与Y之间为以认为两变量之间不存在显著的相关关 相关。
系。 当两个变量的变动方向总体上相同,即一r具有对称性。x与Y之间的相关系 六、一元线性回归分析 (2)之为非线性相关或曲线相关。
或一个变量减少,另一个变量也相应地减数rxy和y与x之间的相关系数ryx1.相关分析和回归分析的区别:
相关分析旨在测度变量之间关系的密切 即 rxy=ryx。
格的、确定的关系称为相关关系。相关分若两个变量变动的方向总体上相反,即一(3)r数值大小与x和Y的数据原点及程度,它所实用的测定工具就是相关系
析的主要内容包括以下几个方面: 个变量增加的同时,另一个变量随之减少计量尺度无关。改变x和Y的数据原点数。而回归分析则是考察若干自变量X(一)确定现象之间有无关系,这是相关时,两个变量之间的关系属于负相关。 或计量尺度,并不改变r数值大小。 与因变量Y之间的数量变化规律的统计分析的起点; (4)r仅仅是X与Y之间线性关系的一方法和技术。 五、Pearson相关系数 (二)确定相关关系的表现形式; 它不能用于描述非线性关系。这2.回归分析的主要内容: 相关系数是测定变量之间关系密切程度个度量,(三)测定相关关系的密切程度。 r=0只表示两个变量之间不存在(1)从样本数据出发,确定变量之间的的量,它能够以数字准确地描述变量之间意味着, 二、相关表和散点图 并不表明变量之间没有任何关数学关系式; 的相关程度。要反映不同类型变量数据的线性关系,对于两个变量戈和Y,通过观察或实验,相关程度, ( 2)估计回归模型参数; 有不同的相关系数。重点介绍我们可以得到若干组数据,记为(xi,Yi
(5)r虽然是两个变量之间线性关系的一
6
(3)对所确定的关系式进行各种统计检 价可以根据多重判定系数、估计标准误差进而研究某些时间序列随时间变化是否验,并从影响某一特定变量的诸多变量中判定系数R2的取值范围是[0,1],R2越等统计量来完成。判定系数的公式为:有数量上的变化、有无统计上的显著性意找出影响显著的变量。 3.一元线性回归模型
理论回归模型:Y=βo+β1x+ε 估计的回归方程:y=b0+b1x 4.参数的最小二乘估计
用普通最小二乘法得到参数估计值的具
接近于l,表明回归平方和占总变差平方和的比重越大,回归直线于个观测点越接
义。
时间序列数据是指把某一现象的数据按
R2越接近于l,回归直线的拟合程度时间先后顺序排列而行成的序列。
R2越接近于0,回归直线的拟合程度越越好,反之,R2越接近于0,回归直线 二、时间序列的分析指标
的拟合程廑越差。 差。 1.增长量分析指标:发展水平、增长量
多元线性回归中的估计标准误差是对多
估计标准误差是残差平方和的均方根,用公式为:
和平均增长量
期(或时点)的指标数值,说明现象在各个时期(或时点)上所达到的规模和水平,一般用符号Yt(t=1,2,…,n)来表示,
元回归模型中误差项ε(1)发展水平是时间数列中对应某个时
体计算公式为:
5.回归系数的含义:Y=b0+b1x中的
Se来表示,其计算公式为: 估计标准误差是度量各观测点在直线周围分散程度
b0是直线的结局,表示当解释变量为零的一个统计量,反映了实际观测值Yi与 式中,k是自变量的个数。其判定情况其中t表示所对应的时间。
时Y的平均值。回归系数b1是直线的斜回归估计值yi之间的差异程度。若各观同一元线性回归模型。 (2)增长量是指时间数列中两个不同时率,表示解释变量x每增加一个单位,被测点全部落在直线上,则Se=0,此时用多元回归中,t检验和F检验不再等价。期的发展水平之差,反映社会经济现象报解释变量将相应地平均变化b1个单位。 自变量来预测因变量是没有误差的。 线性回归方程的显著性检验主要是检验告期比基期增加或减少的数量,即:增长
因变量同多个自变量的整体线性关系是量=报告期水平一基期水平。6.回归系数的检验和评价 七、多元线性回归分析 增长量又根否显著。回归系数的检验则是对每个回归据基期水平的不同分为逐期增长量和累(1)经济意义检验 利用相关的经济学1.回归模型与回归方程
以判断每个自计增长量。 原理及我们所积累的丰富的经验,对所估多元线性回归模型:Y=βo+β1x1+… 系数分别进行单独的检验,
变量对因变量的影响是杏显著。 计的回归方程的回归系数进行分析与判+βkxk+ε (3)平均增长量是某种社会经济现象在
第六章 时间序列分析 断,看其能否得到合理的解释。 估计的线性经验回归方程:y=bo+b1x1一定时期内平均每期增长(或减少)的绝
复习要点 (2)同归方程的统计检验 +…+bk#xk# 对数量。一般用累计增长量除以增长的时
包括回归方程的显著性检验(F检验)和2.参数的最小二乘估计,使残差的平方 一、时间序列分析的基本概念 期数目计算。 对同归系数的检验(t检验)。一冗线性和最小,即回归分析时,由于只有一个解释变量,因此t检验与F检验的结果是一致的。
时间序列是指反映社会、经济、自然现象2.增长率分析:发展速度、增长速度、
平均发展速度和平均增长速度 时间序列分析是对一定时间间隔(如1年(1)发展速度是表明现象发展程度的动分为l2个月,或l年分为4个季度、或1态相对指标,它是两个不同时期的发展水
(3)回归方程的评价(拟合程度分析)
求解b0,b1,…bk的标准程组,即可得平对比的结果。 判定系数R2的公式为:
到b0,b1,…bk。 某地区居民每季用煤炭消耗量、或某国家计算公式为:发展速度=报告期水平/基
3.评价与检验 多元线性回国方程的评的逐月失业率等),
7
立的,则时间数列各期发展水平是各个影势。
采用移动平均法分析时间数列的长期趋由于采用的基期不同,发展速度可分为环变动,若将其用图形表现,可得一长期趋响因素相加的总和,即有
势,关键在于平均期数或称步长的选择。比发展速度和定基发展速度。环比发展速势线。 Yt=Tt+St+Ct+It
被平均的项数越多,修匀的作度是报告期水平与前一期水平之比,反映b)季节变动(S,Seasonal variation) 乘法模式是假定四种变动因素存在着某一般地讲,
用就越大,但得到的平均数就越少;反之,
了现象逐期发展变化速度;而定基发展速季节变动是时间数列由季节性原因而引种相互影响关系,互不独立。因此,时间
被平均的项数越少,修匀的作用就越小,
度是 报告期水平同某一固定时期水平起的周期性变动,许多经济领域的时间数数列各期发展水平是各个影响因素相乘
而所得的移动平均数就越多。
之比,表明现象在较长时期内总的发展变列都受这种变动的支配。季节变动有三个之积,即
3.指数平滑法
化速度,又称 总速度。 特点:一是季节变动每年重复进行;二是Yt=Tt·Ct·It
指数平滑法是对时间数列由近及远采取
(2)增长速度是表明现象增长程度的动季节变动按照一定的周期进行;三是每个四、长期趋势分析方法
具有逐步衰减性质的加权处理,对移动平
测定长期趋势分析的方法主要有三种: 态相对指标。它是增长量与基期发展水平周期变化强度大体相同。
均法做了改进。
1.回归方程法 相除的结果。公式为:增长速度=增长量c)循环变动(C,Cyclical variation) 一次指数平滑也称简单指数平滑,其公式回归方程法就是利用回归分析方法,将时/基期发展水平.增长速度也根据采用的循环变动是以年度记录的时间数列所表为: 间作为解释变量,建立现象随时间变化的
基期 不同,分为环比增长速度和定基增现出来的某种周期性变动。他与季节变动St+1=αxt+(1-α)St
趋势方程。
长速度。 不同,循环的幅度和周期都可以不很规其中,St表示第t期的一次指数平滑值;
对于直线趋势方程,我们可以建议一般公
增长速度=发展速度一1 则。d)不规则变动(1,Irregular variationXt表示第t期的观测值;
式为:
(3)平均发展速度是一定时期内各个环不规则变动是时间数列除去长期趋势、季α表示平滑系数,0<><>
T=a+bt
使用指数平滑法的关键是确定一个合适比发展速度的平均数,它说明某种现象在式中:T表示时间数列的长期趋势;
的平滑系数α.因为不同的平滑系数α对一个较长时期内逐期平均发展变化的程这种变动分为两种类型。一是严格的随机t表示时间数列中指标所属的时间;
预测结果有直接影响。α取值越接近1时,度。 变动,它是由许多细小的原因综合引起a、b为待定参数。
各期历史数据的作用(4)平均增长速度是各个环比增长速度的,二是不经常出现的某些孤立的或不规参数a、b的确定可以用最小二乘法进行近期数据作用最大,
迅速减弱。实际应用中α的大小需要反复的平均数,但它不是根据各环比增长速度则的、但却是强有力的突发性活动引起
比较确定,确定的依据是α的取值要使计
的。
算得到的各期预测值与实际观察值之间
它说明某种现象在一个较长时期内逐期这四种因素的变化构成事物在一定时期
的误差达到最小。 平均增长变化的程度。 的变动。在对时间数列分析时,首先要明估计。
五、季节变动分析方法
平均增长速度=平均发展速度一l 2.简单移动平均法
季节变动分析的方法很多,主要有:一是
移动平均法是将时间数列的数据逐项移 三、时间数列影响因素分析 不考虑长期趋势的季节指数法;二是考虑
动,依次计算包含一定期数的序时平均一般将社会经济现象时间数列的总变动通常有两种分解形式:加法模式和乘法模
长期趋势的回归方程法消除法。
数,形成一个新的时间数列的方法。通过分解为下列4个主要因素: 式。 1.不考虑长期趋势一季节指数法 这种移动,它消弱或消除了短期偶然性因a)长期趋势(T,Trend) 加法模式是假定四种变动因素是相互独季节指数法是一种通过计算各月(或季)素的影响,从而显示出现象发展的基本趋期水平*100%
长期趋势是指时间数列在一段长时期的
8
的季节指数(又称季节比率),来反映季按其反映对象范围的不同,分为个体指数 三、几种常用的价格指数 际工资。计算公式为: 节变动的一种分析方法。季节比率的计算和综合指数 1.居民消费价格指数 实际工资=名义工资(现价工资)/消费方法是:首先计算出各年同期发展水平的按其表明的经济指标性质的不同,分为数居民消费价格指数是就居民购买消费品价格指数 序时平均数,然后将各年同期平均数与全量指数和质量指数。 和服务的价格变化编制物价指数,反映其时期总平均数对比即得到季节比率。
二、综合指数 对 应的价格水平变动程度。这种价格指
这种计算方法有两个缺陷,第一,没有考
很多情况下,我们会采用加权综合指数方数的编制方法是在众多计量对象中选择
虑长期趋势的影响;第二,季节比率的高
代表品,就 低受各年数值大小的影响。
用以比较不同时期的总变化。 计算平均价格和个体物价指数,而后运用
2.考虑长期趋势一回归方程法消除法
拉氏指数:主张不论是物价指数还是物量加权平均方法逐级 计算类价格指数,直
注意到一般经济现象都存在一定的长期
指数都采用基期作为权数的指数。编制方至总价格指数。
趋势,为准确反映现象随季节变动的特
居民消费价格指数的作用: 征,应先消除长期趋势的影响,消除的方
法:拉氏物价指数
(1)反映城乡居民所购买的生活消费品
步骤如下:
拉氏物量指数
(2)反映通货膨胀状况。通货膨胀的严第一,利用最小二乘法,
主张不论是物价指数还是物量重程度是用通货膨胀率来反映的,它说明第二,用观察值除以拟合值,剔除原时间派氏指数:
指数都采用报告期作为权数的指数,编制数列中的长期趋势;
方法:派氏物价指数第三,计算季节指数。 通货膨胀率一般以居民消费价格指数来
第七章 统计指数
复习要点
一、统计指数的概念和种类 1.统计指数的概念
派氏物量指数
表示。计算公式为:
拉氏指数主要受基期商品(产品)结构的(3)反映货币购买力变动。货币购买力
广义指数:凡是表明社会经济现象总体数
影响,派氏指数主要受报告期商品是指单位货币能够购买到的消费品和服
量变动的相对数都是指数。狭义指数:表
结构的影响。在实际应用中,由于派氏指务,的数量。居民消费价格指数上涨,货
明复杂社会经济现象总体数量综合变动
数要求每期更换权数资料,计算比较麻
币购买力则下降,反之则上升,因此,居的相对数。复杂社会经济现象总体是指那
烦,而拉氏指数的权数固定在基期,在编
民消费价格指数的倒数就是货币购买力些由于各个部分的不同性质而在研究其
制长期连续性指数数列时比较方便,因指数。
数量特征时不能直接进行加总或直接对
此,拉氏指数更得到普遍应用。但是从实(4)反映对职工实际工资的影响。利用
比的总体。
际意义上看,派氏物量指数的解释更符合消费价格指数可以将名义工资转化为实
2.统计指数的种类
现实意义。
9
范文五:统计中级职称考试统计方法复习要点
第一章统计和数据 现象的属性特点,而不能说明具体量的大远高于定性数据。因此,在统计研究中, 统计调查是指根据统计研究预定的
复习要点 小和差异,只有分类特征,没有量的特征;数值型数据有着最广泛的用途。 目的、要求和任务,运用科学的方法,有
一、基本含义 这种只能反映现象分类特征的变量又称 2(观测数据和实验数据 计划、有组织地向容观实际搜集资料的过
1(统计就是用来处理数据的,它是为分类变量,分类变量的观察结果就是分 观测数据是对客观现象进行实地观程。通过统计调查得到的数据,一般称为关于数据的一门学问。 类数据。如果类别具有一定的顺序,这样测所取得的数据,在数据取得的过程中一观测数据。
2(统计学是用以收集数据,分析数的变量称为顺序变量,相应的观察结果就般没有人为的控制和条件约束。在社会经 实验法是通过实验法得到的数据就据和由数据得出结论的一组概念、原则和是顺序数据。 济问题研究中,观测是取得数据最主要的是实验数据。运用实验法要注意的是,首方法。统计分析数据的方法大体上可分为 分类变量没有数值特征,所以不能对方法。 先,实验组和对照组的产生应当是随机描述统计和推断统计两大类。 其数据进行数学运算。由此可见,定性数 实验数据一般是在科学实验环境下的,研究对象的不同单位应当被随机地分
描述统计星研究数据搜集、处理和描据只能用来区分事物,而不能用来表明事取得的数据。在实验中,实验环境是受到配到实验组或对照组,而不应是经过有意述的统计学方法。其内容包括如何取得研物之间的大小、优劣关系。 严格控制的,数据的产生一定是某一约束识的挑选的。其次,实验组和对照组还应究所需要的数据。如何用图表形式对数据 顺序变量比分类变量向前进了一步,条件下的结果。自然科学研究中所用的数当是匹配的,也就是研究对象的背景资料进行处理和展示,如何通过对数据的综它不仅能用来区分客观现象的不同类别,据多为实验数据。 应当是大体相同的,至少不要差异太大。 合、概括与分析,得出所关心的数据特征。 而且还可以表明现象之间的大小、高低、 三、数据的来源 不论是统计调查还是实验,所搜集的
推断统计则是研究如何利用样本数优劣关系。显然,顺序数据的功能比分类 从使用者的角廑看。统计数据资料的数据都是原始数据,这是统计数据最基本据来推断总体特征的统计学方法,内容包数据要强一些,对事物的划分也更精细了来源主要有两种渠道:一种是通过直接的的来源。2(次级数据。次级数据(第二括参数估计和假设检验两大类。 一些。 调查或实验获得的原始数据,这是统计数手数据)是指由其他人搜集和整理得到的
3(统计的应用。 (2)具有明确的数值含义,不仅能据的直接来源,一般称之为原始或第一手统计数据,这种自他人调查整理基础上的
几乎所有的领域都应用统计,但是在分类而且能测量出来具体大小和差异的统计数据; 数据我们把它称为数据的间接来源。 应用中应注意分辨被误用与滥用的现象。 变量就是定量变量,也称为数值变量,定 另一种是别人调查的数据,并将这些 数据的间接来源常用的有以下一些:
二、数据类型 量变量的观察结果成为定量数据。 数据进行加工和汇总后公布的数据,通常?公开出版的统计数据,主要来自官方的
统计数据是对客观现象特征的反映, 作为统计研究的主要资料,数值型数称之为次级数据或第二手间接的统计数统计部门和政府、组织、学校、科研机构。而由于客观现象的复杂性,在反映这些现据的特征在于它们都是以数值的形式出据(一切间接的统计数据都是从原始的、?尚未公开发表的统计数据,如各企业的象特征时可从不同的角度进行采集,从而现的,有些数值型数据只可以计算数据之第一手数据过渡而来的。 经营报表数据、专业调查咨询机构未公开得到不同类型的数据。 间的绝对差(绝对距离),而有些数值型 1(原始数据。搜集数据最基本的形发布的调查结果数据。
1(定性变量(数据)与定量变量(数数据不仅可以计算数据之间的绝对差,还式就是进行统计调查或进行实验活动,统 需要注意的是,如果公开引用未公开据) 可以计算数据之间的相对差(相对距离)。计调查或进行实验就是统计数据的直接发表的数据需要征得数据所有者的同意,
(1)定性变量的观察结果称为定性显然,数值型数据的计量功能要远大于前来源。 同时要为自己发布的数据负责。 数据。这类数据的最大特点是它只能反映面介绍的两种定性数据,其计量精度也远
1
在应用时要注意:?是否了解并正确 抽样调查是一种非全面调查,它是按 统计报表是按照国家统一规定的调 定性效据包括分类数据和顺序数据,理解了间接数据中变量的含义、计算口照随机原则从总体中抽取一部分单位作查要求与文件(指标、表格形式、计算方通常可以用频数分布表和图形来描述。 径、计算方法,以防止误用、错用他人的为样本进行观察研究,以抽样样本的指标法等)自下而上地提供统计资料的一种调 1(生成频数分布表 数据。?引用间接数据时要注明数据来去推算总体指标的一种调查。随机原则要查方式。 定性数据本身就是对事物的一种分源,尊重他人的劳动成果和知识产权。 求所有调查单位都有一定的概率被抽取。 按照报送范围,统计报表分为全面报类,因此,只要先把所有的类别都列出来,
四、统计调查 抽样调查具有的特点:第一,样本单表和非全面报表。全面报表要求调查对象然后统计出每一类别的频数,就得到一张
统计调查是根据调查的目的与要求,位按随机原则抽取,排除了主观因素对选种的每一个单位均要填报,非全面报表则频数分布表。频数分布表中落在某一特定运用科学的调查方法,有计划、有组织地取样本单位的影响。第二,能够根据部分只要求一部分调查单位填报; 类别的数据个数称为频数。通过频数分布搜集统计数据资料的过程。 调查的实际资料对调查对象的总体的数 按照报送周期,统计报表主要有月可以观察不同类型数据的分布情况。
1(普查是专门组织的一次性的全面量特征进行推断,从而达到对调查总体的报、季报、年报组成,月报内容简单,时 注意运用Excel生成频数分布表的过调查,用来调查属于一定时点上或一定时认识。第三,在抽样调查中会存在抽样误效性强,年报则内容比较全面。 程。
期内的社会现象总量。它适于搜集某些不差,但是这个误差可以事先计算并加以控 统计报表的内容包括表式和填表说 2(定性数据的图形表示 能或不适宜于定期的全面统计报表搜集制。 明。 (1)饼图:又称圆饼图、圆形图等,的统计资料,以摸清重大的国情、国力。 抽样调查既能节省人力、物力、财力, 4(重点调查:是在调查对象中选择它是利用圆形及圆内扇形面积来表示数普查的特点为:它是一种全面调查,具有又可以提高资料的时效性,而且能取得比一部分重点单位进行的一种非全面调查。值大小的图形。饼图主要用于总体中各组资料包括范围全面、详尽、系统的优点;较正确的全面统计资料,具有许多优点。这些重点单位虽然数目不多,但它们具有成部分所占比重的研究。 它是一次性的专门调查,因为普查的工作抽样调查是一种非全面的、一次性的或经所研究现象的总量在总体总量中占据绝 (2)条形图:条形图是用宽度相同量大,耗资也多,时间周期较长,一般不常性的专门调查,这种调查方法在市场经大部分的特点。 的条形的高度或长度来表述数据多少的宜经常举行。 济条件下,使用非常广泛。 5(典型调查:是一种非全面的专门图形,用于观察不同类别数据的多少或分
目前,我国通过普查进行的统计调查 抽样两种主要方法:概率抽样和非概调查,它是根据调查的目的与要求,在对布情况(绘制时,各类别可以放在纵抽,内容和时间周期已经规范化、制度化,具率抽样。 被调查对象进行全面分析的基础上,有意也可以故在横轴。 体包括: 概率抽样是根据一个已知的概率随识地选择若干具有典型意义的或有代表 (3)环形图:环形图可以用来比较
(1)人口普查。每10年进行一次,机选取被调查者。常用的概率抽样形式性的单位进行的调查。 不同变量之间的结构差异。 逢"0"的年份进行; 有:简单随机抽样、分层抽样、整群抽样 第二章数据描述 二、定量数据用图表展示(
(2)农业普查,每l0年进行一次,和系统抽样。 复习要点 1(生成频数分布表 逢"7"的年份进行; 非概率抽样是没有完全按照随机原 本章重点介绍如何简单地利用统计 生成定量数据的频数分布表时,首
(3)经济普查,2004年进行了中国则选取样本单位。 图表和少数数据来概括某些事物的基本先,要对数据进行分组。以能够适当观察第一次经济普查。 3(统计报表 特征。 数据的分布特征为准。一般的分组个数在
2(抽样调查 一、定性数据的图表展示 5-15之间。
2
其次,要确定组距。所谓组距是指每 应特别注意各种图表的生成方式和布特征的不同侧面,从不同视角来分析统 极差又称全距,是一组数据中最夫的个组变量值中的最大值与最小值之差。若运用。 计数据,以达到分析和运用统计数据的目标志值和最小的标志值之差。它的特点是将最大值称为上限,最小值称为下限,则 三、用统计表来表示数据 的。 简单直观,但是容易受数据中极端值的影组距等于上限与下限之差,即"组距,上 统计表是一种用密集的形式归纳数 1(定性数据的数字特征 响,因此,不能准确地描述数据的分散程限一下限"。确定组距,一是要考虑各组据的方法。它主要是利用行和列中的数据 对定性数据的集中趋势常用的方法度。
的划分是否能区分总体肉部各个组成部来表述现象特征。人们利用统计表主要出就是计算比例、百分比、中位数和众数。 方差是将各个变量值和其均值离差分的性质差别,二是要能准确地清晰地反于两种目的:一是在文章中使用它以支持 中位数,是数据按照大小排列之后位平方的品军数,它反映了样本中各个观测映总体单位的分布特征。 自己的观点;二是利用它组织数据。 于中间的那个数(如果样本重为奇数),值到其均值的平均离散程度。标准差是方
在确定组距时,在研究的现象变动比 统计表一般由五个部分组成,即表或者中间两个数目的平均(如果样本重为差的平方根,它更具量纲性,而且与变量较均匀的情况下,可以采用等距分组;而头、行标题;列标题、数字资料和表外附偶数)。 值的计量单位相同,使用的范同更广泛。 当研究的现象变动很不均匀时,一般采用加构成。 众数,就是数据中出现次教或出现频 离散系数也称为便变异系数、标准差不等距分组。 表头应该放在表的上方,它说明的是率最多的数值,在定性数据中,由于记录系数,足将一组数据的标准差除以其均
最后,统计出各组的频数及频数分布表的主要内容; 的是频数,因此众数用得多些。 值,用来测度离散程度的相对数。 表。在统计各组频数时,恰好等于某一组 行标题和列标题一般放在表的第一 2(定量数据的数字特征 标准分数也称作标准化值或Z分数,的组限时,则采取上限不在内的原则,即行和第一列,它表示的是所研究的问题类 常用的反映定量数据特征的统计量是变量值与其平均数的离差除以标准差将该频数计算在与下限相同的组内。 别的名称和指标名称; 有: 后的值,用以测定某一数据在该组数据中
2。定量数据的图形表示 表的其余部分是具体的数字资料: 反映数据集中趁势的水平度量:平均的相对位置。
(1)直方图:用横坐标代袁变量分 表外附加通常放在统计表的下方,用数、中位数、众数和分位数等; 第三章 参数估计 组,纵坐标代表各变量值出现的频数,这来说明资料来源、指标注释和必要的说明 反映数据离散程度的差异度量:极复习要点 样,各组与相应的频数就形成了一个矩等内容。 差、四分位差、标准差和方差。 一、抽样分布 形,即直方同。 通常情况下,统计表的左右两边不能 (1)水平的度量 1(总体分布与总体参数
(2)折线图:折线图是利用线段的封口。 平均数也称为均值,是把某一组数据总体分布是总体中所有观察值所形成的升降来说明显向变动的一种统计图,它主 四、用数字来概括数据 进行算术平均,用以表述某一事物的平均分布。 要朋于表示现象在现象的分配情况、现象 针对一组数据的分布特征,可以从两水平,它在统计中叫做均值。注意简单平总体参数是对总体特征的某个概括性的在时间上的变化和两个现象之间的依存个方面来考查它:一是该组数据的集中趁均数和加权平均数的应用。中位数和众数度量。通常有总体平均数(μ)、总体方关系等。 势,即该组数据的数值向其中心值的靠拢的应用比较简单,结合前边概念学习即差(σ2)、总体比例(π)等。
(3)散点图:散点图也可以反映两程度。二是该组数据的离散程度,它反映可。 2(统计量与抽样分布 个变量的关系。 的是该组数据的各个数值远离其中心值 (2)差异的度量 统计量是根据样本数据计算的用于推断
的趋势和程度。这两个方面反映了数据分总体的某些量,是对样本特征的某个概括
3
性度量。统计量是样本的函数(如样本均样本中具有某种属性的单位数占样本全样本比例的标准误计算公式为量抽样分布的期望值等于被估计的总体值、样本方差(s2)、样本比例(p)等。 部单位数的比例,是一个样本统计量,是参数。无偏估计量的定义。设总体参数为构成统计量的函数中不能包括未知因素。 随机变量,是可以观察到的。
0,所选择的估计量为如果E()=θ则抽样分布是样本统计量所形成的概率分样本比例的抽样分布,是描述所有可能样
布,如样本均值的分布、样本比例的分布本比例的概率分布。 二、参数估计 称为θ的无偏估计量。 等。 抽样分布是一种理论分布。 抽样分当样本容量比较大时,样本比例P近似服参数估计就是用样本统计量去倍计总体χ,P,s2分别是总体均值、总体比例、总布构成了推断总体参数的理论基础。 从正态分布,在重置抽样时,P的分布为的参数。 体方差的无偏估计量。 根据统计量来推断总体参数具有某种不用样本统计量来估计总体参数有两种方有效性,是指估计量的方差尽可能小。 确定性。 不同的样本可以计算出不同的在不重置法:点估计和区间估计 有效估计量的定义。对同一个总体参数的统计量值。 1(点估计与区间估计 两个无偏估计量,有更小方差的估计量更抽样时,P的分布为P,(1)样本均值的抽样分布当总体服从正点估计,是用样本统计量的实现值来近似有效。有效估计量。一致性,是指随着样态分布时,样本均值一定服从正态分布,相应的总体参数。 本量的增大,点估计量的值越来越接近被即有X,N(μ,σ2)N 区间估计,是根据估计可靠程度的要求,估计总体的参数。一致估计量。样本均值
利用随机抽取的样本的统计量值确定能一般讲,当np?5,n(1一P) ?5时,是总体均值的一个一致估计量。
够覆盖总体参数的可能区间的一种估计就可以认为样本容量足够大。随着样本容3(一个总体均值的区间估计,在对总体
方法。 量的增大,样本比例的方差愈来愈小。 均值进行区间估计时,需要考虑总体是否
以68(73%的置信水平推断总体参数肛的3(统计量的标准误差 若总体为未知的非正态分布时,只要样本为正态分布、总体方差是否已知,用于估
统计量的标准误差也称为标准误,是指样容量n足够大(通常要求n?30),样本计的样本是大样本还是小样本等情况。
本统计量分布的标准差。可用于衡量样本均值仍会接近正态分布。 (1)大样本的估计 置信区间为 统计量的离散程度。 如果总体不是正态分布,当n为小样本时大样本(n?30)情况下,当总体方差σ2
以95(45%的置信水平推断总体参数肛的在参数估计中,它是用于衡量样本统计量(通常n<>
与总体参数之间差距的一个重要尺度。 从正态分布。 的置信区间为
样本均值的标准误计算公式为(2)样本比例的抽样分布 置信区间为
比例是指具有某种属性的单位占全部单以99(73%的置信水平推断总体参数肛的位数的比重。
大样本情况下,当总体方差σ2未知时,总体比例(通常用π表示)是总体中具有
总体均值μ在1一α置信水平下的置信区置信区间为 某种属性的单位数占全部总体单位数的
间为比例,是一个参数,通常是未知的。 2(评价估计量的标准无偏性,是指估计
样本比例(通常用P表示)是随机抽取的
4
计误差两部分组成的。 于0(1。 告期比基期增加或减少的数量,即:增长
三、样本量的确定 如果总体比例π的值不知道,可以用样本量,报告期水平一基期水平。增长量又根
在进行参数估计时,样本量要适当。 比例s来代替,或者取π,0(5,使得π据基期水平的不同分为逐期增长量和累(2)小样本的估计小样本(n<30)情况样本量过大会增加调查费用,花费更多的(1一π)达到最大。 计增长量。="" 下,当正态总体的方差σ2已知时,总体人力;样本量过小,样本没有足够的代表第六章="" 时间序列分析="" (3)平均增长量是某种社会经济现象在均值μ在1一α置信水平下的置信区间性,统计量的标准误差会增大,对总体参复习要点="">30)情况样本量过大会增加调查费用,花费更多的(1一π)达到最大。>
数的估计会不准确。 一、时间序列分析的基本概念 对数量。一般用累计增长量除以增长的时
1(估计总体均值时样本量的确定 时间序列是指反映社会、经济、自然现象期数目计算。
在重置抽样条件下,设E代表允许的估计的数据按时间先后顺序记录行成的数列。 2(增长率分析:发展速度、增长速度、为小样本(n<30)情况下,当总体方差σ2误差,则样本量计算公式为:时间序列分析是对一定时间间隔(如1年平均发展速度和平均增长速度>30)情况下,当总体方差σ2误差,则样本量计算公式为:时间序列分析是对一定时间间隔(如1年平均发展速度和平均增长速度>
的置信区间为年)所发生的行为(如每月产品销售额、态相对指标,它是两个不同时期的发展水
某地区居民每季用煤炭消耗量、或某国家平对比的结果。
的逐月失业率等),进行动态的跟踪分析,计算公式为:发展速度,报告期水平/基
如果总体标准差盯未知,可以用样本标准进而研究某些时间序列随时间变化是否期水平*100% 总体均值的置信区间是由样本均值和估差s来代替;也可以用试验调查的办法,有数量上的变化、有无统计上的显著性意由于采用的基期不同,发展速度可分为环计误差两部分组成的。4(一个总体比例选择一个初始样本,以该样本的标准差s义。 比发展速度和定基发展速度。环比发展速 的区间估计大样本条件下,当总体比例π作为总体标准差盯的估计值。 时间序列数据是指把某一现象的数据按度是报告期水平与前一期水平之比,反映已知时,在1一α的置信水平下,总体比样本量与置信水平成正比,与总体方差成时间先后顺序排列而行成的序列。 了现象逐期发展变化速度;而定基发展速例的置信区间为正比,与允许的估计误差的平方成反比。 二、时间序列的分析指标 度是 报告期水平同某一固定时期水平
2(估计总体比例时样本量的确定 1(增长量分析指标:发展水平、增长量之比,表明现象在较长时期内总的发展变
在重置抽样条件下。设E代表允许的估计和平均增长量 化速度,又称 总速度。
误差,则样本量计算公式为:(1)发展水平是时间数列中对应某个时(2)增长速度是表明现象增长程度的动在大样本条件下(当总体比例π未知时,
期(或时点)的指标数值,说明现象在各态相对指标。它是增长量与基期发展水平 在1一α的置信水平下,总体比例的置信
个时期(或时点)上所达到的规模和水平,相除的结果。公式为:增长速度,增长量区间为
一般用符号Yt(t,1,2,…,n)来表示,/基期发展水平(增长速度也根据采用的 其中t表示所对应的时间。 基期 不同,分为环比增长速度和定基增样本量越大,估计误差就越小,估计的精(2)增长量是指时间数列中两个不同时长速度。 度就越高。估计洪差由使用者预先确定。 期的发展水平之差,反映社会经济现象报增长速度,发展速度一1 总体比例的置信区间是由样本比例和估大多数情况下,估计误差的取值一般应小
5
T,a,bt α表示平滑系数,0<><1>1>
式中:T表示时间数列的长期趋势; 使用指数平滑法的关键是确定一个合适比发展速度的平均数,它说明某种现象在节变动和循环变动之后余留下来的变动。
t表示时间数列中指标所属的时间; 的平滑系数α(因为不同的平滑系数α对一个较长时期内逐期平均发展变化的程这种变动分为两种类型。一是严格的随机
a、b为待定参数。 预测结果有直接影响。α取值越接近1时,度。 变动,它是由许多细小的原因综合引起
参数a、b的确定可以用最小二乘法进行近期数据作用最大,各期历史数据的作用(4)平均增长速度是各个环比增长速度的,二是不经常出现的某些孤立的或不规
迅速减弱。实际应用中α的大小需要反复的平均数,但它不是根据各环比增长速度则的、但却是强有力的突发性活动引起比较确定,确定的依据是α的取值要使计计算的,而是根据平均发展速度计算的。的。 算得到的各期预测值与实际观察值之间它说明某种现象在一个较长时期内逐期这四种因素的变化构成事物在一定时期估计。 的误差达到最小。 平均增长变化的程度。 的变动。在对时间数列分析时,首先要明2(简单移动平均法 五、季节变动分析方法 平均增长速度,平均发展速度一l 确的是这四种类型因素变动的构成形式,移动平均法是将时间数列的数据逐项移季节变动分析的方法很多,主要有:一是
三、时间数列影响因素分析 即它们是如何结合及相互作用的。对此,动,依次计算包含一定期数的序时平均不考虑长期趋势的季节指数法;二是考虑一般将社会经济现象时间数列的总变动通常有两种分解形式:加法模式和乘法模数,形成一个新的时间数列的方法。通过长期趋势的回归方程法消除法。 分解为下列4个主要因素: 式。 这种移动,它消弱或消除了短期偶然性因1(不考虑长期趋势一季节指数法 a)长期趋势(T,Trend) 加法模式是假定四种变动因素是相互独素的影响,从而显示出现象发展的基本趋季节指数法是一种通过计算各月(或季)长期趋势是指时间数列在一段长时期的立的,则时间数列各期发展水平是各个影势。 的季节指数(又称季节比率),来反映季变动,若将其用图形表现,可得一长期趋响因素相加的总和,即有 采用移动平均法分析时间数列的长期趋节变动的一种分析方法。季节比率的计算
势,关键在于平均期数或称步长的选择。方法是:首先计算出各年同期发展水平的势线。 Yt,Tt,St,Ct,It
一般地讲,被平均的项数越多,修匀的作序时平均数,然后将各年同期平均数与全b)季节变动(S,Seasonal variation) 乘法模式是假定四种变动因素存在着某
用就越大,但得到的平均数就越少;反之,时期总平均数对比即得到季节比率。 季节变动是时间数列由季节性原因而引种相互影响关系,互不独立。因此,时间
被平均的项数越少,修匀的作用就越小,这种计算方法有两个缺陷,第一,没有考起的周期性变动,许多经济领域的时间数数列各期发展水平是各个影响因素相乘
而所得的移动平均数就越多。 虑长期趋势的影响;第二,季节比率的高列都受这种变动的支配。季节变动有三个之积,即
3(指数平滑法 低受各年数值大小的影响。 特点:一是季节变动每年重复进行;二是Yt,Tt?Ct?It
指数平滑法是对时间数列由近及远采取2(考虑长期趋势一回归方程法消除法 四、长期趋势分析方法 季节变动按照一定的周期进行;三是每个具有逐步衰减性质的加权处理,对移动平注意到一般经济现象都存在一定的长期测定长期趋势分析的方法主要有三种: 周期变化强度大体相同。 均法做了改进。 趋势,为准确反映现象随季节变动的特1(回归方程法 c)循环变动(C,Cyclical variation) 一次指数平滑也称简单指数平滑,其公式征,应先消除长期趋势的影响,消除的方回归方程法就是利用回归分析方法,将时循环变动是以年度记录的时间数列所表为: 法很多,这里仅介绍回归方程法消除法。 间作为解释变量,建立现象随时间变化的现出来的某种周期性变动。他与季节变动St,1,αxt,(1,α)St 步骤如下: 趋势方程。 不同,循环的幅度和周期都可以不很规其中,St表示第t期的一次指数平滑值; 第一,利用最小二乘法,求出回归拟合值; 对于直线趋势方程,我们可以建议一般公则。d)不规则变动(1,Irregular variation)Xt表示第t期的观测值; 第二,用观察值除以拟合值,剔除原时间式为:
6
数列中的长期趋势; 方法:派氏物价指数通货膨胀率一般以居民消费价格指数来第三,计算季节指数。 表示。计算公式为:
第七章 统计指数
复习要点
派氏物量指数 一、统计指数的概念和种类
拉氏指数主要受基期商品(产品)结构的1(统计指数的概念 (3)反映货币购买力变动。货币购买力
影响,派氏指数主要受报告期商品(产品)广义指数:凡是表明社会经济现象总体数是指单位货币能够购买到的消费品和服
结构的影响。在实际应用中,由于派氏指量变动的相对数都是指数。狭义指数:表务,的数量。居民消费价格指数上涨,货
数要求每期更换权数资料,计算比较麻明复杂社会经济现象总体数量综合变动币购买力则下降,反之则上升,因此,居
烦,而拉氏指数的权数固定在基期,在编的相对数。复杂社会经济现象总体是指那民消费价格指数的倒数就是货币购买力
制长期连续性指数数列时比较方便,因些由于各个部分的不同性质而在研究其指数。
此,拉氏指数更得到普遍应用。但是从实数量特征时不能直接进行加总或直接对(4)反映对职工实际工资的影响。利用
际意义上看,派氏物量指数的解释更符合比的总体。 消费价格指数可以将名义工资转化为实
现实意义。 2(统计指数的种类 际工资。计算公式为:
三、几种常用的价格指数 按其反映对象范围的不同,分为个体指数实际工资,名义工资(现价工资)/消费
1(居民消费价格指数 和综合指数 价格指数
居民消费价格指数是就居民购买消费品按其表明的经济指标性质的不同,分为数
和服务的价格变化编制物价指数,反映其量指数和质量指数。
对 应的价格水平变动程度。这种价格指 二、综合指数
数的编制方法是在众多计量对象中选择很多情况下,我们会采用加权综合指数方
代表品,就 这些代表品采集价格数据、法将多个现象的变化综合得到一个指数,
计算平均价格和个体物价指数,而后运用用以比较不同时期的总变化。
加权平均方法逐级 计算类价格指数,直拉氏指数:主张不论是物价指数还是物量
至总价格指数。 指数都采用基期作为权数的指数。编制方
居民消费价格指数的作用:
法:拉氏物价指数 (1)反映城乡居民所购买的生活消费品
价格和服务项目价格的变动趋势和程度;
拉氏物量指数 (2)反映通货膨胀状况。通货膨胀的严
派氏指数:主张不论是物价指数还是物量重程度是用通货膨胀率来反映的,它说明
指数都采用报告期作为权数的指数,编制了一定时期内商品价格持续上升的幅度。
7
π0>