饭1唇叔,
探索与争鸣
论统计学的定义
一
,人们
缝计从远古代起.就是人认识社会, 了解社会的工具.到了现代,更是人认识 社会,了解社会不缺少的工具之.小到. 家庭资的用.大刊航天设备的研制.都离 不开统计这个最基本,最普通,单又是最 复杂的工具.统计已经在我们社会活的 方面面得到最普遍的应用.半个世纪以来. 计学有了长足的进步.从述到分析.从 单项分析到元分析,从手算到由计算机的 运用.使统计从
门与多学科(尤其是应科学,生物科学, 人文科学,计算机科学,融学,管理科学)相 影响,以致容深广的科学.它许多实 用科学和软科的数量化起着中心的作用. 所以统方法对现代社会的各个部门的管 理,筹和展都是不可缺少和重要工具. 调查研究工商,文教,卫生,济,心 理,传播,金融许多部门和学科的重要工作 和
调查研究设计与析更加科学,更深入,并 且更约.从需要到掌和恰当运用,这中 间还要有个过程.有人说:.统计学容易学", (她)只停留在满足于描述性计低级阶 段,也就是他们把统这一概念简单地解 为大量数据料的收集以及对这些数
些简单的运算(如求和,求均效,求百分比 等)或用图表,表格等形式它们表出来. 其实这些工作仅仅统计学工作的要部 分.而更的人说:.统计学不容易学". 此话一点不假.统计学是窥穗I现实奥秘的 具.统看似容易,实则不容易.由于统计 的础工是收集数字,加工数字,引用数 字.而收集数字,加工数字看似容易,但加 数字的加工技术就难易程序不一样了.这 也就是有人说统计学容易,有人说
其实马克早就说:"一种科学只有在 成功地运数学时.才算达了真正完善的 地步."统计学是真正运用数学,并且是成功 地运用学的数经济类学科之一.马思 本人十分重视运用统计来观察幻奠测的社 会象.他的不朽名
统学是一门方论学科,是探讨如 何
门技术.
数字,但正如我在前面所介绍的.这仅 是统学的原始意义.计学现在已经远远 超出了这一范暖,它已经发展成为广泛应用 于营管,社会科学,自然科,济学等 领域的科学分析方法.但是目前在关于 计,统计学定方面还没有形成统一的
探索与争鸣
由于没形统一的定义,使得我们前教 统学,学统计学的人不知道统计学是什么. 因,统学界当前最主要工作应该是给 统计学下一个合理,恰当,包
二,目
要想给统计学下个合理,恰当,包统 计学科全部内容的科学的定义.首先要从定 义谈起.社会经济计学界,现在通称的 计包括三不同的含义,即统作,统计 资料和统计学——统计学.统计工作的 定义是指在社生产的发展中为适应国家管 理的需要,从人们社会活的实践中产生 来的.它是指按照科学的原理和方法,搜集, 理和分有关客观现象字资料的工作 过程.统计资料的定义是指统工作的成 果.它是反映大量现象特征和规律性的数 字资料,它直接反着客现象散量方面的 特征与相互关系.它是指通
述如何从总上研究观现象数量面的特 征相互关系的理论与方法,是阐述统计的 理论和方法的科学.在这里统计学的定太 统,直观,也欠准确,不科学,没有括统 计学所究全部内容.什么说欠 确,不科学,没有包括统计所研究的内 容?因为,数理统计学也是统计学的一个 技,数理统计学有一部分内容是专门讲在总 体情况不了解的前提下,利样技术对总 体征进行推断.目前.还有抽样技术这 门课,也是统计学大家庭一员.而社 会经济统计学界,统计学所下的定义却是 阐述如何从总体上研究客观现象数量方的 特征与相互关系的理论与方法,它不包括 样本推断总体这部.如果按目前的定义解 释统学所的范围,则数理统计学是不 包括在统计学这个学科内的,而际上数理 统
科.比如,
部分内容,抽样技术是数理统计学的一 部分内容.如果按前在社会经济统计学 的定义解释统计学所究的范围,则数理统 计是不包括在统计学这个学科内.这显 然是一个不准确,不科学的义.果按照 统计学是阐述统计的理论方法的科学之说 来释什么是统计学,则么是统计还需要 先解释.
欠准,不十分科.计学科学的定义应 该包
我们常说:"学计,统计,用计".这 里的统计一词就包括了统计学,统计工作,统 计资.问题是科学是系统化的理论.理 论思维是一用概念的"艺术";在形式 上是以规律,原理,范围等组成知识体系来 反映现实的,它的细胞是概念,不是.词 语可多义,概念则必须一义,明确.否则就 不能证理论维前后的一贯一性.我们 都知道理论与实践的关系,科理论来源于 实践.反过来又指实践,为实践服务.理论 包涵有践的份,但它更是同类实践活动 的概括和总,它更应具
事实上,统计学仅仅括描述性计 部分.还包括推断统计部分.统计学应该包 括对量数据料提供收集技术以及对些 数据一些简单的运算(求和,求平均数, 百分比)或用图表,表格等形式把它们 示出来的方法,还应包括怎样设计试验,采集 数以及怎样对的数据进行分析,推断 等其它许多工作.统学的义应该把这些 容包括进去,并用精练的语言把它们表述 来.目前,社会经济统计学界对计学的 定义是没有做到这一点.那数统计学界 啊?数理统计学界对统计学又是样定义的
义,统计学
探索与争鸣
理,析和推断的学.涵概了杜会经济 统计学
我们再看一看词典统计的义.商务 书馆出版.1980年8月第一版,1986年11 月北京第次印的(华词典)对统计一词 是样定义的:?统计是指对某现象 的数据的搜集,整理,算和分等.也指获 得的统计资料.特指杜会经统计,叩对政 治,经济,文化等各种杜会现象的数量方面进 行搜集,整理和析研究.0总括地计算. 上海辞书出版社1980年一版.1988年1 月第次印刷的(辞海)(1979年版)的缩印 本对统是这样定义的:?指统计资料,即反 大量现象的特征和律性的数字资料.? 统作,即搜集,整理和分析坑计资料并 进行推论的工
从目前对计学的行定义和词典对境 计学的定义来,对统计学自身定义步而 缺,对统计一词的定义多而全.而在所有关 于统计的定义提到样一段话:'统计是 对一现象有关数据的收集,整理和 析'.即然统学是统计方面的学,它必然 也是提供科
集,整理和分
我们把目前对计的定,包括(新华词 典)和(辞海>对统计一词的定义结到一起 来考虑,就可以给统计这个词下个比较贴 切或切合实际的定义了.统计定义应 该是对与我们所关心的一理象有关联的数 据先进行搜集,然后对收集到数据进行整 理和加工,在整理和加工的基础之上再进行 计算,整理加工和结果中进行分析研 究.但这个定义似乎不完整,还缺一点点 东西,者说还应该加一句话.这一句话应 提出具体的应对策略来.为什么说还缺这 样一句话,
.
,
定义谈起.
(新华同典)统和计这两个是这样定 义的:统:?总起来,总括.0事物连续关 系.计:?计算.?主意,略.0计划, 算.?测量或计算数,间等的仪器.<辞 )对统字的定:?丝绪的总柬.?一脉相 承系统.如:传统;血统;道统.0统一. ?纲纪;翻.@主管;练理.@从全局出 发;全面对计字的定义如:?结算;算靖. 0计簿.簿.就是记事的本子.0计议; 量@计谋;策略.根据(新华词典)和(辞 海)
来.总括,主管.综理,全局出.一脉相承 的系统.而计哪?就是计算,出主意.出 谋;搞划.作打算;并根据出主意和谋, 搞的计划和,提出具体的应对策来. 这样把统计的定义和'新华词典)及'辞海)对 统和计这两个字的定义综合到一起,我 得到了对计一词的比较准确的定义,也是 比较全面和切的定.即统计是指我 们所关心的某一现象有关联的数据先进搜 集,然后进行整理和加工,整理和加工的基 础之上再进行计算,在整,加工和计算结果 中进行分析研究.井在析和研究结
三,薹I毫计学
综上可述.我们可知遘,什么是统计学? 统计学就是研究对与们所关心的某一现象 有关联的数据先进行搜集技术和方接.然 后对收到的数据提供科学的整理和加工 术,整理和加工的基础之上再进行理,有 效,科学的计算,在整理,加工和算结果中 进行分研究,并在分析和研究论的基础 之上,提出具体的对策
(者单位:
浅谈统计学中的变量
浅统计学
雷健敏
{南财贸院
iiiiii簟ii—i
摘:变量是计
进行了探索,以期
使其日臻完善.
关键词:变量;标志;指标
中图类号:G4233
尽到目前
统计教建设历经风雨,教材容几经变化,但几乎 所有教材中都对变量的描述.变量属统计学几个 基本范
一
般义上的变
天内气温是个变那么计学中讲的变量该如 何
但觉得没能
了量统计学科
第一:"统计中的变是指变的效量标志." (<
第种:"
标.(健t经
第三:"在统计中,我们说明现某种特征的概 念称为变量."(<统计学>修订版,袁卫,贾俊平等编
以上第一是绝大效教科书中的现点,笔者也曾 多按此观点给学生过变量概念,但结果却感刊越来 越不艟"自圆其说".上课时常有学:.标是不是变 量?,品标是不是也可作为变量P……诸如类的 问题,我与学生一起讨论,甚至争论过,但一直未
究竟谈如何解统计学中变量呢?我为如果按 第一观点把变量局限于.可变的效量标志来理解. 免太过于狭隘.教师若以此思想去指导教学,难免陷 ^不自圆其说的境地.我们知道,切总体位都具 有属性征效量特征,统学中其为质标志和 效量标志.例如人1:3体,这些征艟是身高,体重, 年龄,工龄,也可能是性别,民族,籍贯,文化程度等.对 统计研究对象而言,无论其属性特征还是效量特征,往 往均具变性.并且一具体特征可艟在一种场合 是可变的,而在另一场合是不变的.例如,在某地区人口 总体中,性是可变标志,而在该地区女人口总体中, 性别则成不变标志了.可见性别这个品标志有时也是 可的.推而广之,品质标志也具有可变性. 由于统计中的量是相对于常量而存在的概 念,所以对一个特定统计研对象,任何可变的标 志都应视为变量,无论其是品质标志还是效量标志.上 中,性别作为可标时,它也应看作变量.这样,凡 是"可变
然而,只对总体内部各单位的异作蕾态察 时的变量.如果仅仅把变量定义为.可变的志,那么 可变统计指标怎么解释?它是否属变量范畴呢?以. 还得对
从蕾卷上看,某体的某统计指标常量,但把 若干总体的同一指标放在一起,指标就变成量了. 如,以国家为总体时,2ooo各国粮食总产量指各 不相同的,它是一量.动态上看,我们常常使用时闻 数列处理统计靛据,时阃效列中的指标羲值往往麓时 间而变化.例,某国在不阿年份的钢产量指标是 在不断变化的.这种断变化的指标也变量,前后不 同的指标效值就是变量值.可,统计指标也有可变与 不变之分,因而,.可变的统计指标也应看作变量. 述第二种观点倒是把统计指标视为变量了,但 量定义中
未可变的品
第三种点我认比较可取,但在文字表述上可 进一步具化.由于说明现象某种特征舶概念可以是标 志(说明总体位的),也可以是指标(说明体的),因 而我们不妨变量作如下明的定义:.所可变标志 及一切可
问题研究
浅论
范文正?梁亚民'
(?华南农业大经
730020)
摘:统计方的主
主要标志是剖新
能,剖新依于客
观性等
统偏会比较步.因.计意识对素质的提高有积极
中国类号:G6420
统计识与统计学方的色紧密相联深入地认 识统
步,这种统计意也
一
开放性
统计学是方论学科,在"是什么基础上探讨 "怎样",而不探讨为什么",把为什么"问题荐诸 各专门学科从较宽泛的意义上看,计学对象是 据,它不管数据怎样解释,只负责示数据之间的数 律及其可靠性."统计学变的经验主义丽不是思 辨的,头优先的事察数据.陈希孺院士也认为: 统计规律未必蕴含因果系,这一点,是统计方法的本 性而非其缺陷.寻找因果关系是各类专门学科的任务. 从认识方式上,们的知识主要靠归纳的方法获 为什么要这样规定骣?们来分析一下统计定 义:统学是"收集和分析数据的学和艺术……(摘 自(不列囊百科全书'定义)何统计学中的数据?计 学家把数据划分为两种类量,即数量效据和品质据 数量效据由可用数度铡量的所有数据组成.它包括 销售,时间消耗量,雇员人数一一任何可用数量自然 地加以记录的数据;品数据由本身不表数值但可 归人分列的各组雨获得的数据
构中的各部门以及标名称等量本身是反统计 数据变化的一个概念,而统计数据有数量数据和品质数 据,可见,可变品质志归A变量是有道理的 这样定变量后,由标志有可用数表示的量 标志和不能用效值表示的品标志,这产生了两种不 同性质的变量.为区分不同性的变量,不妨把它们称 为品质变量(即可壹的品质标志)和效量变量(可变的 数量标及统计指标).这撵,变量的具体表现也就区 为品质变量表和数量变表现.品质变量表现能用 文字描述.而效量变量表现可用具体数值表示,这些 值通常被称为变量值.例如,在某项统计调中,问每个 人文程度如何,回答是各种不同攻的程度,这 里"文化程度即为品质变量,具体可表现为小学'"韧 中,","大专及其以上"等;而问每个
l0
回答各种体的年龄,具体可现为10岁",15 岁,2l岁等,这里"年龄"即数量变量,不同龄数 值即是变量值.另外,以各省为体时,"全
指标
这样划分变后,对不同型的变量我们可栗取不 周的统计方法来理和分.例如对品质变量,可算 各组的频敷频率,用图或的形来表示;面对数量 变量,可计算平均差,标准差等,或用其他更复杂的统 计方法或图表来表示.数量变量根其取情掘不同, 又可分为离散变量和连续变量离变量其变量的一切 可取值均可一一列举出来,各量值之间是以整数位 断开.例如学敷,工
表示,它是离散变量.连变量可任意小数,各变量 值之间可作无限分.例如人的身高,体重,零件尺寸 等,都能用效表示,它
综上所述,我认为计学中谈到的变量其原始含义 不应该只指.可的数量标志或"可变的数量标志和全 部统计指标,还应该两盖瓣些能用值表示,但却是 可变品标志目前有的教师在培学生介变量时, 直把它演绎为"可以不同值的量",这样会
统计学中常见的错误
Chapter2
What Can Go Wrong?
■ Don ’ t label a variable as categorical or quantitative without thinking
about the question you want it to answer. The same variable can
sometimes take on different roles.
■ Just because your variable ’ s values are numbers, don ’ t assume that it ’ s quantitative. Categories are often given numerical labels. Don’ t let that fool you into thinking they have quantitative meaning. Look at the
context.
■ Always be skeptical. One reason to analyze data is to discover the truth.
Even when you are told a context for the data, it may turn out that the
truth is a bit (or even a lot) different. The context colors our interpretation
of the data, so those who want to influence what you think may slant the
context. A survey that seems to be about all students may
in fact report
just the opinions of those who visited a fan website. The question that respondents
answered may have been posed in a way that influenced their responses.
Chapter3
Displaying and Summarizing Quantitative Data
What Can Go Wrong?
■ Don ’ t violate the area principle. This is probably the most common mistake in a graphical display. It is often made in the cause of artistic presentation.
Here, for example, are two displays of the pie chart of the Titanic
passengers by clas
、
A ’ \
‘
GN; ’ {s:
Crew Third Class
First Class Second Class First Class
325
Second Class
285
Third Class
Crew 706
885
50.0%
31.5%
26.7%
Use
Marijuana
Use
Alcohol
Heavy
Drinking
The one on the left looks pretty, doesn ’ t it? But showing the pie on a slant
violates the area principle and makes it much more difficult to compare
fractions of the whole made up of each class — the principal feature that a
pie chart ought to show.
■ Keep it honest. Here ’ s a pie chart that displays data on the percentage of
high school students who engage in specified dangerous behaviors as reported
by the Centers for Disease Control and Prevention. What’ s wrong
with this plot?
Try adding up the percentages. Or look at the 50% slice. Does it look right?
Then think: What are these percentages of? Is there a “ whole ” that has
been sliced up? In a pie chart, the proportions shown by each slice of the
pie must add up to 100% and each individual must fall into only one category.
Of course, showing the pie on a slant makes it even harder to detect
the error.
A data display should tell a story about the data. To do that, it must speak in
a clear language, making plain what variable is displayed, what any axis
shows, and what the values of the data are. And it must be consistent in those
decisions.
A display of quantitative data can go wrong in many ways. The most common
failures arise from only a few basic errors:
■ Don ’ t make a histogram of a categorical variable. Just because the
variable contains numbers doesn’ t mean that it’ s quantitative. Here’ s
a histogram of the insurance policy numbers of some workers.
It ’ s not very informative because the policy numbers are just labels.
A histogram or stem-and-leaf display of a categorical
variable makes
no sense. A bar chart or pie chart would be more appropriate.
■ Don ’ t look for shape, center, and spread of a bar chart. A bar chart showing
the sizes of the piles displays the distribution of a categorical variable,
but the bars could be arranged in any order left to right. Concepts like
symmetry, center, and spread make sense only for quantitative variables.
■ Don ’ t use bars in every display— save them for histograms and bar
charts. In a bar chart, the bars indicate how many cases of a categorical
variable are piled in each category. Bars in a histogram indicate the
number of cases piled in each interval of a quantitative variable. In both
bar charts and histograms, the bars represent counts of data values. Some
people create other displays that use bars to represent
individual data values.
Beware: Such graphs are neither bar charts nor histograms. For example,
a student was asked to make a histogram from data showing the
number of juvenile bald eagles seen during each of the 13 weeks in the
winter of 2003– 2004 at a site in Rock Island, IL. Instead, he made this plot:
1 2 3 4 5 6 7的方差等于 2
1 2 3 4 5 6的方差等于 2.92
统计学中的自由度
本文由gghui186
6Sigma的学习过程会接触到大量的统计学的知识点。虽大学期间学过《概率论与数理统计》以及《统计学》,但些细枝末节的知识点仍然感到困惑。比如说自由度,很多统计的计算公式中都有自由度的念,为么同样是计算标准差,总体标准差的自由度是n,而样本准差的自由度就是n-1,为什么它式中的自度还有n-2、n-3呢, 它到底什
翻看以前的教材以及到网上查阅了大量关资料,原来,不仅仅是统计学里有自由度的概念呀~下面把有关自由度题
理论力学:确定物体的位置需要独立坐标数称作物体的自由度,当物体受到某些限时——自由度减少。一个质点在空间自由运动,它的位置由三个独立坐标就确定,所以质点的运动有三个自由度。假如将质点限制在一个平面或一个曲面上,它有两个自由度。假如将质点限在一直线一条曲线上运动,它只有一个自由度。刚体在空间的动既有平也有转动,其自由度有六个,即三个平动由度x、y、z和个转动自由度a、b、q。如果刚体运动存在某些制条件,自由会
力学中:分子运动自度就是决定一个分子在空间的位置所需要的独
统计学中:统计模型中,自由度指样本中可以自由变动的变量的个数,当约束条件时,自由度减少自由度计算式:自由度=样本数-样本数据受约束条件的个数,即df = n - k(df由度,n样本个数,k约束条个
们当然最关心的还是统学里面的自由度的概念。这里自由度的概念是怎么来
一般总体方差(sigma^2),其实是衡所数据对于中心位置(总体平均)平均差异的概念,所以也称为离散程度,通常表示为sum(Xi-Xbar)^1/2/N ,(有多少个据就除多少)样本方差(S^2),利样数据所计算出估计总体变异用的(样本统计量的基本目的:少量资料估计总体).一般习惯上,总体怎么,样本就怎么算,可是在统计上估计量(或叫样本统量)必符合一个性--无偏性,也就是估计量的数学期望值要等于被估计的总体参数=> E(S^2)=sigma^2(无偏估计)。不幸的,样本变异数E(S^2)并不会等于sigma^2所以必须做修正,而修正后即为sum(Xi-Xbar)^2/(N-1).才会继续带后来自
网上一文献的说法也是林林
金志成实设计书中的定义:能独立变化的数据数目。只要n-1个数确定,第n个值就确了,它不能由变化。所以自由度就是n-1。由度表示的是一据可自由表化的数量的多
通俗点说,一班上有50个人,我们知道他们语文成绩平均分为80,现在需要知道49个人的成绩就能推断出剩那个人的成绩。可以随便报出49个人的成绩,但是最后一人的你不能瞎,因为均分已固定下来了,自由度少个
自由度的设定是出于这一个理由:在总体平均数未知时,用本平均数去计算离差(常用小s)会受到一个限制————要计算标准差(小s)就必须先知道样本平均数,而样本平数和n都知道的情况下,数的和就一个常数了。所以,“最后一个”样本数据就不可以变,因为它要是变,总就变了,而不允许的。至于有的自由度是n,2么的,都同
n-1是通常的计算方法,准确的讲应该是n-k,n表示“处理”的数量,k表示实际需要计算的参数的数量。如需要计算2个数,数据里只有n-2个数据可以自由变化。例如,一组数据,均数一定,则这组数据有n-1个数可自由变化;如一组数据平均数一定,标准差也一定,则有n-2个数据可以自由变化。df=n-k得是需要大的数理统计的证明的。太复的情况,我就
如上总结,希望能对大家有所帮
#日志日期:2006-8-29 星期二(Tuesday) 大雨
评论人:天晴了(
嘿嘿,看不
评论人:小可怜karen 评论日期:2006-9-7 9:06
马再不转型,可就曲高和了,博客总要雅俗共赏才好,要不然就到学术论坛上开
支持!有种熟悉的感
评论人:何妨以不
支持了~
评论人:wwwmouse 评论日期:2007-1-28 11:20
谢谢,很有帮
如果“n-1是通常的计方法,更准确的讲应该是n-k”部分再有一个实例,我
谢谢~
本TXT
谈生活中的统计学
龙源期刊网 http://www.qikan.com.cn
谈生活中的统计学
作者:赵宇翼
来源:《商情》2015年第43期
统计是认识客观世界的手段,也是国管理、企业事业管理和进行宣传教育的具,还是科学研究的方法和对国民经济和社会发展实行有效监的手段。知识的价值是使人变得聪明、智慧、有能力。人类正在进入息社会,面临着一个所谓“信爆”的代。信息的一种最常见的形式就是数据。现代的人们工作和活中,不时地要从这大的、杂然纷数据中发掘事物的规律,作出正确的判,以决定合的
发展认识数据统计
一、统计学的概述
如果我们看电视、听广播或报纸时稍加注意的话,就会经常见到这样的消息:某国领导人的支持率下降了百分五,某股票价格指数上涨了100点,今年的国内产总值比去年增加了7.8%等等。也许你会问:这些数据是如何得到的?这些结是否可靠?实际这些问题统计问题,而且仅仅是统计的大量应用中一
可以说,这方面的能力如何,实是衡一个人聪明与否的一个极为重要的外现指标。“仙人持玉尺,度君多少才”。要准确无误地测出一个人有多聪明,非仙人办。可惜红尘十丈,何处去找那手持玉尺的仙人?但处事是否得,是有客观检验的。古人说与其之空,不见之于行事之深切著明。而统计学,正是这样一种通过分数据而致尽可能正确的结论的技。掌握了它,可使你在工作生活中少犯错误,赢得主动。就是说,使变
二、统计学在生活中
统计学不仅限与学术上的研究,他对于家发展、经济、政治、自然等等都有它独特的作用。统计学应是十分广泛
统计的力量在于无处不在的应用性。论人们从事什么工作,都有可能遇到下问题:如何搜集有价值的资料?如何组织、解释所搜集的资料?何分并给适当的推论?以及推论的可信度有多高?这些便都是统学应用的主要范畴。这其中当包括料搜集、分析到推论的整个过程中所须具备的知识。诸如场调、工业产品质量控制、农品品质的改验、医学的床试验等等,都是我们必须用统计学理的
统计学作为应用性很强科学,其生命力和发展动力,在于它与实用学科的密切联系,割断这种联系,统计学就会变成无源之水,无之木,产生不出有义的问题和方法。因此,统计学与其他学科和域所形成的边和交质的学也特别多,如工业统计学,