范文一:spss列联表分析
列联表分析
分析:从表中可以看出,每箱数量的低、中、高与品牌偏好的低、中、高基本一致,说明每箱数量对是有影响的。
分析:从表中可以看出,价格低时,品牌偏好度不高,而在价格高时,品牌偏好高的一组值达到了87.8%,说明价格对品牌偏好有明显的影响。
分析:从表中可以看出,价值低时,品牌偏好不明显,价格适中时,品牌偏好有高值的趋势,价值高时,品牌偏好度达到了88.0%,说明消费者在考虑产品的价值时,品牌偏好比较明显。
分析:从表中可以看出,在护肤的低、中、高三组中,品牌偏好度高的比例都比较高,说明消费者在考虑产品护肤时,有较高的品牌偏好。
分析:从表中可以看出,在样式的低、中、高三组中,品牌偏好度高的比例都比较高,说明消费者在考虑产品样式时,有较高的品牌偏好。
分析:从表中可以看出,随着吸水性由低到高,品牌偏好的高值比例也在增加,说明吸水性越好,品牌选择偏好越明显。
分析:从表中可以看出,随着渗漏值由低到高,品牌偏好的高值比例也在增加,说明渗漏越差,品牌选择偏好越明显。
分析:从表中可以看出,在舒适度上,品牌偏好的高值比例一直都很高,说明在考虑产品的舒适度时,品牌偏好非常明显。
分析::从表中可以看出,在考虑舒胶带时,品牌偏好的高值比例一直都很高,说明在考虑产品是重复粘贴胶带还是普通胶带时,品牌偏好非常明显。
分析:这是控制了价格时的每箱数量和品牌偏好,可以看出,在价格低时,每箱数量的低、中、高
与品牌偏好的低、中、高还是有关系的,但是与没有控制价格时相比,两者之间的关系被削弱了。
价格适中时,也是如此。在价格高时,关系更加清晰。
分析:这是控制了样式时的护肤与品牌偏好,可以看出,在样式低组和中组,护肤与品牌偏好之间
原有的关系被逆反了,只有在样式的值高的时候,护肤与品牌偏好才有一定正向相关关系。
分析:这是控制胶带时的舒适度与品牌偏好,可以看出,控制胶带以后,舒适度与品牌偏好完全一
致,这加强了舒适度与品牌偏好之间原有的高度相关性。
范文二:交叉列联表分析
交叉列联表分析 ---------用于分析属性数据
1. 属性变量与属性数据分析
从变量的测量水平来看分为两类:连续变量和属性(Categorical)变量,属性变量又可分为有序的(Ordinal)和无序的变量。
对属性数据进行分析,将达到以下几方面的目的:
1) 产生汇总分类数据——列联表;2) 检验属性变量间的独立性(无关联性);
3) 计算属性变量间的关联性统计量;4) 对高维数据进行分层分析和建模。
在实际中,我们经常遇到判断两个或多个属性变量之间是否独立的问题,如:吸烟与患肺癌是否有关,色盲与性别是否有关,上网时间与学习成绩是否有关等等(解
2,决这类问题常用到建立列联表,利用统计量作显著性检验来完成( 2(列联表(Contingency Table)
列联表是由两个以上的属性变量进行交叉分类的频数分布表。
,?,,YYXX设二维随机变量(,),可能取得值为,可能取得值xxx12r
,?,,YX为(现从总体中抽取容量为n的样本,其中事件(==)yyyyxi12js
rs
发生的频率为(i = 1,2, ?,r,j=1,2, ?,s,)记=,=,nnnnn,ijiji,,,jiji,1j,1
rsrs
则有n === ,将这些数据排列成如下的表: nn,ni,,,,,jiji,1i,,11jj,1
Y yyyni, ? 12sX
? n nnn1,11121sx1
? n nnn2,21222sx2
? ? ? ? ? ?
? nnnnr,r1r2rsxi
? n,jnnnn ,1,2,s
这是一张r×s列联表(
3(属性变量的关联性分析
对于不同的属性变量,从列联表中可以得到它们联合分布的信息。但有时还想知道形成列联表的行和列变量间是否有某种关联性,即一个变量取不同数值时,另一个变量的分布是否有显著的不同,这就是属性变量关联性分析的内容。
属性变量关联性检验的假设为
H0:变量之间无关联性; H1:变量之间有关联性
由于变量之间无关联性说明变量互相独立,所以原假设和备择假设可以写为:
H0:变量之间独立; H1:变量之间不独立
2,检验
H:X与Y独立( 0
pyxiX记P (=,η=) = ,i =1,2,?,r,,j = 1,2,?,s, jij
pxYX(=) =, i =1,2,?,r,P (=) = ,j = 1,2,?,s( P py.jjii.
由离散性随机变量相互独立的定义,则原假设等价于
pH:= ,i =1,2,?,r ,,j = 1,2,?,s( p0p.jiji.
2p,若已知,我们可以建立皮尔逊统计量 ij
2r(n),spnij2ij,= ( ,,ij,1npi,1ij
22p,由皮尔逊定理知,的极限分布为(但这里未知,因此用它(rs,1),ij
,
p的极大似然估计代替,这时检验统计量为 ij
2,n,()nrijps2ij,=( ,,,,1ij,1inpij
ppp在H成立的条件下,= ,即等价于用和的极大似然估计pp0.j.j,iji.i,
,,
pp和的积去代替(可以求得 ,ji,
,,nni,,jpp= , i =1,2,?,r , = , j = 1,2,?,s, ,ji,nn
,nni,,jp则 = ( i =1,2,?,r,,j = 1,2,?,s, ijnn
从而得到统计量
2,,2n,()nrijr,,sppsn2,,ijij,,,== ( n,1,,,,,,,,,1ijij,1,1i,1innni,,j,,pp,,ij
2,在H成立的条件下,当n?时,的极限分布为 ,0
22 = ( (rs,(r,s,2),1)((r,1)(s,1)),,
22, 对给定的显著性水平α,当 ,,则拒绝H,否则接((r,1)(s,1)),0,,1
受H( 0
特别,当r = s = 2 时,得到2×2列联表,常被称为四格表,是应用最广的一种列联表(这时检验统计量为
2(,)nnnn112212212,=n
nnnn,12,1,,2
2,它的极限分布为(1)(
YX 对于二维随机变量(,)是连续取值的情况,我们可采用如下方法将其离散化(
YX? 将的取值范围(-?,+?)分成r个互不相交的区间,将的取值范围
(-?,+?)分成s个互不相交的区间,于是整个平面分成了rs个互不相
交的小矩形;
? 求出样本落入小矩形中的频数i =1,2,?,r,,j = 1,2,?,s ; nij
? 建立统计量
2,,rsn2ij,,,n,1=, ,,,,i,,11ijnni,,j,,
22,在H成立时且n充分大时,的极限分布为,拒绝域的确((r,1)(s,1)),0
定同离散型的情况(
3(属性变量的关联度计算
22检验的结果只能说明变量之间是否独立,如果不独立,并不能由的,,
值说明它们之间关系的强弱,这可以由系数来说明 ,
,,nnnn11221221,r,s,2,,,,nnnn1,2,,1,2系数= ,,2,,,其它,n,
其中 当r=s=2即2×2列联表时-1<><>
间关联性越强,反之越弱。主要用于2×2列联表
例1(教材p116例4.4)为了了解吸烟与患慢性气管炎的关系,对339名50岁以上的人作了调查,具体数据如下表:
if患病
患病 未患病
if吸烟 合计
205 吸烟 43 162
134 不吸烟 13 121
339 合计 56 283
利用交叉列连表分析,研究吸烟习惯与患慢性气管炎的关系。
解 检验 H:吸烟与患慢性气管炎无关( 0
已给数据构成一个四格表, n=339 ,=43, =162,=13,=121, nnnn11122122
=205,=13,=134 ,=121,则 nnnn1,,12,,2
22(,)339,nnnn(43,121,162,13)112212212,n==7.469( ,13,134,205,121nnnn,12,1,,2
2若给定α=0.05,查表得(1)= 3.841 <7.469,所以拒绝>7.469,所以拒绝>
,惯与患慢性气管炎有关(但系数=0.148较小,表示相关性不是太大 利用SPSS软件完成
练习1 数据文件“电信用户.sav”中记录了某电信运营商经营的各种情况,比如服务类型、设备租用、无线使用等。选择其中4个变量: custcat(顾客服务)、ed(顾客受教育程度)、income(家庭收入)、ininc(电信消费),考察顾客与服务经营的情况
(1) 对变量custcat和ed进行频数分析;
(2) 分别考察ed对income的影响,custcat对ininc的影响 练习2 04年全国数学建模竞赛A题 “奥运会临时超市网点设计”中第一问 根据附录中给出的问卷调查数据,找出观众在出行、用餐和购物等方面所反映的规律。
范文三:交叉列联表分析
交叉列联表分析
(1) T ransform (修改)----Recode into Different variable----选定身高
------点击“向右箭头”------在“name ”下写个名字:eg :T1-------change-------
(此处T1和T2是已经做好的分组)
点击
-----old and new values
对其分组---例:Range LOWEST through values :160
Rang :160 through :170
Range HIGHEST through values :170
点击continue-----回到前一个对话框点击
------OK new values :1 2 3
同样的方法做好T2
---------点击“analyze(分析) ”-----“Descriptive Statistics(描述性统计) ”------“Crosstabs (交叉列联表)”
选中行列------点击“Exat …. “则弹出“exct tests(精确检测)对话框”
点“Statistics …”则弹出“Crosstabs :statistics (交叉表统计)对话框” -------点击“Chi —square (卡方检验)”----“continue ”
点“Cells …”则弹出“Crosstabs :Cells display(交叉表统计)对话框” -------选择“Counts ”中的“Observed ”和“Expected ”为期望频数,-------选择“Percentages ”中的“Row ”“Column ”“Total ”选项,分别计算“频数”“列频数”“总频数”-------选择“Residuals ”中的“Standardized ”分别计算单元格的非标准化残差、标准化残差、调整后的残差----“continue ”回到前一页点----“OK ”
作业:1-10,11-25,26-30
范文四:交叉列联表分析步骤
交叉列联表分析步骤 1【分析】—【描述统计】—【交叉表】
【精确】
一般情况下,"精确检验"(Exact Tests)对话框的选项都默认为系统默认值,不作调整。
【统计量】
【单元格】
【格式】
2 结果分析:
职称* 学历 交叉制表
学历 本科 专科 高中 初中 合计
职称 高级工程师 计数 1 1 1 0 3
职称 中的 % 33.3% 33.3% 33.3% .0% 100.0%
学历 中的 % 25.0% 25.0% 20.0% .0% 18.8%
总数的 % 6.3% 6.3% 6.3% .0% 18.8%
工程师 计数 1 3 0 0 4
职称 中的 % 25.0% 75.0% .0% .0% 100.0%
学历 中的 % 25.0% 75.0% .0% .0% 25.0%
总数的 % 6.3% 18.8% .0% .0% 25.0%
助理工程师 计数 2 0 1 3 6
职称 中的 % 33.3% .0% 16.7% 50.0% 100.0%
学历 中的 % 50.0% .0% 20.0% 100.0% 37.5%
总数的 % 12.5% .0% 6.3% 18.8% 37.5%
无技术职称 计数 0 0 3 0 3
职称 中的 % .0% .0% 100.0% .0% 100.0%
学历 中的 % .0% .0% 60.0% .0% 18.8%
总数的 % .0% .0% 18.8% .0% 18.8%
合计 计数 4 4 5 3 16
职称 中的 % 25.0% 25.0% 31.3% 18.8% 100.0%
学历 中的 % 100.0% 100.0% 100.0% 100.0% 100.0%
总数的 % 25.0% 25.0% 31.3% 18.8% 100.0%
卡方检验
值 渐进 Sig. (双侧) df
aPearson 卡方 18.533 9 .029
似然比 20.629 9 .014
线性和线性组合 2.617 1 .106
有效案例中的 N 16
职称* 学历 交叉制表
学历 本科 专科 高中 初中 合计 职称 高级工程师 计数 1 1 1 0 3
职称 中的 % 33.3% 33.3% 33.3% .0% 100.0%
学历 中的 % 25.0% 25.0% 20.0% .0% 18.8%
总数的 % 6.3% 6.3% 6.3% .0% 18.8%
工程师 计数 1 3 0 0 4
职称 中的 % 25.0% 75.0% .0% .0% 100.0%
学历 中的 % 25.0% 75.0% .0% .0% 25.0%
总数的 % 6.3% 18.8% .0% .0% 25.0%
助理工程师 计数 2 0 1 3 6
职称 中的 % 33.3% .0% 16.7% 50.0% 100.0%
学历 中的 % 50.0% .0% 20.0% 100.0% 37.5%
总数的 % 12.5% .0% 6.3% 18.8% 37.5%
无技术职称 计数 0 0 3 0 3
职称 中的 % .0% .0% 100.0% .0% 100.0%
学历 中的 % .0% .0% 60.0% .0% 18.8%
总数的 % .0% .0% 18.8% .0% 18.8% 合计 计数 4 4 5 3 16
职称 中的 % 25.0% 25.0% 31.3% 18.8% 100.0%
学历 中的 % 100.0% 100.0% 100.0% 100.0% 100.0% a. 16 单元格(100.0%) 的期望计数少于 5。最小期望计数
为 .56。
H:两者相互独立。 0
皮尔逊(Pearson)的Chi-Square 值为18.553,自由度为9,p=.029<>
范文五:第五周实训-交叉列联表分析
第6章 实验内容及要求
实验目的:
熟练掌握各类描述统计分析中的交叉列联表分析(包括2*2交叉列表分析和多选项交叉列表分析)及基本统计分析的报表制作。
实验方法:
演示法、实操法相结合;结合第3章课件PPT。
实验内容:
(一) 练习课本P79页例6-3,打开数据文件“6章_数据1.sav”,按题目要求做两变量交互分析,并对照
书本结果进行验证。将输出文件保存为“6章_数据1c.spv” (菜单操作提示:“分析,描述统计,
交叉表”)
1、 根据结果分析男性网民和女性网民对周末阅读需求是否一致,每种读物各占多少比例值,
2、 根据结果分析卡方检验值,Pearson 卡方值是多少,似然比卡方检验值是多少,是否说明男女性
别网民对周末读物选择有显著差异,为什么,
3、 φ值和Cramer 的 V的值是多少,这两个值主要起什么作用,性别与周末读物选择有没有明显的
关系呢,
4、 如果性别与周末读物选择有强相关性,那么是哪种读物需求与性别关系最强,哪种读物与性别关
系最弱,请用图表分析你的结论。(注:参考P81页表6-11)
5、 你是否能够得出P82页,表6-14中所列出的值,请将分析的图表中的值用红线圈标出。
(二) 打开数据文件“6章_ 3.sav”,这是某公司工资数据,有两个变量:性别、收入。由于不了解他们的
具体薪金是多少,但知道薪金的高低情况。要求分析男女职员间薪金是否平等。 (菜单操作提示:“分析,描述统计,交叉表”)
1、 由于样本较小,又是2*2交叉表,所以使用Fisher精确检验结果。
2、 计算数据文件中个案有无缺失值,个案数是多少,
3、 显示交叉表“性别”和“收入”的各自占百分比。
4、 显示卡方检验结果图,通过卡方的Fisher精确检验得出结论是什么,
原始数据文件
菜单操作方法
参考结果
请问:通过下面的φ下面的φ 值和Cramer 的 V的值和Cramer 的 V的
值能得出什么解释, 值能得出什么解释,
(三) 练习课本P83页例6-4:网民的新闻信息渠道主要是哪些。进行多项选择数据频次分析。(菜单操作
提示:第一步:定义变量集。分析,多重响应,定义变量集。第二步:数据频次分析。分析,多重
响应,频率)
1、 打开数据文件“6章_数据1.sav”,按课本的对话框要求操作:
(1)网民主要依靠的前三大新闻渠道是什么,从P85页表6-15结果进行分析;
(2)能否得出与课本结果一致,通过分析各个百分比得出结论;
(四) 练习课本P85页例6-5:不同性别网民的新闻渠道是否相同。进行多项选择数据交互分析。(菜单操
作提示:第一步:定义变量集。分析,多重响应,定义变量集。第二步:数据交互分析。分析,多
重响应,交叉表)
1、打开数据文件“6章_数据1.sav”,按课本的对话框要求操作:
(1)不同性别网民的新闻信息渠道交互分析P87页表6-16结果;
(2)能否得出与课本结果一致,并分析各个百分比来源;
(3)男性网民获取新闻信息的主要来源是什么,女性网民获取新闻信息的主要来源是什么,两者
之间有无差别。
(所有操作步骤与结论解释见课件PPT第三章:统计描述)
2、 将最后操作后的文件另存为“6章_数据1d.spv”。
实验巩固:
(问题一):某商场对6种品牌的电视机进行消费者满意度调查,随机调查了20位消费者,让他们选出最
满意的3个电视机品牌,收集到相应的数据,如表3-11所示。试用多选项二分法利用SPSS对该问题进行
分析,包括频数分析和交叉列联表分析。使用“6章_多选二分法.sav”数据文件。
表3-11 20名消费者调查情况
康 长 西 东 创 性 ID TCL 佳 虹 湖 芝 维 别 1 1 0 1 0 1 0 1 2 1 0 1 1 0 0 0 3 0 0 0 1 1 1 0 4 1 0 1 1 0 0 0 5 1 0 0 1 0 1 0 6 0 0 1 1 1 0 1 7 0 1 1 1 0 0 1 8 1 0 0 0 1 1 1 9 0 0 1 1 1 0 0 10 0 1 1 1 0 0 0 11 1 1 1 0 0 0 0 12 1 0 1 0 0 1 1 13 0 1 1 1 0 0 1 14 1 0 1 1 0 0 0 15 0 0 1 1 0 1 0 16 1 1 1 0 0 0 0 17 1 1 1 0 0 0 0 18 0 1 1 0 0 1 1 19 0 1 1 1 0 0 1 20 1 1 0 1 0 0 1 1、 男女性别的消费者对六大品牌的满意度有无差别,
2、 最满意品牌是什么,最不满意品牌是什么,
(问题二):采用多选项分类法对上以问题进行分析。在本次调查中,每个被调查人最多选择3个品牌,因
此有3个变量,用来保存每个被调查人的选择,数据表格如3-12所示。使用“6章_多选分类法.sav”数据
文件。
表3-12 20名消费者调查情况
答 案 1 答 案 2 答 案 3 性 别 ID
1 1 5 3 1 2 1 3 4 0 3 4 5 6 0 4 1 4 3 0 5 1 4 6 0 6 3 4 5 1 7 2 3 4 1 8 5 6 1 1 9 5 3 4 0 10 4 2 3 0 11 3 1 2 0 12 3 6 1 1 13 3 2 4 1 14 4 3 1 0 15 6 3 4 0 16 2 3 1 0 17 2 1 3 0 18 2 6 3 1 19 3 2 4 1 20 2 1 4 1
3、 男女性别的消费者对六大品牌的满意度有无差别, 4、 最满意品牌是什么,最不满意品牌是什么,