范文一:独立性检验ppt
独立性检验
随机误差是随机变量, 可以用方差 σ2 来衡量随机误差 的大小(对于样本点(x1,y1),(x2,y2),?,(xn,yn),相 ^ 应随机误差为 ei,yi, y i,yi,bxi,a,其估计值为e i,yi
^ 1 n ^2 1 ^i,yi,bxi,a,其中σ , ^ ^,b)(n,2) ,y e, Q(a n,,2 ,1 ^
^2
^ 作为 σ2 的估计量,可以用σ 2 来衡量回归方程的预报精 ^ 度(通常σ2 越小,预报精度越高(
(残差图:作图时,纵坐标为 残差 ,横坐
标可以选为样本编号,或有关数据,这样 作出的图形称为残差图(如果残差点比较 均匀地落在 水平的带状区域 中,说明选用 的模型比较合适(这样的带状区域的宽度 越窄,说明模型拟合精度 越高 ,回归方 程的预报精度也 越高(
(建立回归模型的基本步骤
确定研究对象,明确哪个变量是 解释变量 ,哪个变量是 预报变量; 画出确定好的解释变量和预报变量的 散点图 ,观察它们之间的关系(如是否存
在线性关系等); 由经验确定回归方程的类型(如我们观 察到数据呈线性关系,则选用线性回归方 程 );
按一定规则估计回归方程中的参数(如
最小二乘法); 得出结果后分析残差图是否有异常(个 别数据对应残差过大,或残差呈现不随机 的规律性等等);若存在异常,则检查 数据 是否有误,或 模型 是否合适等(
例题(以下是某地区的降雨量与年平均气
温的一组数据:
年平 12.5 12.8 12.8 13.6 13.3 12.7 13.0 均气 1 4 4 9 3 4 5 温(?)
年降 雨量 (mm) 542 507 813 574 701 432 464
根据这组数据可以推断,该地区的降雨量
与年平均气温________相关关系((填“具 有”或“不具有”)
不具有 解析] 画出散点图,观察可知,降雨量与 年平均气温没有相关关系(
答案]
例题(关于x与y有如下数据:
x 2 4 5 6 8 y 30 40 60 50 70
有如下的两个线性模型: ^ ?y,6.5x,17.5; ^ ?y,7x,17. 试比较哪一个拟合效果更
好(
[解析]
^ 由?可得 yi,yi 与 yi, y 的关系如下表: ^ yi,yi ,0.5 ,3.5 10 ,6.5 0.5 yi
, y ,20 ,10 10 0 20
^ 所以 ,yi)2,(,0.5)2,(,3.5)2,102,(,6.5)2,
i ,1
5
0.52,155,
, y )2,(,20)2,(,10)2,102,02,202,1000.
i,1
5
,yi)2
i,1
5
所以
R2,1, 1
i,1
5
155 ,1,1000,0.845. (yi, y )2
^ 由?可得 yi,yi 与 yi, y 的关系如下表: ^ yi,yi ,1 ,5 yi, y , 20 , 10 10
0 20 8 ,9 ,3
^ 所以 ,y i)2 ,(,1)2,(,5)2,82 ,(,9)2,(,3)2
i,1
5
,180,
, y )2,(,20)2,(,10)2,102,02,202,1000.
i,1
5
,yi)2
i,1
5
所以
R2,1, 2
i,1
5
180 ,1,1000,0.82. (yi, y )2
2 2 由于 R2,0.845,R2,0.82,0.845>0.82,所以 R1>R2. 1 2
故?的拟合效果好于?的拟合效果(
[点评] R2的取值越大,模型的拟合效果越好(
3 .2
独立性检验的基本
思想及其初步应用
对于性别变量 其取值为男和女两种这 , . 种变量的不同 值" 表示个体所属的不同 " 类 别 , 像这类变量称为 分类变量 .在现实 生活中, 分类变量是大量存在的例如 是 , 否吸烟 宗教信仰国籍, 等等. , ,
在日常生活中我们常常关心两个分类 , 变 量之间是否有关系 .例如, 吸烟与肺癌是否 有关系? 性 别对于是否喜欢数学课 程 有 影响? 等等.
探究
为调查吸烟是否对患肺 癌有影响,某
肿瘤研究所随机地调查 9 965人, 得到如下 了 结果 (单位 : 人) :
表 吸烟与患肺癌列联表
不患肺癌 患肺癌 不吸烟 吸烟 总计 7775 2099 9874 42 49 91
总计 7817 2148 9965
那么吸烟是否对患肺癌 有影响?
像表 这 样列出的两个分类变量 的 频数表 , 称为列联表. 由吸烟情况和患肺 癌情况的列联 表可以粗略 估计出: 在不 吸烟者中 有0.54%患有肺癌 在吸烟者中 , ; , 有2.28% 患有肺癌因此, 直观上可以得出 . 结论 : 吸烟者和不吸烟者患 肺癌可能存 在差异.
与表格相比 三维柱形图和二维条形 , 图 能更直观地反映出相关数据的总体 状 况.
8000 7000 6000 5000 4000 3000 2000 1000 0 不患肺癌
吸烟
患肺癌
不吸烟
图
图是列联表的三维柱形图 , 从中能清晰 地看出各个频数的相对 大小 . 作三维柱形图要注意选 择恰当的视角 ,以使每 个柱体都能看到 .
9000 8000 7000 6000 5000 4000 3000 2000 1000 0
不患肺癌
患肺癌
不吸烟
吸烟
图
图 是叠在一起的二维条形 , 其中绿色 图 条高表示不患肺癌的人 ,黑色条高表示患肺 数 癌的人数从图中可以看出 . ,吸烟者中患肺癌的 比例高于不吸烟者中患 肺癌的比例 .
1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00
不吸烟
吸烟
图
为了更清晰地表达这个 特征, 我们还可用如下的等 高条形图表示两种情况 下患肺癌的比例 如图 3 3 所示, 在等高条形图中绿色的条高表示不患肺 , 癌 的百分比 黑色的条高表示患肺癌 ; 的百分比 .
上面我们通过分析数据 和图形 得到的直观印 , 象是吸烟和患肺癌有关 .那么事实是否真的如 此呢 ? 或者说我们能够以多大 的把握认为 吸 " 烟与患肺癌有关 呢 ? "
为了回答上述问题, 我们先假设 H0 : 吸烟与患肺癌没有关系.
用A表示不吸烟,B表示不患肺癌, 则" 吸烟与患 肺 癌没有关系 " 等价于" 吸烟与患肺癌独立" , 即H0等价于
把表中的数字用字母代替得到如下用字 , 母表示的列联表:
表吸烟与患肺癌列联表
不患肺癌 患肺癌 不吸烟 吸烟 总计
总计
在表中 a 恰好为事件AB 发生的频数 和恰恰好分别为事件A 和 B发生的频数 .由 于频率近似于概率, 所以在H0成立的条件下应有
a
, 其中为样本容
n n n 量, 即 即
因此越小, 说明吸烟与患肺癌之间关 系越弱越大, 说明吸烟与患肺癌之间 关系越强. 为了使不同样本容量的数据有统一的评判标
准, 基于上面的分析, 我们构造一个随机变量
2
2
其中为样本容量.
若H0成立, 即" 吸烟与肺癌没有关系" , 则K 2应该 很小.现在, 根据表中的数据, 利用公式计 算得K 2的观测值为
2
这个值是不是很大呢 ?
在H0成立的情况下, 统计学家估算出如下概率
即在H0成立的情况下K 2的值大于6.635的概率 非常小.近似于0.01.也就是说.在H0成立的情况
下对随机变量K 2进行多次观测, 观测值超过6.635 的频率约为 1 100 .
在越大, 近似程度越高在实际应用中通常 中 . , 要求a, b, c, d都不小于 . 5 思考 如果就断定H0不成立 这种判 ,
断出错的可能性有多大 ? 现在观测值远远大于6.635, 在H0 成立
的条件下,由 式可知能够出现这样的观测值的 概率不超过 0.01. 因此我们有99% 的把握认为H0 不成立, 即有99%的把握认为" 吸烟与肺癌有关系".
上面这种利用随机变量 2来确定在多大程度上 K 可以认为" 两个分类变量有关系的方法称为两 " 个分类变量的 独立性检验. .
独立性检验的基本思想 类似于反证法要确认" 两个 . 分类变量有关系 这一结论成立的可信程 , 首先假 " 度 设该结论不成立即假设结论" 两个分类变量没有关 , 系" 成立, 在该假设下构造的随机 变量K 2 应该很小如 . 果由观测数据计算得到 K 2 的观察值很大 则在一 的 , 定程度上说明假设不合 .根据随机变量 2 的含义, 理 K 可以通过概率式评价该假设不合理的 程度,由实 际计算出的说 明 假 设 不 合 理的程度为 99%,即" 两个分类变量有关系这一结论成立的可信 " 程度约为 %. 99
思考
利用上面的结论你能从列联表的三维柱 ,
形图中看出两个分类变 量是否相关吗 ?
一般地, 假设两个分类变量 和Y,它们的值域分 X 别为 和 其样本频数列联表 称为 列联表) 为 :
表列联表
y1 x1 x2 总计
总计
若要推断的论述为
H 1 :" X 与 Y 有关系 " , 可以按如下步 :
骤判断结论 H 1成立的可能性
1 .通过三维柱形图和二维 个分类变量是否有关 所得结论的可靠程度 .
条形图 , 可以粗略地判断两 地给出
, 但是这种判断无法精确
在三维柱形图中
H 1成立的可能性越大
, 主对角线上两个柱形高 形高度的乘积 .
度的乘积 bc 相差越大 ,
ad 与副对角线上的两个柱
在二维条形图中
, 可以估计满足条件 a
的个体 , 也可以估计满
中具有 的个体所占的比例 足条件 的个体中具有 两个比例的
值相差越大
的个体所占的比例
, H 1成立的可能性就越大
.
2 .可以利用独立性检验来 具体做法是
考察两个分类变量是否 种判断的可靠程度 .
有关系 , 并且能较精确地给出这
: 根据 观测数据计算则
式给出的检
a , b , c , d 都不
验随机变量 K 2的值 k , 其值越大 , 说明 " X 与 Y 有关系 " 成立的可能性越大 .当得
到的观测数据 小于 5 时 , 可以通过查阅下表 " X 与 Y 有关系 " 的可信程度 . ( 表 3
来确定结论
当观测数据 , b, c, d中有小于 时,需采用很复杂的精 a 5 确的检验方法 .
表
10 2 . 706
0 . 05 3 . 841
0 . 025 5 . 024
0 . 010 6 . 635
0 . 005 7 . 879
0 . 001 10 . 828
例如 :
如果就有99.9%把握认为 X与Y有 "
关系 ; "
如果就有99.5% 把握认为 X与Y有关 "
系" ;
如果就有99%把握认为 X与Y有关系 ; " "
如果就有97.5%把握认为 X与Y有关 "
系" ;
如果就有95%把握认为 X与Y有关系 如果就有90%把握认为 X与Y有关系 ; " "
如果就认为没有充分的证据 显示" X与Y 有关系 ".
例1
在某医院,因为心脏 病而住 院的 665 名男性
病人中 有 214 人秃顶 而另外 772 名不是因为患心 , , 脏病而住院的男性病 人中有 175 人秃顶分别利用 . 图形和独立性检 验方法判断秃顶与患心 脏病是否 有关系? 你所得的结论在什么范 围内有效?
解
根据题目所给数据得到
秃顶与患心脏病列联表
如下列联表
表
患心脏病 秃顶 不秃顶 总计 214 451 665
患其他病 175 597 772
总计 389 1048 1437
相应的三
维柱形图
600 500 400 300 200 100 0
如图 所示 .比 较来说 , 底面副对角 线上两个柱 体 高度 ,可 ". 的乘积要大一些
患其他病
以在 某种程度上认 为 " 秃顶与患心脏病有关
根据列联表 K
2
秃顶
不秃顶
患心脏病
图
中的数据 , 得到2
所以有 99 % 的把握认为
因为这组数据来自住院 住院的病人群体 .
" 秃顶与患心脏病有关
".
的病人 ,因此所得到的结论适合
例2
为考察高中生的性别与 是否喜欢数学课程
之间的关系, 在某城市的某校高中生 中随机 抽出 300名学生 得到如下列联表: ,
表 性别与喜欢数学课程列 联表
喜欢数学课程 不喜欢数学课程 总计 男 女 总计 37 35 72 85 143 228 122 178 300
由表中数据计算得高中生的性别与是 否喜欢数学课程之间是 否有关系 为
什么? ?
解
可以有约 95 % 以上把握认为 ". 作出这种判断的依 , 具体过程如下 :
" 性别与喜欢数学 据是独立性检
课之间有关系 验的基本思想
分别用 a , b , c , d 表示样本中喜欢数学课 不喜欢数学课的男生人 数、不喜欢数学课的
女 数、喜欢
的男生人数、 数学课的女生人
生人数 .如果性别与是否喜
欢 数 学 课 有关 系 , 则男 生 中喜 欢 数 学 课 的比 例 与女生中喜欢
数学课的人数比例 应该
相差很多 , 即
应很大 .
将上式等号右边的式子
乘以常数因子
然后平方得 K
2
2
,
其中 因此 K 2 越大 , " 性别与喜 欢数学课之间有关系 " 成立的可能性越大 .
另一方面 , 假设 " 性别与喜欢数学课之间 因此事件 A 是一个小概率事件 据计算得 这表明小概率事件 据假设检验的基本原理 欢数学课之间有关系 可能性约为 , 我们应该断定
没有关系 " , .而由样本数 A 发生 .根 " 性别与喜 " 性别与
由于事件 的概率为
" 成立 , 并且这种判断出错的
5 %. 所以 , 约有 95 % 的把握认为 ".
喜欢数学课之间有关系
范文二:独立性检验
学科: 数学 任课教师: 刘兴峰 授课日期: 年 月 日(星期 )
关注成长每一天
§1.2.1 独立性检验的基本思想及其初步应用
1. 通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的必要性; 2. 会根据2?2列联表求统计量K .
2
一、预习案
复习1:回归分析的方法、步骤,刻画模型拟合效果的方法(相关指数、残差分析)、步骤.
二、新课导学 ※ 探究案 新知1:
1. 分类变量:.
2. 2?2列联表:
试试:你能列举出几个分类变量吗?
探究任务:吸烟与患肺癌的关系
1. 由列联表可粗略的看出:
(1)不吸烟者有患肺癌; (2)不吸烟者有患肺癌.
因此,直观上课的结论: . 2. 用三维柱柱图和二维条形图直观反映:
(1)根据列联表的数据, 作出三维柱形图:
由上图可以直观地看出, 吸烟与患肺癌
.
关注成长每一天
(2) 根据列联表的数据, 作出二维条形图
:
由上图可以直观地看出, 吸烟与患肺癌 .
根据列联表的数据, 作出等高条形图
:
由上图可以直观地看出, 吸烟与患肺癌 .
反思:(独立性检验的必要性)通过数据和图形, 我们得到的直观印象是患肺癌有关. 那是否有一定的把握认为“吸烟与患肺癌有关”呢?
2
新知2:统计量K
吸烟与患肺癌列联表
假设
H 0:吸烟与患肺癌没关系,
则在吸烟者和不吸烟者中患肺癌不患肺癌者的相应比例 . 即
因此, 越小,说明吸烟与患肺癌之间关系 ;反之, .
K 2=
关注成长每一天
※ 典型例题
例1 吸烟与患肺癌列联表
求K .
2
※ 动手试试
求K .
三、总结提升 ※ 学习小结
1. 分类变量:2. 2?2列联表:3. 统计量K :. ※ 知识拓展
1. 分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级,等等. 分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义. 如用“0”表示“男”,用“1”表示“女”
. :
2
关注成长每一天
某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表: 求K .
2
§1.2.2 独立性检验的基本思想及其初步应用
通过探究“秃顶是否与患心脏病有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示患心脏病的秃顶比例比患其它病的秃顶比例高,让学生亲身体验独立性检验的实施步骤与必要性
一、预习案
复习1:统计量K :
2
关注成长每一天
复习2:独立性检验的必要性:
二、新课导学 ※ 探究案
新知1:独立性检验的基本思想: 1、 独立性检验的必要性:
探究任务:吸烟与患肺癌的关系
第一步:提出假设检验问题 H 0:
2
第二步:根据公式求K 观测值
k =
(它越小,原假设“H 0:吸烟与患肺癌没有关系”
成立的可能性越 ;它越大,备择假设“H 1: ” 成立的可能性越大. )
第三步:查表得出结论
关注成长每一天
※ 典型例题
例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?
小结:用独立性检验的思想解决问题: 第一步: 第二步: 第三步:
例2为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,
得到如下列联表:
由表中数据计算得到的观察值. 在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?
关注成长每一天
※ 动手试试
练1. 某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:
请问有多大把握认为“高中生学习状况与生理健康有关”?
三、总结提升 ※ 学习小结
1. 独立性检验的原理:
2. 独立性检验的步骤:
※ 知识拓展
.
※ 自我评价 你完成本节导学案的情况为( ).
A. 很好 B. 较好 C. 一般 D. 较差
※ 当堂检测(时量:5分钟
满分:10分)计分:
1. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 ( )
A. 若k =6.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟者中,有99个患肺病. B. 从独立性检验可知, 有99%的把握认为吸烟与患肺病有关时, 可以说某人吸烟, 那么他有99%的可能性患肺病.
C. 若从统计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使推断出现错误. D. 以上三种说法都不对. 2. 下面是一个2 2列联表
则表中a,b 的之分别是( )
A. 94,96 B. 52,50 C. 52,54 D. 54,52
关注成长每一天
3. 某班主任对全班50名学生进行了作业量多少的调查, 数据如下表: 则认为喜欢玩游戏与认为作业量多少有关系的把握大约为( )
A. 99% B. 95% C. 90% D. 无充分依据 4. 在独立性检验中, 当统计量K 满足 时, 我们有99%的把握认为这两个分类变量有关系. 5. 在2 2列联表中, 统计量K
2
2
为考察某种药物预防疾病的效果, 进行动物试验, 得到如下列联表 能以97.5%的把握认为药物有效吗? 为什么?
统计案例检测题
测试时间:90分钟 测试总分:100分
一、选择题(本大题共12小题,每题4分) 1、散点图在回归分析中的作用是 ( ) A .查找个体数目 B .比较个体数据关系 C .探究个体分类
D .粗略判断变量是否呈线性关系
2、对于相关系数下列描述正确的是 ( ) A .r >0表明两个变量相关 B .r <>
C .r 越接近1,表明两个变量线性相关性越强 D .r 越小,表明两个变量线性相关性越弱
3、预报变量的值与下列哪些因素有关 ( ) A .受解释变量影响与随机误差无关 B .受随机误差影响与解释变量无关 C .与总偏差平方和有关与残差无关 D .与解释变量和随机误差的总效应有关
关注成长每一天
4、下列说法正确的是 ( ) A .任何两个变量都具有相关系 B .球的体积与球的半径具有相关关系 C .农作物的产量与施肥量是一种确定性关系 D .某商品的产量与销售价格之间是非确定性关系
5、在画两个变量的散点图时,下面哪个叙述是正确的 ( ) A. 预报变量在x 轴上,解释变量在 y 轴上 B. 解释变量在x 轴上,预报变量在 y 轴上 C. 可以选择两个变量中任意一个变量在x 轴上 D. 可以选择两个变量中任意一个变量在 y 轴上 6、回归直线y =bx +a 必过 ( ) A .(0,0) B .(x ,0) C .(0,y ) D .(x , y )
7、三维柱形图中,主、副对角线上两个柱形高度的 ( )
A .和 B .差 C .积 D .商
8、两个变量 y 与x 的回归模型中,求得回归方程为y =e 0.2x -32,当预报变量x =10 ( ) A. 解释变量y =e -30 B. 解释变量y 大于e -30 C. 解释变量y 小于e -30 D. 解释变量y 在e -30左右 9、在回归分析中,求得相关指数R 2=0.89,则( ) A. 解释变量解对总效应的贡献是11% B. 解释变量解对总效应的贡献是89% C. 随机误差的贡献是89% C. 随机误差的贡献是0.89%
10、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 ( )
A .若k =6.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟者中,有99个患肺病. B .从独立性检验可知, 有99%的把握认为吸烟与患肺病有关时, 可以说某人吸烟, 那么他有99%的可能 性患肺病.
C .若从统计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使得推断出现错误. D .以上三种说法都不对. 11、3. 通过e 1, e 2,
( )
A .回归分析 B .独立性检验分析 C .残差分析 D. 散点图分析
12、在独立性检验时计算的K 的观测值k =3.99,那么我们有的把握认为这两个分类变量有关系 ( )
A .90% B .95% C .99% D .以上都不对
2
, e n 来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分析称为
关注成长每一天
二、填空题(本大题共4小题,每题4分)
13、已知回归直线方程y =0.5x -0.81, 则x =25时, y 的估计值为. 14、如下表所示:
计算K . 15、下列关系中:
(1)玉米产量与施肥量的关系; (2)等边三角形的边长和周长; (3)电脑的销售量和利润的关系;
2
(4)日光灯的产量和单位生产成本的关系. 不是函数关系的是 .
16、在一项打鼾与患心脏病的调查中,共调查1768人,经计算的K =27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是 的.(填“有关”“无关”) 三、解答题(本大题共2小题,每题18分)
18、为考察某种药物预防疾病的效果, 进行动物试验, 得到如下列联表
能以97.5%的把握认为药物有效吗? 为什么?
2
关注成长每一天
18、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨) 与相应的生产能耗y (吨标准煤) 的几组对照数据
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y =bx +a ;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值3?2.5+4?3+5?4+6?4.5=66.5)
关注成长每一天
范文三:独立性检验
独立性检验
一、教材分析:
本节课选自人教B 版选修2-3第三章第二节的第一课时,在此之前,学生已学习了事件的互斥性、对立性、独立性的初步判断,相对于旧教材,本节是新增内容,也是传统统计内容的延续。通过本节的学习,学生对如何检验两个事件的独立性有了更全面的认识,对统计方法的基本思想及初步应用也有了更深的了解。
二、目标分析:
1知识与技能:通过对典型案例的探究,了解独立性检验的基本思想、方法及初步应用。
2过程与方法:教学中鼓励学生经历数据处理的过程,培养他们对数据的直观感觉,对于统计量的由来不做理论要求,避免学生单纯记忆和机械地套用公式进行计算。
3情感、态度与价值观:结合教学内容培养学生学习数学的兴趣,激励学生勇于创新。通过探索2*2列联表,体验认识事物的规律。
三、教学重点与难点:
重点:独立性检验的思想和方法。
难点:独立性检验的初步应用。
四、教法与学法分析:
鉴于本节内容是新增知识,数据又多不好处理,我将从学生的认知规律出发,让学生自主学习,运用讲授法、讨论法等充分调动学生的积极性,通过教师的组织,让学生对独立性检验的思想与方法加以了解。
五、教学过程
(一)、复习引入,提出问题
T 1:依次抛掷两枚硬币,请问:第一枚出现正面与第二枚出现正面有影响吗?
T 2:甲、乙两人投篮,甲投中的概率为0.4,乙投中的概率为0.6,求两人
都投中的概率。
设计意图:T 1想唤醒学生对两个事件是否独立的判断,问题比较简单,我们从自
然语言中,能够理解两事件是互不影响,相互独立的,T 2旨在让学生回忆独立事
件的概念,即用公式P(AB)=P(A)·P(B)来判断事件的独立性。为学生学习新知识做好铺垫。
(二)、案例分析,引入新课
案例1:由章节图的画面,探索男性和女性对晕机情况的分析。 案例2:探究患慢性气管炎是否与吸烟有关,也就是课本例1。
设计意图:通过案例分析使学生意识到现有的知识结构已不能解决现在的问题。从而提出提出今天的课题——独立性检验。引起他们的学习兴趣与探索欲望。
。
(三)、探索新知,解决问题
新课标倡导有利于学生积极主动、勇于探索的教学方式。在本节课中,如
果直接抛出公式,学生积极、活跃的思维就会被冻结,势必会打击学生强烈的求知欲。鉴于此原因,我采用以下的设计:师生共同阅读课本77-78页完成以下问题:
问题1 何为2×2列联表?
问题2 2×2列联表中的第2、3行或第2、3列能交换吗?
问题3 如何计算表中n 1+;n 2+;n +1; n +2;n 的值?
问题4 当事件A 与B 独立时,A 与B 、A 与B 、A 与B 关系如何?
问题5 卡方统计量是什么?
问题6 临界值是什么?如何利用它做独立性检验?
对于前四个问题,师生共同讨论交流不难做出解答,在问题3中学生对n 的求法容易出现错误,教师要做出提示,结合学生现有的认知水平以及新课标对于公式的推导不做严格要求只需了解,我对问题五略做解释。问题6中强调临界值有两个,可能性分别为95%和99%。
设计意图:本环节采用预设问题的形式充分调动学生的能动性,使学生感受理解统计方法的合情合理。对卡方统计量的认识更加深入、透彻。同时,通过师生互动和学生的合作交流解决了两个案例中的问题。锻炼了他们思维的完整性。
(四)小组讨论,归纳总结
给同学们充分的时间讨论完成课本例2—例5,按照新课程标准要求,结合本节的知识特点,这几个题目我让学生合作交流自主完成。总结用x 2进行独立性检验的步骤:
1、列出联表; 2、计算x 2; 3、作出判断;
教师只做巡视指导,给个别同学解疑答惑。并提出两点需注意的问题:(1)最终的统计判断,只是反映一种可能性大小。如例3中,99%的把握说员工“工
作积极”与“积极支持企业改革”是有关的,但并不是100个工作积极的员工中一定有99人支持企业的改革;(2)在2×2列联表中要求四个数据都大于5。
设计意图:通过学生的自主学习,加深了对x 2统计量的应用意识,小组讨论,合作交流的模式,加强了同学们的协作意识,增进了同学间的友谊,提高了课堂效率,每一个例题的解决都让学生体验了成功的乐趣,增强他们学习数学的信心。
(五)、当堂练习,归纳反思
让学生完成课本习题3—1 A组1,2题并反思本节所用思想。
设计意图:通过提问学生发现同学们对统计结论的描述不够准确,我们要及时加以纠正补充,完善他们的解题过程,锻炼学生的语言表达能力。并让学生进一步体验统计学在实际问题中的应用以及独立性检验的重要思想。从宏观上把握本节所学内容。
(六)布置作业
必做题:课本习题3—1 A组3、4
选做题:习题3—1 B
拓展题:现在的甲型H1N1问题比较严重,请同学们去统计:感染甲型H1N1病毒与年龄是否有关?
设计意图:通过作业判断学生掌握新知识的程度,培养学生自主学习的习惯,提高学生综合运用数学知识的能力。最后一题旨在让学生关注热点问题,关心社会,关心他人,并注意锻炼自己的身体,为以后的学习、工作打下良好的基础,将来成为对社会有用的人才。
(七)板书设计
六、教学评价
本节课从同学们熟悉的案例入手,通过师生的共同分析引导学生熟练应用卡方统计量解决实际问题,学生对如何检验事件的独立性有了更全面的认识。通过本节的学习,让学生掌握了数据处理的基本技能。在描述统计结论时,锻炼了学生的语言表达能力。数学课程要讲逻辑推理,因此,我在本节课的设计中,注重培养学生思维的连续性,引导他们去追寻数学发展的历史足迹,把数学的学术形态转化为学生易于接受的教育形态。
范文四:2独立性检验
独立性检验的基本思想及其初步应用复习学案
一.知识回顾:
1. 分类变量:
2. 列联表: 22?列联表
3. 独立性检验
随机变量 ()()()()()d b c a d c b a bc ad n K ++++-=2
2,其中 d c b a n +++=为样本容量。
查表后两种表述方式:①在犯错误的概率不超过 α的前提下,认为两个分类变量有关系;
α-1若 706. 22
706. 22>K ,则通过查表判断有多大的把 握说明两者之间有关系。
例 1 为调查某地区老年人是否需要志愿者提供帮助, 用简单随机抽样方法从该地区调查了 500名老人,结果如下:
⑵能否有 099的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
⑶根据⑵的结论你, 能否提出更好的调查方法来估计该地区的老年人中, 需要志愿者提供帮 助的老年人的比例?说明理由。
练习:
1. 在吸烟与患肺病两个分离变量的计算中,下列说法正确的是
A. 若 2K 的观测值为 635. 6=k ,我们有 0099
的把握认为吸烟与患肺病有关系,那么在 100个吸烟的人中必有 99人患肺病;
B. 从独立性检验可知,有 0099
的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他 有 099的可能患肺病;
C. 若从统计量中求出有 0095的把握认为吸烟与患肺病有关系,是指有 05的可能性使得推 断错误;
D. 以上三种说法都不正确
2. 若由一个 2×2 列联表中的数据计算得 2k =4.013,那么有 把握认为 两个变量有关系.
3. 下面是一个 22?列联表 则表中 a,b 的之分别是( ) A. 94,96 B. 52,50 C. 52,54 D. 54,52
4. 第 16 届亚运会于 2010 年 11 月 12 日至 27 日在中国广州进行,为了搞好接待工作, 组委会招募了 16 名男志愿者和 14 名女志愿者,调查发现,男、女志愿者中分别有 10 人 和 6人喜爱运动,其余不喜爱.
(2)根据列联表的独立性检验,能否在犯错误的概率不超过 0.10的前提下认为性别与喜爱运动有关? (3)如果从喜欢运动的女志愿者中 (其中恰有 4人会外语 ) , 抽取 2名负责翻译工作,则抽出的志愿者中 2人都能胜任翻译 工作的概率是多少? 2
范文五:独立性检验
独立性检验
教学目标:熟练掌握回归分析、建立回归模型、求各相关指数的步骤 重点难点:了解常用函数的图象特点,相关指数的计算、残差分析 参考公式:1、独立性检验临界值 2、回归
n
直线方程
n
??bx?a,其中b?y
?(x
i?1
n
i
?)(yi?)
?
i
?xy
ii?1
n
i
?nxy
,a???nx
2
?(x
i?1
?)
2
?x
i?1
2i
知识回顾:
1.已知x与y之间的一组数据:
A.(2,2)
则y与x的线性回归方程为y=bx+a必过点( )
B.(1,2) C.(1.5,0) D. (1.5,4)
2.已知每一吨铸铁成本y(元)与铸件废品率x%建立的回归方程y??8x?56,下列说法正确的是( ) A.废品率每增加1%,平均每吨成本增加64元 B.废品率每增加1%,平均每吨成本增加8% C.废品率每增加1%,平均每吨成本增加8元 D.废品率每增加1%,平均每吨成本为56元
3.
xy
(1 (2)据此估计广告费用为10万元时,所得的销售收入.
(?xi?145,?yi?11200
2
i?15
5
2
5
i?1
?x
i?1
i
yi?1270)
独立性检验
(1) 2×2列联表:统计被调查者的两种状态,每种状态又分两种情况的调查结果表.对于性别变量,其取值为男和
女两种,这种变量的不同值表示个体所属的不同类别,像这类变量称为分类变量. (2)为了研究事件X与Y
1
统计中有一个有用的(读做“卡方”)统计量,它的表达式是:
K
2
?
n(ad?bc)
(a?b)(c?d)(a?c)(b?d)
经过对统计量分布的研究,已经得到了两个临界值:3.841与6.635。
当根据具体的数据算出的k>3.841时,有95%的把握说事件A与B有关;
当k>6.635时,有99%的把握说事件A与B有关;当A与B是无关的.
例1气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行了对比,所得数据如下表,问:它们的疗效有无差异?
2
?11.098
??
2
345?(184?9?61?91)275?70?245?100
例2.在一个2×2列联表中,由其数据计算得?2=13.097, 则其两个变量有关系的可能性为 ( )
A 99% B 95%
C 90% D 无关系
例3.如果根据性别与是否爱好运动的列联表,得到k?3.852?3.841,那么判断性别与爱好运动有关时这种判断出错的可能性为( )
A.20% B.50% C.10% D.5%
例4某高校
“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
为了检验主修统计专业是否与性别有关系,根据表中的数据,查对临界值
2
所以有 的把握认为主修统计专业与性别有关系.[?=4.844>3.841] 基础练习:
1. 关于独立性检验问题,下面的说法中正确的是( ) A.若检验结果支持统计假设,就说明统计假设一定成立 B. 若检验结果不支持统计假设,就说明统计假设一定不成立 C.独立性检验能够对统计推断的可靠性的大小作出保证 D. 样本容量的大小不影响独立性检验的结论
2.考察棉花种子是否经过处理和棉花生病之间的关系,得到如下列联表(单位:株)种子经过处理与棉花生病列联表根据上数据,则(当??2.706认为没有充分证据显示两个分类变量有关)下列说法正确的是( )
2
2
A .种子是否经过处理跟棉花生病有关 B. 种子是否经过处理跟棉花生病无关 C.种子是否经过处理决定棉花是否生病 D.以上说法错误
3. 某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得?2≈3.918,经查对临界值表知P(?2≥3.841) ≈0.05(1)有95 %的把握认为“这种血清能起到预防感冒的作用”
(2)若某人未使用该血清,那么他在一年中有95%的可能性得感冒 (3)这种血清预防感冒的有效率为95 % (4)这种血清预防感冒的有效率为5%
4. 独立性检验中,假设H0:变量X与变量Y没有关系.则在H0成立的情况下,估算概率P(K2?6.635)?0.01表示的意义是
5. 为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2 ×2列联表
2
根据表中数据,得到?
?
50?(13?20?10?7)23?27?20?30
?4.844.则认为选修文科与性别有关系出错的可能性为
6.为了考察性别与是否喜欢饮酒之间的关系,在某地区随机抽取290人,得到如下2×2列联表
利用列联表的独立性检验判断性别与饮酒是否有关系?
??
2
290?(101?20?124?45)
146?144?65?225
2
?5.30?5.024
7. 某中学一位高三班主任对本班50名学生学习积极性和对待班级工作的态度进行长期的调查,得到的统计数据如下表所示:
(1)如果随机调查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太积极参加班级工作且学习积极性一般的学生的概率是多少?
(2)学生的积极性与对待班级工作的态度是否有关系?说明理由
3
K
2
?
n(ad?bc)
2
(a?b)(c?d)(a?c)(b?d)
?
50?(18?19?6?7)24?26?25?25
2
?11.538?10.828
8、2×2的列联表如下:
判断人的饮食习惯是否与年龄有关?
??
2
124(43?33?27?21)
70?54?64?60
2
?6.201
9.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人. (1)根据以上数据列出2?2列联表.
(2)并判断40岁以上的人患胃病与否和生活规律是否有关。
1、归纳推理
把从个别事实中推演出一般性结论的推理,称为归纳推理(简称归纳). 简言之,归纳推理是由部分到整体、由特殊到一般的推理。 归纳推理的一般步骤:
?通过观察个别情况发现某些相同的性质
?从已知的相同性质中推出一个明确表述的一般命题(猜想)?证明
2、类比推理
由两个(两类)对象之间在某些方面的相似或相同,推演出他们在其他方面也相似或相同;或其中一类对象的某些已知特征,推出另一类对象也具有这些特征的推理称为类比推理(简称类比)
例如: 金受热后体积膨胀,银受热后体积膨胀, 铜受热后体积膨胀,铁受热后体积膨胀, 归纳练习:
4
(i)由铜、铁、铝、金、银能导电,能归纳出什么结论?
(ii)由直角三角形、等腰三角形、等边三角形内角和180度,能归纳出什么结论?
(iii)观察等式:1?3?4?22,1?3?5?9?32,1?3?5?7?9?16?42,能得出怎样的结论? 例1:
bb+m
由此我们猜想?(a,b,m均为正实数)。
aa+m
23
?
2?122?222?3,?,?,? 3?133?233?3
例2:已知数列
?an?的第一项
a1?1,且an?1?
an1?an
(n?1,2,......),试归纳出这个数列的通项公式。
例3已知:a1?2,a2?1,a3?
23,a4?
12
,求an??
例4通过观察下列等式,猜想出一个一般性的结论,并证明结论的真假。
sin15?sin75?sin135sin
22
2
2
?
32?
20202
; sin30?sin90?sin150
?
32
;
32
45
?sin105
20
?sin165
2
32
; sin
2
60
?sin120
20
?sin180
2
?.
基础题:
1. 某同学在电脑上打下了一串黑白圆,如图所示,○○○●●○○○●●○○○…,按这种规律往下排,那么第36个圆的颜色应是 .
2.数列1,2,4,8,16,32,… 3.已知a1=3,a2=6,且an+2=an+1-an,则a33为
4.(1)已知等差数列的定义为:在一个数列中,从第二项起,如果每一项与它的前一项的和都为同一个常数,那么这个数列叫做等和数列,这个常数叫做该数列的公和.
类比等差数列的定义给出“等和数列”的定义: (2)已知数列?an?是等和数列,且a1?2,公和为5,那么a18的值为____________ 5.将全体正整数排成一个三角形数阵:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 ? ? ? ? ? ?
5
(i)由铜、铁、铝、金、银能导电,能归纳出什么结论?
(ii)由直角三角形、等腰三角形、等边三角形内角和180度,能归纳出什么结论?
(iii)观察等式:1?3?4?22,1?3?5?9?32,1?3?5?7?9?16?42,能得出怎样的结论?
例1:
bb+m由此我们猜想?(a,b,m均为正实数)。aa+m23?2?122?222?3,?,?,? 3?133?233?3
例2:已知数列?an?的第一项a1?1,且an?1?an1?an
(n?1,2,......),试归纳出这个数列的通项公式。
例3已知:a1?2,a2?1,a3?23,a4?12,求an??
例4通过观察下列等式,猜想出一个一般性的结论,并证明结论的真假。
sin15?sin75?sin135
sin2202020?032?20202; sin30?sin90?sin1500?032;3
2450?sin10520?sin16523
2; sin2600?sin12020?sin1802?.
基础题:
1. 某同学在电脑上打下了一串黑白圆,如图所示,○○○●●○○○●●○○○…,按这种规律往下排,那么第36个圆的颜色应是 .
2.数列1,2,4,8,16,32,…
3.已知a1=3,a2=6,且an+2=an+1-an,则a33为
4.(1)已知等差数列的定义为:在一个数列中,从第二项起,如果每一项与它的前一项的和都为同一个常数,那么这个数列叫做等和数列,这个常数叫做该数列的公和.
类比等差数列的定义给出“等和数列”的定义:
(2)已知数列?an?是等和数列,且a1?2,公和为5,那么a18的值为____________
5.将全体正整数排成一个三角形数阵:
1
2 3
4 5 6
7 8 9 10
11 12 13 14 15
? ? ? ? ? ?
根据以上排列规律,数阵中第n(n≥3)行的从左至右的第3个数是________
6.把正整数按一定的规则排成了如右图所示的三角形数表.设aij是位于这个三角形数表中从上往下数第i行、从左往右数第j个数,如a42=8.若aij=2009,则i与j的和为( )
A.105 B.106 C.107 D.108
7.在数列{an}中,a1=1,an+1=
2an2?an ,n∈N*,猜想这个数列的通项公式是什么?这个猜想正确吗?说明理由. 32228.已知:sin30°+sin90°+sin150°= 23sin25°+sin265°+sin2125°=2
通过观察上述两等式的规律,请你写出一般性的命题,并给出证明.