范文一:综合与实践内容分析
作者:孙兴华
小学数学教育 2013年02期
《义务教育数学课程标准(2011年版)》(以下简称《标准(2011年版)》)的“综合与实践”领域是义务教育阶段数学课程中一个较新的内容,它反映了数学课程与数学教学改革的要求,也为学生提供了一种通过综合、实践的过程去做数学、学数学、理解数学的机会.提高对这个领域内容的理解和解读能力,对于数学课程的发展和数学教学的改革是非常重要的.《标准(2011年版)》指出:“综合与实践”是指一类以问题为载体、以学生自主参与为主的学习活动.在学习活动中,学生将综合运用“数与代数”“图形与几何”“统计与概率”等知识和方法解决问题.“综合与实践”的教学活动应当保证每学期至少一次,可以在课堂上完成,也可以课内外相结合.
一、《标准(2011年版)》对第一、二学段“综合与实践”的要求
《标准(2011年版)》对第一学段的“综合与实践”的要求是:
1.通过实践活动,感受数学在日常生活中的作用,体验运用所学的知识和方法解决简单问题的过程,获得初步的数学活动经验.
2.在实践活动中,了解要解决的问题和解决问题的办法.
3.经历实践操作的过程,进一步理解所学的内容.
《标准(2011年版)》对第二学段的“综合与实践”的要求是:
1.经历有目的、有设计、有步骤、有合作的实践活动.
2.结合实际情境,体验发现和提出问题、分析和解决问题的过程.
3.在给定目标下,感受针对具体问题提出设计思路、制订简单的方案解决问题的过程.
4.通过应用和反思,进一步理解所用的知识和方法,了解所学知识之间的联系,获得数学活动经验.
可以看出,综合与实践在不同学段以不同形态呈现,第一学段以“实践活动”为主,主要强调学生的实践;第二学段以“综合应用”为主,在继续强调实践经验的基础上,增加了综合应用的要求.为了让学生体会数学与现实世界的联系,树立正确的数学观,根据小学生的年龄特点,第一、二学段主要以密切数学与生活的联系为主,立足于小学生的知识经验、生活经验、思维经验.如,《标准(2011年版)》附录2中的例22“上学时间”.让学生记录自己在一个星期内每天上学途中所需要的时间,并从这些数据中发现有用的信息.这个活动适用于第一学段的二、三年级,有利于培养学生的数据分析意识:知道在现实生活中,有许多问题可以先调查数据,通过对数据的分析得到结论;如果把记录时间精确到分,可能学生每天上学途中需要的时间是不一样的,可以让学生感悟数据的随机性;更进一步,让学生感悟虽然数据是随机的,但数据较多时具有某种稳定性,可以从中得到很多信息.
通过类似的与生活密切相关的问题,可以帮助学生认识到数学与社会生活有着密切的联系,事物的状态可以用数去刻画.“实践与综合”本质上是一种解决问题的活动,《标准(2011年版)》分阶段安排一些实践活动,以提高学生综合应用知识解决实际问题的能力.综合应用数学知识解决问题是发展学生数学思维的重要途径,开展综合实践活动的关键要让学生积极展开思维活动.
二、综合与实践内容的选择
综合与实践内容的选择,既要服务于义务教育阶段数学课程的整体目标,又要彰显综合与实践活动课程的特殊功能和特殊目标,所以,综合与实践活动内容的选择要特别突出“综合”.“综合”体现在三个方面:一是数学各部分知识之间的融会贯通;二是打破学科界限,与其他学科知识的沟通与融合;三是表现为解决问题的过程要求学生的各种能力、各种方法、各种工具的综合.它不应该是一个具体知识点的直接应用,不应该是已有数学知识、方法反射式的套用,应该是学生运用不同的数学知识、方法、活动经验、思维方式等解决实际问题或探索数学规律.不仅仅是反映知识和方法的综合,还应包括在数学学习中积累的活动经验、思考问题的方式、与他人合作交流的体验等各方面的综合.因此,这种综合应用必须在解决实际问题的过程中实现,同时也必将有利于学生在知识技能、数学思考、解决问题、情感态度等方面的全面发展.
比如在第一学段,学生学过的知识很有限,综合主要指待解决的问题与学生现有的生活经验的整合,能力和方法的综合主要表现为在教师引领下的观察、发现、表述、计算、操作.如,《标准(2011年版)》附录2中的例20“图形分类”.这个案例突出表现了数学中的“分类”与学生的日常生活实际的综合,比较符合小学低年级学生的认知水平.本活动的目的是希望学生能够清楚,分类是要依赖分类标准的,如扣子的形状、扣子的颜色或者扣眼的数量都可以作为分类的标准,而在不同的分类标准下分类的结果可能是不同的.一方面,本活动将有利于培养学生把握图形的特征、抽象出多个图形的共性的能力.另一方面,活动还要求学生运用文字、图画或表格等方法记录对扣子进行分类后的结果,这有利于培养学生整理数据的能力.
三、综合与实践活动的形式
综合与实践活动要特别突出“做”、突出“过程”,“综合与实践”的实施是以问题为载体、以学生自主参与为主的学习活动.小学数学实践与综合应用的教学不同于普通数学课,但它也有一个教学过程,即在教师指导下学生自主活动的过程,是教师的指导和学生自主活动紧密结合的过程.该过程是围绕活动主题的主要任务展开的,一般有以下环节:选择确定课题——制定活动方案——准备材料——动手实验——观察记录——解释讨论——得出结论——表达陈述——总结评价.
在综合与实践教学活动中,教师要通过问题引领,让学生全程参与实践过程,经历相对完整的学习活动.它的核心是学生在教师的引导和帮助下有目标的、自主的实践活动.它不是仅由例题、习题组成,在活动形式上要鼓励学生独立思考、多采用诸如小组合作、实景观察、实地测量、动手操作、直接收集数据、问卷调查、真实数据计算等活动形式,使学生能真正“动起来”,在活动中积累数学活动经验,提升数学能力和素养.在实施过程中,教师要注意观察、积累、分析、反思,使“综合与实践”的实施成为提高教师自身和学生素质的互动过程.
综合与实践活动可以形式多样,主要有以下几种:
1.数学小调查.数学小调查是指学生在教师指导下,从生活中选择和确定调查专题,主动获取信息、分析信息并作出决策的学习活动.
2.小课题研究小课题研究是指学生在教师的指导下,以认识和解决某一问题为目的,经历收集信息、处理信息和得出结论等过程的学习活动.对于小学生来说,具体包括调查研究、实验研究和查阅资料等.
3.动手做的活动.动手做的活动是指学生在教师的指导下,以认识和解决某一问题为目的,经历提出问题、动手做实验、观察、记录、解释讨论、得出结论和表达陈述等过程的学习.
4.数学小游戏.抽象的数量观念、空间观念与儿童具体形象的思维活动之间需要有适宜的中介桥梁将它们联系起来,游戏活动能够起到这样的作用.特别对于小学生来说,数学小游戏是一种非常适宜的方式,随时都可以进行,新课程数学教材中已经包含了大量游戏的成分.
5.数学知识拓展型活动课.这一类型的活动课就是用一些与数学有关的人、事、物为内容的活动课.如方程史话、圆周率、有趣的数字编码等数学知识,让学生在收集、交流的过程中体会数学的魅力,激发学习数学的兴趣,树立学习的信心.
四、综合与实践在实施中应注意的问题
在指导学生开展综合与实践活动时,要注意转变两个观念:第一,要转变“教师一定要教给学生知识”的观念;第二,要转变“学习活动应该使学生得到明确的或最好的结论”的观念.
在综合与实践教学过程中,应特别关注以下三个方面:
1.问题.在综合与实践活动中,一定要明确需要解决的问题.在第一学段,可由教师给出问题,学生尝试解决;在第二学段,除了由教师或教科书提供问题,应鼓励学生自己尝试发现和提出简单情境中的问题.
2.过程.在综合与实践活动中,关注学生经历活动的整个过程是非常重要的,在活动过程中学生会有丰富的表现,可以积累数学活动的经验,提升学生的应用意识与创新意识,过程比结果更重要.
3.综合.在综合与实践中,综合是不容忽视的一个主要方面,这里的综合是指:数学内部各分支之间的综合(如几何和代数的综合),数学和其他学科之间的综合,数学与学生生活实际的综合,学生通过数学学习得到综合的发展.
在教学操作时应注意以下几方面:
第一,指导学生选好题目.课题选择宜突出综合性,避免内容的单一性;课题(任务)的表述尽可能做到真实.
第二,明确活动目标.确定目标有两方面的含义.一是从教学角度来说,教师要明确本次活动所要达到的“教学目的”;二是从学生活动角度来说,要使学生明确所要完成的任务的各方面指标.
第三,充分发挥学生的主体性.在综合与实践教学活动的组织实施中,要注意让所有学生都能真正参与到数学活动中去,形成人人参与活动的学习氛围.教师在组织活动时应注意创设富有“弹性”的活动情境,即同一活动能够满足不同学生的需要.
第四,鼓励学生思考方法的多样化.教师应鼓励与尊重学生的独立思考,引导学生进行讨论与交流,不以定论的方式传授知识和培养学生合作精神是综合与实践活动组织实施的两个基本支撑点.
第五,关注学生的学习过程.与其他领域相比,综合与实践的教学更应注重学生的学习过程.
第六,突出活动的开放性,强调合作交流.在综合与实践教学活动的组织实施中,要注意从单一课堂学习活动走向多维度社会化数学活动,这就要求一方面教师在课堂里应有意识地留下一些“悬而未解”的问题,让学生处于暂时的不平衡状态,促使他们课外进一步去探索和解决问题,从而让有限的课堂教学时间收到更大的教学效益;另一方面教师还可以结合所学内容,组织学生走出课堂,深入社会,参加一些有意义的社会实践活动.
作者介绍:孙兴华,吉林省长春市树勋小学.
范文二:内容分析与教学建议
内容分析与教学建议
无穷级数概念的形成是伴随着极限概念的形成而形成的,无穷级数的理论是伴随着微积分理论的发展而发展起来的。如今,无穷级数是表达函数、数值计算等方面的重要工具,已经渗透到科学技术的很多领域。 (一)数项级数
1、可通过圆的内接多边形逼近圆的面积等实例引入级数的概念。级数的收敛、发散及收敛级数的和是本章最基本的概念,要求学生正确理解,至于级数的运算性质,可结合例题说明
1??1
+ ∑2n n ?≠
?性质的应用,及注意和有限数的运算性质相比较。如n =1?
∞
∞
∑2
n =1
1
n
1
+
∑n
n =1
1
等等。
2、正项级数的审敛法是其他级数审敛法的基础,应予以足够重视。比较审敛法是个难点,这个方法要点是:将所讨论的级数的一般项通过放大或缩小,使之与已知其审敛性的等比级数(或P –级数)一般项相联系。要通过不断运用使学生理解并掌握。
3、任意项级数中,交错级数占有重要地位,不但要求学生学会其证明定理、领会其方法,而且要给学生指出莱布尼兹判别法仅仅是充分条件,而非必要条件,另外,判别一个任意项级数是否绝对收敛、条件收敛有技巧,因此要交给学生一个一般的判别步骤。
4、义积分与无穷级数都是“无限求和”的概念,研究的思想及方法类似,可通过类比无穷级数审敛法,达到广义积分的审敛法。
本讲是选学内容,可根据专业适当取舍。
(二)幂级数
1、关于幂级数收敛域之特点,主要是通过阿贝尔定理来解决,可结合画图、分类讨论说明收敛半径存在,并提示收敛域是一个连成一片的完整区间(R =0特例)。
注:新大纲规定,收敛区间 = 收敛域;
2、关于收敛半径的求法,要交代其基本思想是正项级数判别法(通常用比值或根值),并通过几个典型例题给出其一般常见情形收敛半径之求法;
3、将函数展开成幂级数以及求幂级数在收敛区间内的和函数是本章的又一难点,它们是一个问题的两个方面,讨论方法也是类同的。基本思想是转化为六个基本初等函数,转化方法:重点介绍逐项求导和逐项求积;
4、关于泰勒定理及泰勒级数理论、应用及理论价值较大,内容也很丰富,应讲清它们的形成方法和意义。引入泰勒级数通常有两种方法,一种是由泰勒定理过渡,另一种由展开式唯一而得到,教师视其情况而定;
x
5、关于幂级数应用,首先应给出一般公式,其次要结合例题如何f (x ) ,0,?x 及n ,
困难往往在于如何估计截此误差
r n =u n +1+u n +2+
,这种级数一般为两种情形,一种是
正项级数适当放大变成一个等比级数;另一种是交错级数,如果满足莱不尼兹准则,则r n ≤u n +1
(u n +1>0)。
(三)傅立叶级数
1、类比幂级数,引入傅立叶级数,介绍其傅立叶级数意义、方法和应用; 2、讲解傅氏公式之前,给出其三角函数系及其正交性质;
3、要讲清f (x ) 与f (x ) 的傅立叶级数之关系,会区分下列两式之含义
a 0
∞
f (x ) 2f (x ) =
a 02
+
∑(a
n =1∞
n
cos nx +b n sin nx )
+
∑(a
n =1
n
cos nx +b n sin nx )
4、要结合例题,讲透狄氏定理条件,尤其是和函数,并从几何上比较f (x ) 的图形异同点;
π]以2π为同期,然后 5、函数展成傅氏级数时,由简单到复杂,步步深入,先讲[-π,
再讲周期延拓,正(余)弦级数,奇(偶)延拓,再推广到任意区间。
二、补充例题
?1?
n ?(-1) a n ∑ a +1?∑{a }?是否收敛?例1.设正项数列n 单调减少,且n =1发散,试问级数n =1?n
∞
∞
n
并说明理由
?1?
?∑ a +1?
?收敛,理由如下: 解: 级数n =1?n
∞
n
由于正项数列
{a n }
单调减少且有下界0,故n →0
∞
lim a n =a
存在,且a ≥0;若a =0,
则由莱不尼兹判别法知交错级数
∑(-1)
n =1
n
a n
收敛,这与题设矛盾,故a >0,于是
n ∞?1??1?1??1 ?<1>1><1∑ a="">1∑>< a="">
a n +1a +1??a +1n ???知?而n =1是公比a +1的几何
n
11
n
级数,故收敛。
∴
由比较判别法知原级数收敛。
?
= 1+ ?
a k +1?
??a k ??
(
a k -a k +1≤2
)(
a k -a k +1
)
∴
?a k +1?
?≤1 a ??k ?
n
S n =
∑
k =1
a k -a k +1
a k
所以
∞
≤2
∑
k =1
∞
(
a k -a k +1
)
=2
(
a 1-a k +1<2a>2a>
)
∑
即正项级数n =1
∴
a n -a n +1
a n
的部分和数列
{S n }
有上界2a 1。
由基本定理知该级数收敛。
x 0
1
∞
a =a n +1+a n (n =1, 2 )
例2 例2 设a 1=1,a 2=1,n +2,,
2, 证明级数n =1
∑a
n
x 0
n
绝对 收敛. a n +1
=
a n +a n -1
a n
=1+
a n -1a n
<>
证: 由
a n
3
n -1
得:
a n +1<2a n="">2a><2?2a n="">2?2a><2a n="">2a><><2a 2="">2a>
n -1
故
a n x 0<>
n n -2
?x 0
∞
n
=
14
n
(2x )
n
∞
1
由题设
2x 0<>
,因此级数
2x ∑4
n =1
收敛. 用比较判别法知级数n =1
∞
∑a
n
x 0
n
绝对收敛.
{a }例3. 例3. 设n 是单调递减的正值数列,证明n =1
证:因为
∑
a n -a n +1
a n
收敛.
{a n }单减,故该级数是正项级数
=
a k +
a k
a k +1
?
a k -a k +1
又
a k
(
a k -a k +1
)
?=?1+??a k +1?
??a k ??
(
a k -a k +1≤2
)a k -a k +1
)
?
?
n
a k +1a k
?≤1???
n
S n =
∑
k =1
a k -a k +1
a k
≤2∑
k =1
(
a k -a k +1
)
所以
=2
(
∞
a 1-a k +1<2a>2a>
)
∑
即正项级数n =1数收敛.
a n -a n +1
a n
{}的部分和数列S n 有上界2a 1,所以由基本定理知该级
例4. 例4. 设f (x ) 在x =0点的某领域内具有二阶连续导数且x →0
∞
lim
f (x ) x
=0
,证明级数
∑
n =1
?1?
f ?
?n ?绝对收敛
f '(0) =lim
f (x ) -f (0)
x -0
=lim
f (x ) x
=0
证: 由题设有f (0) =0,
x →0x →0
,f (x ) 在x =0某
个领域内一阶泰勒公式为
f (x ) =f (0) +f '(0) x +
12!
2
f ''(θx ) x =
12
2
f ''(θx ) x
(0<><>
再由题设f ''(x ) 在包含于该领域内的某闭区间[-l , l ]上连续,故?M >0,使
f ''(x ) ≤M
,?x ∈[-l , l ],于是?x ∈[-l , l ]有
f (x ) =
12
2
f ''(θx ) x ≤
12
Mx
2
1
∞∞
11?1?1?1?
f ≤M ?f ?x =2∑ n ?∑n 2
n ?2n ?n n n =1 取,有(当充分大时),因为收敛,故n =1??
绝对收敛。
∞
例5. 例5. 已知
∑a
n =1
n
(x -1)
∞
n
在x =-1处收敛,判别级数在x =2处收敛性.
∞
n
解: 令t =x -1,则级数n =1
∑a
t
n
在t =-2处收敛。当x =2时,t =1,由于n =1
∑a
n
t
n
收
∞∞
敛半径R ≥2,故n =1对收敛.
∞
∑a
t n
n
在t =1处绝对收敛,即幂级数
∑a
n =1
(x -1) n
n
在x =2处绝
例6. 求n =1
∑
2+(-1)
2
n
n
x
n
的收敛半径.
解: (此题不能用比值判别法求收敛半径R )
∞
由n =1
∑
2+(-1)
2
n
n ∞
x
n
=∑
n =0
12
n -1
∞
x +
n
∑
n =0
(-1) 2
n
n
x
n
两个级数的收敛半径皆为2,故原级
数收敛半径为2.
此题还可由根值判别法:
lim
n
由
n →∞
u n (x ) =
12
x
,当
x <2x>2x><>
,级数收敛; ,级数发散。
当 ∴
R =2.
∞
例7. 求级数n =0
∞
∑
(n +1) n !
2
的和.
2
∞
S (x ) =
解: 设
∑
n =0
(n +1) n !
x
n
,收敛半径R =+∞,所求级数和为S (1) ,由
∞
e =
x
∑
n =0
x
n
n ! 两
xe
x
=
端乘x 得:
(x +1) e =
x
∑
n =0∞
x
n +1
n ! ,
x
∞n
求导得:
∑
n =0
n +1n !
x
,
两端乘x 得:
x (x +1) e =
∑
n =0
n +1n !
∞
x
n +1
, (n +1) n !
2
(x +3x +1) e =
2x
求导得:
∞
∑
n =0
x
n
=S (x )
S (1) =
由此得:
∞
∑
n =0∞
(n +1) n !
2
=(1+3+1) e =5e
2
.
∞
例8. 设级数
∑a
n =1
n
和
∑b
n =1
n
皆收敛,且
a n ≤c n ≤b n
,(n =1, 2 ),证明级数
∑c
n =1
n
收敛.
∞∞
n
∞
n
证: 令
∞
u n =b n -a n
,
∞
v n =b n -c n
,则n =1
∑u
和n =1
∑v
均为正项级数,因为级数n =1
∑v
n
和
∑a
n =1
n
收敛,则
∑u
n =1
n
收敛,又因为
v n =b n -c n ≤b n -a n =u n
∞
∞
由比较判别法知n =1
∞
∑v
∞
n
收敛,由于
c n =b n -(b n -c n ) =b n -v n
,而级数
∑b
n =1
n
,
∑v
n =1
n
均收敛,故
∑c
n =1
n
收敛.
x
1
2,幂级数
例9. 设a 1=a 2=1,a n +1=a n +a n -1(n =2, 3, 4 ),证明对于
∞
∑a
n =1
n
x
n -1
收敛,并求其和函数.
解:
a >0, a 4>0, , a n >0, 且a n +1>a n a 1=a 2=1及a n +1=a n +a n -1,易知3,
a n +1x a n x
n
n -1
=
a n +1a n
x =
a n +a n -1
a n
x <>
x
1
∞
由比值法知:当
∞
2x <>
,即2,n =1
∑a
n
x
n -1
收敛.
设n =1
∑a
n
x
n -1
的和函数为S (x ) ,则
∞
∞
n
S (x )
=
∑a
n =1
x
n -1
=a 1+a 2x +
∞
∑a
n =3
n
x
n -1
=a 1+a 2x +
∑(a
n =3
∞n =2
n -1
+a n -2) x
n -1
n -1
∞
=a 1+a 2x +x ∑a n x
+x
2
∑a
n =1
n
x
n -1
?∞?n -12
=a 1+a 2x +x ∑a n x -a 1?+x S (x )
?n =1?
=a 1+a 2x +x [S (x ) -a 1]+x S (x ) =1+x +x [S (x ) -1]+x S (x ) =1+(x +x ) S (x ) 2
S (x ) =1+(x +x ) S (x ) S (x ) =
2
2
2
2
11-x -x
2
1??x <>
2??
例10.已知函数f (x ) =x ,0
① 设周期为2π,将f (x ) 展开为傅里叶级数;
1
② 由此证明1+ =
2
+
12
2
+
13
2
+ +
1n
2
+ =
π
2
1
2
6及1
-
12
2
+
13
2
- -(-1)
n -1
1n
2
π
2
12;
10
?③ 曲面求积分
ln(1+x )
x a 0=
1
dx
的值. π
1
解 ①
??
2π
x dx =
2
2
83
π
2
1n π
a n =
2π0
π
x cos nxdx =
?
2π0
x d sin nx
2
?
??
2π1?22π
=x sin nx 0-2?x sin nxdx
?0?n π
2π24
=2?xd cos nx =2
n (n =1, n π0
2, 3 )
a n =
1
π
?
2π0
x sin nxdx =
2
1n π
?
2π0
x d cos nx
2
2π1?22π
=-x cos nx 0-2?x cos nxdx ?
?0?? n π?
1?222π?22π
=-4π-x sin nx 0+sin xdx
?n π?n π?0??
4π=-
n (n =1, 2, 3 )
f (x ) 在[0, 2π]傅立叶级数为
π?1?+4∑ 2cos nx -sin nx ?3n ? n =1?n
由于f (x ) 在(0, 2π) 内连续,根据收敛定理当0
4
∞
π
2
1
和x =2π时,级数收敛于2
43
∞
[f (0+0) +f (2π-0) ]=2π
2
2
,所以
x ∈(0, 2π)
2
π
2
π?1??x
+4∑ 2cos nx -sin nx ?=?
n ??2πn =1?n
4
∞
x =0或2π
② 令x =0,得 3
∞
π
2
+4∑
n =1
1n
22
=2π
2
, 4
2
2
∑
n =1
1n 4
2
1?
= 2π4?
∞
2
?π
-π?=36; ?
n
令x =π,得 3
∞
π
+4∑
n =1
(-1) n
2
=π
2
,
?π-π?=
?12.
2
2
∑
n =1
(-1) n
2
n -1
1?4= π4?3
2
?③
10
ln(1+x )
x
dx =lim +
ε→0?ε
1
ln(1+x )
x
dx
=lim +
ε→0
?ε
1
23n
?1?x x n -1x
x -+- +(-1) + ??dx x ?23n ?
三、补充练习
23n ??1x x n -1x =lim +?x -2+2- +(-1) + ?ε2
ε→023n ??
2
11πn -11=1-2+2- +(-1) + =2
23n 12
1. 判别下列级数的敛散性
∞
∞
① n =12n -1; ②
∞
∑
ln n
3
∑
n =1
n
2
n
n +
1n
n
1??
n +?
n ?; ?
③ n =1
2. 证明
∞
∑
?n +1?
??n ?
n 3
∞
; ④ n =1n n .
( ①收敛,②发散,③收敛,④发散 )
∞
∑
1
n
①①若
a n ≥0na n
,且n =1
a n ≥0
∑a
n
收敛,则n =1
∞
∑a
2n
2n
收敛;
②②若
a n
()有界,则n =1
∞
∞
∑a
收敛;
∞
③ ③,
∞
b n ≥0
且
∑
n =1
a n
∞
,a n
∑
n =1
b n
收敛,则
∑
n =1
a n b n
与
∑(a
n =1
∞
n
+b n
)
2
收敛;
④ ④若收敛,则n =1n (n )也收敛.
3. 判别下列级数是否收敛,若收敛,是绝对收敛,还是条件收敛?
n =1
∞
∑
a
2n
∑
a ≥0
①
∑
n =1
cos(n π) sin
π
∞
n ; ② n =12
∑
n
n
cos
n π3.
( ①条件收敛;②绝对收敛. )
4. 求下列级数的收敛区间
∞
① n =1ln(1+n ) ; ② n =1
∞
∑
(x -5)
n ∞
∑
∞
2
n
2n -1(-x )
n -1
n
x
2n -1
;
③
∑
n =1
(-1)
n
(x +2) n 4
n
2n
; ④ n =13
∑
n .
?22? -?, 22?[4, 6) ??;③[-4, 0];④(-3, 3]) ( ①;②
∞
5. 设幂级数为n =1
∑
2n +1n !
x
2n
∞
① ① 求其收敛区间; ②求其和函数; ③求
( ① (-∞, +∞) ; ②e
∞
∑
n =1
2n +1n !
2
n
值.
(
x
2
(2x +1) -1(-∞, +∞) ; ③5e 2. )
?
(-1
?
2
)
6. 求级数n =1
f (x ) =
∑
n x
2n -1
?1+x 3
的和函数. ?(1-x ) x
2
7. 7. 将
2-x -x
展开成x 的幂级数,并写出其收敛区间.
?n +1?x ?
n
?1∞?(-1) ∑?1+
n +1 32n =0??
(-1
?
x <>
??
8. 8. 将函数(1-x ) arctan x 展开为x 的幂级数,并求其收敛区间.
? x +?
∞
2
∑
n =1
(-1) 4n 4n -1
2
n
x
2n +1
9. 9. 函数
?2x
f (x ) =?
?3x
f (x )
的周期为2π
,
f (x )
?
(-1≤x ≤1) ??
?
在[-π, π]表达式为,
-π≤x <00≤x>00≤x><>
,将f (x ) 展开成傅立叶级数,并作出和函数图形.
∞
?π f (x ) =- 4
?
∑
n =1
???2n 5
cos(2n -1) x +(-1) sin nx ???2?n ?(2n -1) π??
π?
x +??2
f (x ) =?
?0??10. 10. 将函数
0≤x ≤
π
2
π
2
分
2π为周期的正弦级数和余弦
级数. f (x ) =
n π1?n π??ππ?2??sin +1-2cos sin nx , 0
2n 222?????n =1?3π8+
n πn π?ππ?1??π+2??cos -1+sin cos nx , 0≤x <,>,>
πn =1?n ?22n 222??? ?
2
∞
∞
f (x ) =
范文三:内容分析
内容分析法
图例
内容分析法:是一种对于传播内容进行客观, 系统和定量的描述的研究方法。 其 实质是对传播内容所含信息量及其变化的分析, 即由表征的有意义的词句推断出 准确意义的过程。内容分析的过程是层层推理的过程。
目录
文献分析系统
法源于社会科学借用自然科学研究的方法,进行历史文献内容的量化分析。 二次大战后,新闻传播学、政治学、图书馆学、社会学等领域的专家 学者与军事情报机构一起,对内容分析方法进行了多学科研究,使其应用 范围大为拓展。
编辑本段 特征
作为一种全新的研究方法,内容分析法在很多方面都不同于传统方法, 例如,从方法属性看,它虽然被列为社会科学研究方法,但明显受到自然 科学研究方法的渗透影响;从方法特点看,它既有独特的个性,又处处显 示出交叉性、边缘性、多样性??从以上定义来看,学者基本认同内容分 析法具有以下三个关键特性。
1 系统性
是指内容或类目的取舍应依据一致的标准,以避免只有支持研究者假 设前提的资料才被纳入研究对象。因此,首先,被分析的内容必须按照明 确无误、前后一致的原则来选择。选择样本必须按照一定的程序,每个项 目接受分析的机会必须相同。其次,评价过程也必须是系统的,所有的研 究内容应以完全相同的方法被处理。编码和分析过程必须一致。各个编码 员接触研究材料的时间应相同。总之, 系统评价 意味着研究自始至终只使 用一套的评价规则,在研究中交替使用不同的规则会导致结论混淆不清。
2 客观性
是指分析必须基于明确制定的规则执行,以确保不同的人可以从相同 的文献中得出同样的结果。这包括两层含义:①研究者的个人性格和偏见 不能影响结论。如果换一个研究者,得出的结论也应该是相同的。②对变 量分类的操作性定义和规则应该十分明确而且全面,重复这个过程的研究 者也能得出同样的结论。这就需要建立一套明确的标准和程序,充分解释
抽样和分类方法,否则,研究者就不能达到客观的要求,结论也会令人置 疑。
应该强调的是,在内容分析的前期阶段,研究者选择分析题目、制定 评价标准、定义分析类别和单元等过程基本上仍是主观的。内容分析法需 要研究者首先将文字的(或图画的)非定量的内容转化为定量的数据,这 一转化过程是根据理论引导观点来进行的。但一旦评价标准、分析的类别 和单位被确定,转化过程完成,其后续的研究过程就被认为是客观的了。 这时,研究者的个人意志不再能左右分析的数量结果,他必须按照确定的 评价标准、分析的类别和单位进行计量,计量出什么结果,就只能表述什 么结果。任何研究者都应该得出同样的结论。由此,内容分析法的客观性 被确立。
3 定量性
是指研究中运用统计学方法对类目和分析单元出现的频数进行计量, 用数字或图表的方式表述内容分析的结果。首先,内容分析的目的是对信 息实体作精确的量化描述。其次,统计数据能使研究者用最简要扼要的方 式描述研究结果。再次,统计数字有助于结论的解释和分析。定量性是内 容分析法最为显著的特征,是达到“精确”和“客观”的一种必要手段。 它通过频数、百分比、卡方分析、相关分析以及 T-TEST 等统计技术揭示传 播内容的特征。“定量”并不排斥解释。当研究者得出一组说明传播内容 特征的数据后,需要对这组数据进行解释,即说明数据的意义。
系统性、客观性和定量性相互关联,共同构成了内容分析法的主要特 征。
编辑本段 一般过程
内容分析法将非定量的文献材料转化为定量的数据,并依据这些数据 对文献内容做出定量分析和做出关于事实的判断和推论。而且,它对组成 文献的因素与结构的分析更为细致和程序化。
内容分析法的一般过程包括建立研究目标、确定研究总体和选择分析 单位、设计分析维度体系、抽样
分析过程
和量化分析材料、进行评判记录和分析推论六部分。
研究目标
在教育科学研究中,内容分析法可用于多种研究目标的研究工作。主 要的类型有:
·趋势分析。
·现状分析。
·比较分析
·意向分析
除上述几种目标类型外,内容分析法还可以用于其它目标的研究。 分析单位是指在内容分析法中描述或解释研究对象时,所使用的最小、 最基本单位。当分析单位比较大时,常常需要选择一些与其有关的中、小 层次的分析单位来加以描述、说明和解释。选择分析单位与具体的研究目 标、研究总体密切相关,并以它们作为确定和选择的基础。
设计分析维度及体系
分析的维度,又称分析的类目,是根据研究需要而设计的将资料内容 进行分类的项目和标准。设计分析维度、类别有两种基本方法,一是采用 现成的分析维度系统,二是研究者根据研究目标自行设计。第一种方法:先让两人根据同一标准,独立编录同样用途的维度、类别,然后计算两者 之间的信度,并据此共同讨论标准,再进行编录,直到对分析维度系统有 基本一致的理解为止。最后,还需要让两者用该系统编录几个新的材料, 并计算评分者的信度,如果结果满意,则可用此编录其余的材料。第二种 方法:首先熟悉、分析有关材料,并在此基础上制定初步的分析维度,然 后对其进行试用,了解其可行性、适用性与合理性,之后再进行修订、试 用,直至发展出客观性较强的分析维度为止。分析维度必须有明确的操作 定义。
设计分析维度过程基本原则:
·分类必须完全、彻底、能适合于所有分析材料,使所有分析单位都 可归入相应的类别,不能出现无处可归的现象。
·在分类中,应当使用同一个分类标准,即只能从众多属性中选取一 个作为分类依据。
· 分类的层次必须明确, 逐级展开, 不能越级和出现层次混淆的现象。 ·分析类别(维度)必须在进行具体评判记录前事先确定。
·在设计分析维度时应考虑如何对内容分析结果进行定量分析,即考 虑到使结果适合数据处理的问题。
抽取分析材料(抽样)
抽样工作包括两个方面的内容:一是界定总体,二是从总体中抽取有 代表性的样本。内容分析法常用的三种抽样方式是:
·来源取样
·日期抽样
·分析单位取样
量化处理
量化处理是把样本从形式上转化为数据化形式的过程,包括作评判记 录和进行信度分析两部分内容。
评判记录是根据已确定的分析维度(类目)和分析单位对样本中的信 息作分类记录,登记下每一个分析单位中分析维度(类目)是否存在和出 现的频率。要做好评判记录工作,需要注意以下几个方面:
第一,按照分析维度(类目)用量化方式记录研究对象在各分析维度 (类目)的量化数据(例如,有、无、数字形式、百分比)。
第二,采用事先设计好的易于统计分析的评判记录表记录。先把每一 分析维度的情况逐一登记下来,然后再做出总计。
第三,相同分析维度的评判必须有两个以上的评判员分别做出记录, 以便进行信度检验。评判记录的结果必须是数字形式。
第四,在根据类目出现频数进行判断记录时,不要忽略基数。
信度分析
内容分析法的信度指两个或两个以上的研究者按照相同的分析维度, 对同一材料进行评判结果的一致性程度,它是保证内容分析结果可靠性、 客观性的重要指标。
内容分析法的信度分析的基本过程是:
·对评判者进行培训;
·由两个或两个以上的评判者,按照相同的分析维度,对同一材料独 立进行评判分析;
·对他们各自的评判结果使用信度公式进行信度系数计算;
·根据评判与计算结果修订分析维度(即评判系统)或对评判者进行 培训;
·重复评判过程,直到取得可接受的信度为止。
计算内容分析信度的公式为:
平均相互同意度是指两个评判者之间相互同意的程度,计算公式为: n 为评判人数量, M 为两者都完全同意的类目数, N1为第一评判者分析 的类目数, N2为第二评判者分析的类目数。
统计处理
对评比判结果(所获得数据)进行统计处理。描述各分析维度(类目) 特征及相互关系,并根据研究目标进行比较,得出关于研究对象的趋势或 特征、或异同点等方面的结论。
编辑本段 常用工具
ROST content mining是一款免费的大型内容分析研究性工具平台,主 要功能包括:辅助各学科进行研究,协助完成文本分析和内容分析方面的 研究,凡是需要分析论文、微博、博客、论坛、网页、书籍、聊天记录、 电子邮件、本地文本类格式文件、数据库中各类文本字段的学科,都可以 使用本软件,分析方法目前支持:分词、字频统计、词频统计、聚类、分 类、情感分析(含简单和复杂)、共现分析、同被引分析,依存分析、语 义网络、社会网络、共现矩阵等分析方法。
目前 ROST content mining的总下载量超过 7000次,使用者遍布国内 外 100多个高校,包括北京大学、浙江大学、 华东师范大学 、武汉大学、 南开大学、厦门大学、四川大学、天津大学、东北大学、东北师范大学、 中南大学、中央民族大学、中山大学、北京科技大学、南京农业大学、南 京航空航天大学、山东大学、广州大学、武汉理工大学、江西师大、江西 理工大学、河南大学、河海大学、泰山学院、西南交通大学、长沙理工大 学、 Cambridge University (剑桥大学) 、 Loughborough University 、 Texas A&M University、日本北海道大学等。
利用该软件发表的论文包括:
互联网传播的台湾旅游目的地形象——基于两岸相关网站的内容分析 (旅游学刊,权威)
基于 ISI Current Contents Connect的学科网站研究——以气象学为 例(核心)
从 ASIS&T年会主题看情报学研究的热点及发展(核心)
基于主题图的学科信息资源知识组织研究(硕博论文)
基于学习共同体理论的社会化软件整合应用研究(硕博论文)
当前我国传媒经济研究的特点与问题(中国人民大学)
Emotion Mining Research on Micro-blog SWS 2009.8
Empirical Research on E-Government Based on Content Mining ICMeCG 2009.9
Research on Social Network Based on Meta-search Engine SWON2009.6
网络转载传播实证分析与 DSCCA 模型研究,新闻与传播研究 2009.3 The Grand Information Flows in Micro blog Journal of Information & Computational Science 2009.6
编辑本段 应用
内容分析法的适用范围比较广泛。就研究材料的性质而言,它可适于 任何形态的材料,即它既可适用于文字记录形态类型的材料,又可以适用 于非文字记录形态类型的材料(如广播与演讲录音、电视节目、动作与姿 态的录像等);就研究材料的来源而言,它既可以对用于其它目的的许多 现有材料(如学生教科书、日记、作业)进行分析,也可以为某一特定的 研究目的而专门收集有关材料 (如访谈记录、 观察记录、 句子完成测验等) , 然后再进行评判分析;就分析的侧重点讲,它既可以着重于材料的内容, 也可以着重于材料的结构,或对两者都予以分析。
在前瞻性的教育科研中,内容分析法可以用于对教育及教育研究的趋 势预测。在教育史的研究中,内容分析法能对文献的文字风格做出定量分 析,从而帮助鉴别文献的真伪。在对现实教育问题的研究中,内容分析法 同样能发挥作用,例如,可以用它来分析教材的结构,对教材编制的合理 性做出定量、定性的分析,也可以用它来分析学生的作业,对学生的错误 种类做出定量的描述;还可以用它来分析教师、学生或其它人的各种作品、 语言、动作、姿势,对教师、学生等的个人风格、个性特征做出判断。 内容分析法的适用范围虽然较广,但适于其的内容一般应具有能重复 操作、被人的感观体验、意义明显、可以直接理解等特征。通常对不具备 这样特点的、潜在、深层的内容不适于采用内容分析进行研究,否则难保 证结果的准确性和客观性。
传播学观点
内容分析法是媒介以及传播研究中一种非常重要的方法,是一种对传播内 容进行客观、系统和定量描述的研究方法,具有客观、方便、经济等优点。 内容分析的种类可归纳为:实用语义分析,语义分析和符号载体分析。内 容分析的研究模式有推理模式和比较模式两类。
内容分析法最早产生于传播学领域。 第二次世界大战期间美国学者 H.D. 拉斯韦尔等人组织了一项名为“战时通讯研究”的工作,以德国公开出版 的报纸为分析对象,获取了许多军政机密情报,这项工作不仅使内容分析 法显示出明显的实际效果,而且在方法上取得一套模式。 20世纪 50年代美 国学者贝雷尔森发表《传播研究的内容分析》一书,确立了内容分析法的 地位。真正使内容分析方法系统化的是 J. 奈斯比特,他主持出版的“趋势 报告”就是运用内容分析法,享誉全球的《大趋势》一书就是以这些报告 为基础写成的。
1981年, Krippendorf 出版了经典专著 《内容分析》 。 之后, Daniel Riff, Stephen Lacy 与 F. G. Fico 出版了 《内容分析法:媒介信息量化研究技巧》 , 这是又一本关于内容分析的书,该书提供了系统全面的内容分析研究的操 作指南,深入分析了内容分析中的各种常见问题,如测量、抽样、信度、 效度和数据分析中的各种技术,并附以大量案例,方便初学者学习和运用。 本书逻辑清晰,言简意赅,按照内容分析的步骤顺次介绍,操作性强,具 有很强的实际应用价值。这本书可以作为了解内容分析法的首选读物,是 传播学、政治学和其他社会科学、行为科学研究中不可缺少的参考资料。 内容分析法与 英国文化 研究学派所进行的文本分析有所不同。文本分 析主要采用的是符号学和结构主义的分析方法来分析文本(Text )的结构 和意义,探寻受众对意义的不同解读方式和文本中所隐藏的意识形态的操 纵力量,属于定性研究范畴;而内容分析主要是运用统计知识对传播的内 容(Content )进行分析与归类,目的是为了描述传播内容的固有倾向,说 明信息来源的特征等,属于定量研究的范畴。在早期的传播学研究中,内 容分析主要用于对印刷媒介内容的分析,如拉斯韦尔于 20世纪 20年代对 第一次世界大战 时期的宣传技巧进行的研究。随着传播学研究的深入和媒 介的发展,内容分析法的运用范围扩展到各种声音和图像讯息。
《内容分析法:媒介信息量化研究技巧(第 2版)》中译本由清华大 学出版社 2010年 10月出版。
目 录
第 1章 导论
● 大众传播研究概要
● 内容分析法与大众传播效果研究
● 内容分析法与内容产品的语境
● 内容处于传播过程的“中心”
● 描述是内容分析法的目标之一
● 研究应用:内容分析法与其他方法的联合
● 内容分析法在其他领域中的应用
第 2章 内容分析法是一种社会科学工具
● 对各种定义的评述
● 量化内容分析法的定义
● 内容分析法作为一种研究技术的若干问题
● 对显性内容进行量化分析的优点
第 3章 内容分析的研究设计
● 内容分析中的概念化、目的和研究设计
● 好的设计与差的设计
● 研究设计的要素
● 通用的内容分析法模型
第 4章 测量
● 传播内容的形式
● 用单位来测量内容
● 将信息单位与数字联系起来
● 测量的步骤
第 5章 抽样
● 抽样时段
● 抽样技术
● 对媒介进行分层抽样
● 关于媒介抽样的一般问题
● 对互联网抽样
● 对个体传播抽样
第 6章 信度
● 信度:基本概念
● 概念定义与类目建构
● 内容分析协议
● 编码员的训练
● 编码员信度的评估
● 类目信度的检验
第 7章 效度
● 对效度的概念化
● 测量的信度与效度问题
● 测量效度的检验
● 外部效度与内容分析中的意义
第 8章 数据分析
● 内容分析法的入门知识
● 内容分析法的基本原理
● 描述与概括研究发现
● 变量之间的关系
● 统计的假定
第 9章 计算机使用
● 运用计算机找到并接近内容
● 计算机内容分析
参考文献
传播学中运用时的主要步骤:提出假设;确定研究总体与样本,并抽 样;制定分类表,并将研究内容按分类表编码归类;统计计算,分析数据, 得出结论。
图书馆学情报学观点
内容分析法是一种 对文献内容作客观系统的定量分析的专门方法 ,其 目的是弄清或测验文献中
文献计量内容分析法
本质性的事实和趋势,揭示文献所含有的隐性情报内容,对事物发展作情 报预测。它实际上是一种半定量研究方法,其基本做法是把媒介上的文字、 非量化的有交流价值的信息转化为定量的数据,建立有意义的类目分解交 流内容,并以此来分析信息的某些特征。
内容分析法具有以下几个方面的优点:a. 较为客观的研究方法。内容 分析是一种规范的方法,对类目定义和操作规则十分明确与全面,它要求 研究者根据预先设定的计划按步骤进行,研究者主观态度不太容易影响研 究的结果;不同的研究者或同一研究者在不同时间里重复这个过程都应得 到相同的结论,如果出现不同,就要考虑研究过程有什么问题。 b. 结构化 研究。内容分析法目标明确,对分析过程高度控制,所有的参与者按照事 先安排的方法程序操作执行,结构化的最大优点是结果便于量化与统计分 析,便于用计算机模拟与处理相关数据。 c. 非接触研究。内容分析不以人 为对象而以事物为对象,研究者与被研究事物之间没有任何互动,被研究 的事物也不会对研究者做出反应,研究者主观态度不易干扰研究对象,这 种非接触性研究较接触研究的效度高。 d. 定量与定性结合。这是内容分析 法最根本的优点,它以定性研究为前提,找出能反映文献内容的一定本质 的量的特征,并将它转化为定量的数据。但定量数据只不过把定性分析已 经确定的关系性质转化成数学语言,不管数据多么完美无缺,仅是对事物 现象方面的认识,不能取代定性研究。因此这种优点能够达到对文献内容 所反映“质”的更深刻、更精确、更全面的认识,得出科学、完整、符合 事实的结论,获得一般从定性分析中难以找到的联系和规律。 e. 揭示文献 的隐性内容。内容分析可以揭示文献内容的本质,查明几年来某专题的客 观事实和变化趋势,追溯学术发展的轨迹,描述学术发展的历程;依据标 准鉴别文献内容的优劣。其次,揭示宣传的技巧、策略,衡量文献内容的 可读性,发现作者的个人风格,分辨不同时期的文献体裁类型特征,反映 个人与团体的态度、兴趣,获取政治、军事和经济情报;揭示大众关注的 焦点等等。
教育学观点:
在教育科学研究中,内容分析法既是一种主要的文献资料分析方法, 又是一种独立、完整的科学研究方法。
内容分析法具有对于明显的传播内容,进行客观而有系统的分析,并 加以量化描述的基本特征。内容分析法可以借助计算机进行数据的分析处 理,为使用现代信息技术处理研究问题提供了新的思路。
编辑本段 典型案例。
日本人巧妙搜集信息
第二次世界大战后,日本经济发展速度大大高于其他资本主义国家, 重视信息的开发、利用,不能不说是个重要原因。
目前日本的信息传递非常迅速,只要 5-10分钟就可以搜集到世界各 地金融市场的行情, 3-5分钟就可以查询并调用日本国内三万多个重点公
司、企业当年或历年经营生产情况的时间系列数据, 5分钟即可利用经济模 型和计算机模拟出国际国内经济因素变化可能给宏观经济带来影响的变动 图和曲线, 5-10分钟可以查询或调用政府制定的各种法律、法令和国会记 录。这种现代化的信息处理技术,大大提高了行政效率。
日本人十分重视信息的作用,时时处处留意信息的搜集,而且善于从 平淡无奇的信息报道中分离出重要的内容。例如, 20世纪 60年代中国开 发大庆油田,惟独日本和中国谈成了征求设计的买卖。原因是别的国家的 设计均不符合中国大庆油田的要求,而日本则事先按大庆油田的要求进行 产品设计,等待中国人去购买。那么日本人是怎么知道大庆油田的产品设 计要求呢?
其实日本人对大庆油田早有耳闻,但始终得不到准确的信息。后来, 日本人从 1964年 4月 20日出版的 《人民日报》 上看到“大庆精神大庆人” 的字句,于是日本人判断‘中国的大庆油田确有其事”。但是,大庆油田 究竟在什么地方,日本人还没有材料作出判断。从 1966年 7月的一期《中 国画报》封面上,日本人看到一张照片,铁人王进喜身穿大棉袄,头顶着 鹅毛大雪,猜测到“大庆油田是在冬季为零下三十度的东北地区,大致在 哈尔滨与齐齐哈尔之间”。后来,到中国来的日本人坐这段火车时发现, 来往的油罐车上有很厚的一层土,从土的颜色和厚度,证实了“大庆油田 在东北”的论断,但大庆油田的具体地点还是不清楚。 1966年 10月,日本 人又从《人民中国》杂志上找到了王进喜的先进事迹,从事迹介绍的分析 中知道:“最早钻井是在安达东北的北安附近下手的,并且从钻井设备运 输情况看,离火车站不会太远。”在该事迹介绍中还写有这样一段话:王 进喜一到马家窑看到大片荒野时说:“好大的油海!把石油工业落后的帽 子丢到太平洋去。”于是,日本人又从伪满州地图上查找到“马家赛是位 于黑龙江海伦县东面的一个小村,在北安铁路上一个小车站东边十多公里 处。”就这样,日本人终于将大庆油田的准确地理位置搞清楚了。
后来,日本人又从王进喜的一则事迹报道中了解到“王进喜是玉门油 矿的工人,是 1959年 9月到北京参加国庆之后志愿去大庆的”,由此日本 人断定大庆油田在 1959年以前就开钻了,并且大体上知道了大庆油田的规 模:“马家窑是大庆油田的北端,即北起海伦的庆安,西南穿过哈尔滨与 齐齐哈尔铁路的安达附近,包括公主峰西面的大贪,南北 400公里的范围。 估计从北满到松辽油田统称为大庆。”但是,日本人一时还搞不清楚大庆 的炼油规模。
从 1966年 7月《中国画报》上发表的一张大庆炼油厂反应塔的照片八 日本人推算出大庆炼油厂的规模。其推算方法很简单,首先找到反应塔上 的扶手栏杆,扶手栏杆一般是一米多一点,以扶手栏杆和反应塔的直径相 比,得知反应塔内径约为 5米。据此,日本人推断:大庆炼油厂的加工能 力为每日 900 Mi,如果以残留油为原油的 30%计算,原油加工能力为每
日 3000kl ,一年以 360天计算,则其年产量为 1000000kl 。根据这个油田 的出油能力和炼油厂规模,日本人得出结论:中国将在最近几年出现炼油 设备不足, 买日本的轻油裂解设备是完全有可能的, 以满足每日炼油 10 000 kl 的需要。这就是日本人在 1966年从中国公开报刊中获得的有关大庆油 田的重要信息,然后按他们估计的大庆油田要求进行产品设计。
此外,日本政府还特别重视信息机构的建设,外务省分布在世界 105个国家的 75个驻外使馆是其搜集外交信息的前沿阵地,这些机构为日本外 交提供各国动向的信息。外务省内有一个约 100人的电信部门,以三班倒 方式在 24小时内与世界各地保持不间断的联系, 平均每天处理公务电话电 报就有近 30O0封。在外务省的 63个部门中,只有电信部门拥有一栋独立 的四层楼,无特殊通行证的人不得进入。公务电报是用 110根专线和普通 线路收发的,这些公务电报都采取无法破译的密码。为了防止窃听还没有 隐线装置。 1988年还开始研究采用“宇宙通信系统”,即使在条件恶劣的 地区,也可确保通信畅通。
范文四:网络大数据的文本内容分析
BIG DATA RESEARCH 大数据
网络大数据的文本内容分析
程学旗,兰艳艳
中国科学院计算技术研究所 北京 100019
摘要
文本内容分析是实现大数据的理解与价值发现的有效手段。尝试从短文本主题建模、单词表达学习和网页排序学习3个子方向,探讨网络大数据文本内容分析的挑战和研究成果,最后指出未来大数据文本内容分析的一些研究方向和问题。
关键词
文本内容分析;短文本主题建模;单词表达;排序学习
doi: 10.11959/j.issn.2096-0271.2015029
Text Content Analysis for Web Big Data
Cheng Xueqi, Lan Yanyan
Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100019, China
Abstract
Text content analysis is an effective way to understand and acquire the “value ” of big fata. The challenges and research results were investigated in the three hot topics: topic modeling for short texts, word embedding and learning to rank for web pages. In the end, some remaining problems in this area were proposed.
Key words
text content analysis, topic modeling for short texts, word embedding, learning to rank
2015029-1
TOPIC 专题
数据文本内容分析的挑战和研究成果。
1 引言
伴随着互联网技术的迅猛发展和普及以及用户规模的爆发式增长,互联网已经步入了“大数据”时代。网络大数据的“大”,不仅仅体现在其体量巨大(大数据的起始计量单位至少是Petabyte1、Exabyte 2或Zettabyte3),而且还体现在其增长异常迅猛(通常是指数级的速率),数据类型多样(包括了文本、图像、声音、视频等),数据质量良莠不齐并且关联关系复杂。同时,网络大数据另外一个突出的特点就是其价值密度低,大数据中包含了大量重复、噪声和垃圾数据,存在大量共现但又毫无意义的关联模式,如果缺乏有效的信息处理手段提取网络大数据中潜在的价值,网络大数据不仅不能成为一个价值“宝藏”,反倒会成为一个数据的“坟墓”。
文本内容分析是网络信息处理的关键技术。网络大数据对于文本内容分析而言是一把双刃剑:一方面,网络大数据提供了需要文本分析丰富的数据源,大规模的样本资源可以更好地支持文本分析关键技术的发展;另一方面,网络大数据复杂的内在特征对传统文本分析技术提出了严峻的挑战。例如,网络大数据越来多地存在于电商、问答等私有化网络或者深网中,包括了结构化数据、半结构化数据和非结构化数据,数据的获取和存储更加困难;数据庞大的规模、复杂的关联关系,使得传统的文本分析和挖掘技术在计算的时空复杂度上激增;另外,迅猛的数据增长速率、巨大的数据体量也使得传统的全量计算模式(依赖于全体样本的计算模式)不再适用。本文从短文本主题建模、单词表达学习和网页排序学习3个子方向探讨网络大
2 文本内容分析关键技术
2.1 短文本主题建模
随着Web2.0、社交媒体和移动互联网等技术的发展,每个网民都成为了互联网上信息的创造者与传播者,促使网上文本信息爆炸式增长。与此同时,互联网上的文本内容形式也在不断变化。从博客到轻博客和微博、从邮件到论坛和即时通信、从新闻到评论等,一个显著的特点就是这些文本信息的长度越来越短。这是因为短文本信息编写简单随意,发布更为便捷。同时,短文本信息比长文本更简约、紧凑,能节省其他用户阅读消息的时间和精力。短文本信息比传统文本信息来源要广得多,更新频率也快得多,大大加速了互联网上信息产生与传播的速度。
海量的短文本数据中蕴藏着大量有价值的信息,但也给现有文本语义分析技术带来了新的挑战。与长文本相比,短文本信息内部上下文信息缺乏。此外,普通用户常常用语不规范,新词、多义词等比较普遍。因此,对一条短文本信息的理解要比长文本要困难得多。在以往的长文本语义分析领域,一种普遍的方法就是利用概率话题模型(如LDA[1]和PLSA[2])对文档内部的话题结构进行建模,然后利用统计推断手段学习出文档集合中潜在的话题以及话题结构。这些模型的一个基本假设是文档是话题的一个混合分布,其中每个词来源于一个话题。当文档长度较长时,可以较准确地根据文档中的词推断出文档的话题属性。然而,当文档很短(只有几个或十几个词,甚至少于话题的个数)时,由于数据不足,难以准确推断出文档中话题混合
2015029-2
3
1 Zettabyte=1×1021 byte1
1 Petabyte=1×1015 byte2
1 Exabyte=1×1018 byte
BIG DATA RESEARCH 大数据
分布的参数以及每个词的话题属性,从而影响话题学习的效果。
为克服短文本信息的数据稀疏性,一种简单做法是利用外部数据(如Wikipedia、搜索结果)扩充文档的表示,再利用现有的长文本语义建模工具处理。但这种方式的效果严重依赖于原短文本文档与扩充的外部数据的相关程度。对于
4
对于较长的文本,可认为在一个固定长度的窗口内的文本片段为一个上
下文。
更好地对短文本进行语义建模,提出了一种新的话题建模方法——双词话题模型(biterm topic model,BTM)[7]。BTM和传统基于文档产生式建模的话题模型的最大区别是,它通过建模文档集合中双词的产生来学习话题。这里,双词指的是在同一个上下文中共现的词对。由于一条短文本消息很短,可以简单地认为每条消息是一条上下文4。比如在“短文本语义建模”中,可以抽取出3个双词:(“短文本”,“语义”)、(“短文本”,“建模”)、(“语义”,“建模”)。其直接体现了词的共现关系,因此采用双词作为建模单元。直观地讲,两个词共现次数越多,其语义越相关,也就越可能属于同一话题。根据这一认识,假设每个双词由同一个话题产生,而话题从一个定义在整个语料集合上的话题混合分布产生。与LDA相比,BTM通过直接建模双词(即词共现模式)来学习话题,从而避免短文本文档过短导致的文档建模困难问题。二者的图模型表示如图1所示。实验结果表明,BTM在短文本上的效果相比LDA等传统方法有明显提升,而且在长文本上的效果也不输于LDA。
除了长度短之外,互联网上的短文本大数据还具有规模大、更新快的特点。为此,提出了BTM的两种在线学习算法:在
[8]
线BTM(oBTM )和增量BTM(iBTM )。
一些实时性强的数据(如微博),要找到合适的外部数据源是很困难的。为此,很多人尝试利用内部数据扩充文档的表示,如伪相关反馈、加入短语特征[3]、相关消息聚合[4]等。无论是利用外部数据扩充,还是利用内部数据扩充,都面临着扩充数据选择不当带来额外噪音的风险。另外,这两种方法并没有从模型上带来任何改变,只是治标不治本。另外,一些研究者[5,6]则提出一条短文本消息只包含一个话题,将短文本消息用单词混合模型(mixture of unigrams)建模。该方式虽然可缓解参数估计时的数据稀疏性问题,但对短文本消息的建模过于简化。现实情况下,一条短文本消息仍然可能包含多个话题,尤其是在话题粒度较细的时候。此时,单词混合模型无法区分。
由于短文本消息和长文本文档显著不同,传统面向长文本的话题建模方法并不能简单地套用到短文本文档上。为了
图1 LDA和BTM 的图模型表示
2015029-3
TOPIC 专题
这两种算法的主要思想是用最近时间段内接收到的数据来持续更新模型,而不必反复计算较久远的历史数据。这两种算法不仅可以用来处理大规模流式短文本数据,其学到的模型还可以即时反映话题的动态变化,比较适合用于大规模流式短文本语义建模。在微博等互联网应用中,短文本信息还具备很强的时效性,因此其潜在的话题结构也会剧烈变化。尤其受一些突发和热点事件、活动的影响,每天都可能涌现出大量的突发话题。为了对微博中突发话题建模,在BTM的基础上提出了一种突发双词话题模型(BBTM或Bursty BTM)[9]。BBTM 的做法是利用双词的突发性来指导突发话题的建模。原因是双词的突发性可以根据其时序频率估算出来,突发性越强、共现次数越多的双词,越可能来源于某个突发话题。基于这一思想,BBTM首先将文档集合中的话题分为突发和非突发两类,然后将双词的突发性作为一个双词话题类别判定的先验。在实验验证过程中,发现BBTM识别出来的突发话题的准确性和可读性都显著优于现有的启发式方法。
尽管在短文本语义建模方向取得了一些进展,但和人对短文本信息的认知能力相比,目前的研究仍然非常初步。在该方向上,笔者认为目前值得深入探索的一些研究点如下。
(1)多源异质数据下的短文本语义建模在大数据时代的背景下,如何广泛利用其他数据源中的知识(如Wikipedia、开放网页、知识库等),进一步提高计算机短文本的理解与处理能力,是进一步提升短文本语义建模的必经之路。
(2)复杂结构语义建模
目前研究的话题模型结构都比较简单,只有一层潜在语义结构,话题的数目也很有限。这种简单结构的话题模型只能大概反映文本中的语义,难以准确、全面地
描述文本内容。真实文本数据中的语义结构很复杂,可以考虑采用层次、图状等结构提升模型的表达能力。
(3)融合上下文特征的话题建模目前的语义建模方法大多仍然局限在利用词共现信息上。在真实的应用环境中,短文本消息还包含大量的上下文信息(如词性、词序等内源特征)以及作者、地点、人物关系、时间等外源特征。丰富的上下文特征对解决短文本内容稀疏性会有很大帮助。
(4)与应用结合
对短文本语义建模能力的提升最终还需要落地于具体应用中。要最大限度地提升应用效果,需要研究与具体应用相关的语义建模方法。
2.2 单词表示学习
单词表示一直是人工智能、自然语言处理、信息检索等领域的一个基本核心问题。
自然语言处理等相关领域最常用的单词表示方法是one-hot表达,将单词表示为一个高维向量,这个向量的维度是词表大小,其中绝大多数元素为0,只有一个维度的值为1,这个维度就代表了当前的词。这种one-hot表达如果采用稀疏方式存储,非常简洁、高效,配合上最大熵、SV M、CR F 等算法,已经很好地完成了NLP (natural language processing,自然语言处理)领域的各种主流任务。
但是,这种表达有着根本性的缺陷,其假设所有词都是独立无关的,抛弃了单词之间的相关性。这意味着,即使是两个同义词,在此表达下,它们的相似度也是0,这显然是不合理的。同时,也因为每个单词都是一个孤立的离散单元,在许多实际问题中会遇到维度灾难问题。例如语言模型中,对于一个词汇集合为100 000的模型,即使只使用二元组,其可能的组合情况便
2015029-4
BIG DATA RESEARCH 大数据
可以达到100亿种。这样就面临严重的稀疏问题,传统的语言模型必须使用各种复杂的平滑技术来估计那些没有在语料中出现的组合的概率。
为解决语言模型中的维度灾难和稀疏问题,Bengio等人提出了神经网络语言模型[10]。此模型将每个单词表示为一个连续的低维稠密实数向量,这样得到的语言模型自带平滑,无须传统n -gram模型中那些复杂的平滑算法。这样的连续低维稠密实数向量叫做分布式表达(distributed representation),最早由Hinton提出[7],有别于传统语义网络中用一个独立节点表示一个概念的局部表达(lo c a l representation)的方式。而其真正意义上流行开来,始于Bengio在语言模型上取得的成功。现在,单词的分布式表达已经广泛应用于自然语言处理的各个方面,如机器翻译、情感分析和词性标注等。
使用语言模型来学习单词表达涉及在给定前文下预测下一个单词出现的概率,因此需要在整个词汇集合中进行归一化操作,这是非常耗时的一个操作。而当年Bengio的神经网络语言模型在今天看来并不很大的语料上训练了4个月之久,即使后来的C&W的工作,也花了两个月时间才得到一份单词的表达。这在更大的数据上几乎是不可忍受的。早期的单词分布式表达工作主要集中在如何加速训练上面。
代表性工作有Bengio等人2005年提出的层次神经网络模型,输出端不再是一个平坦的softmax层,而是一个树状输出,利用WordNet将一个多项分布分解为一串伯努利分布来优化[11]。AndriyMnih 和 Geoffrey Hinton提出Log-Bilinear模型,去掉了网络中隐层的非线性,在此基础上又提出hierarchical log-bilinear模型,同样也是将模型的输出改为层级输出,从而加速模型的训练,并且效果也有一定
2015029-5
的提升[12,13]。此后,Mnih将噪声对比估计(noise contrastive estimation,NCE )用于近似优化神经网络语言模型中的sofmax目标函数[14]。而在这方面走得最远的当属目前最受关注的Mikolov等人的工作——Word2Vec。Mikolov在循环神经网络语言模型的工作中发现,将单词的表达学习与语言模型的学习分离开来,可以获得很好的结果。于是提出了continuous bag-of-words (CBOW)和skip-gram(SG)两种单词表达学习模型[15]。这两种模型的目标不再是学习语言模型,而是直接利用自然语言处理中的分布式假设(distributional hypothesis)来学习单词表达。这个假设认为一个单词的语义由其周围的上下文决定,因此出现在相似上下文中的词,其含义也相似。CBOW模型利用上下文单词的表达,直接预测当前词的表达;而SG模型则是使用当前词预测上下文中的每一个词。这两种模型都可以使用哈夫曼树或者negative sampling加速优化。
单词表达学习算法大体都是基于一个同样的假设——分布式假设。其假设一个单词的语义由其周围的上下文决定。由于单词之间存在横向(syntagmatic)和纵向(paradigmatic)两种关系,如图2所示。其中,横向关系主要关注的是词与词之间在上下文中的共现关系,是一种组合性关系;而纵向关系则关注的是词与词之间具有相似上下文的关系,是一种替代性关系。根据所使用的分布信息的不同,单词表达学习方法就可以分为两大类:基于横向关系和基于纵向关系。现有模型都只单独考虑了一种关系。如隐式语义索引(latent semantic indexing,LSI),假设在文档中共现的单词具有相似的语义,其利用了横向关系;而Word2Vec这类方法认为,如果两个单词其周围上下文相似,则其语义相似,其利用了纵向关系。
TOPIC 专题
如图2所示,如果仅仅使用横向关系,不能得到wolf和tiger相似,这并不合理;另一方面,如果只是用纵向关系,则wolf和fierce也不相似。可见,单独使用任一关系,都不能很好地捕捉单词间的关联。在ACL2015的工作[16]提出了两种新的单词表达学习模型(如图3所示),有别于现有模型只建模单词间的横向关系或纵向关系,以并列(PDC模型)或层次(HDC模型)的方式同时建模这两种关系,以得到更好的单词表达。PDC模型和HDC模型对应地扩展了Word2Vec中CBOW和HDC模型,在其基础上,利用文档表达来预测文档中出现的单词,以捕捉单词间的横向关系。
在单词的类似与相似度任务上,这两个模型均取得了state-of-the-art结果。
分布式表达的假设自身也有不足之处,比如不能很好地处理反义词情形。因为互为反义词的两个词,经常出现在同样的上下文中,所以往往反义词之间的相似度反而高于其他近义词。针对此问题,主流思路都是利用外部的知识库来辅助单词的表达学习。这类工作的思路大体类似,都是利用外部知识库如Wikipedia、WordNet约束单词表达的学习过程,比如让更新同义词表达、限制反义词表达等。
此外,分布式表达的假设也不能很好地处理那些出现次数很少的单词。因为这些单词的上下文信息太少,不足以学到一个很好的表达。比较直接的办法就是直接利用语素信息来改善单词的表达,如果两个单词具有相同的词根,则其语义相似。
另外,目前单词的表达学习主要还是无监督的学习。因此,评价更多地集中在对单词本身的语义表达性能,如各种word similarity和word analogy任务。然而,这些任务并不能反映单词表达在真实的自然语言处理或者信息检索任务中的性能,所以更应该使用真实的任务作为实验。但这样带来的一个问题就是前端表达学习作为无监督学习,与后端的具体任务是脱节的。这也导致许多研究反映,虽然不同的
图
2 纵向与横向关系示例
图3 PDC模型和HDC
模型
2015029-6
BIG DATA RESEARCH 大数据
单词学习模型在单词表达任务上可能性能差异很大,但是在具体实际任务中并没有显著差异。但如果直接根据任务设计有监督的单词学习模型,又会面临可用的标注数据太少的问题。一种可行的方案可能是先利用大规模数据进行无监督学习,得到初始的单词表达,然后根据具体的监督任务调整单词表达,以期望实现更好的应用性能。
网页的标注。这些标注可能是由用户显式提供的绝对信息,如一个网页和查询词是非常相关、相关还是不相关等;也可能是从搜索引擎的用户行为中挖掘出来的相对信息,如某个网页是否比另外一个网页更加相关。为了从这些标注数据中学到最优的排序模型,通常需要定义3个部分:一是表征网页信息的特征向量(如词频、页面分级(PageRank)等)和网页间关系的特征向量(如网页相似度等);二是模型的基本形式(如线性、非线性等);三是用来控制学习过程的损失函数(它衡量了当前模型的排序结果和标注信息之间的差别)。极小化损失函数可以得到与标注数据最吻合的模型参数。经过优化的模型将用于回答新的查询词。给定新的查询词,首先通过倒排表找到包含该查询词的网页,然后为每个网页提取特征向量,并将排序模型应用到这些特征向量上,从而给每个网页输出一个分数,最后将网页按照分数的降序进行排列并返回给用户。
目前针对相关性的排序学习算法效果已经做得很好,部分算法甚至还应用到了搜索引擎的部分模块中。然而一个好的排序不仅依赖于相关性,多样化也是一个重要考虑。其目标在于在排序结果的顶部尽量多地展现不同子话题的网页,因此在排序的同时需要考虑网页间的相似度。然而,这种解决方案的难点在于传统的排序算法都以查询和单个文档作为输入,计算查询—文档相关性很难将文档间的关系融入排序模型内。
为了解决上述问题,有的研究者们直接利用结构化支持向量机直接优化多样化排序评价准则[21],乐(Yue)等[22]也利用结构化支持向量机寻找最佳文档子集。然而,由于上述算法没有对排序模型进行本质上的改变,模型仍然难以胜任多样化排序任务。
2.3 网页排序学习
网络搜索引擎已经成为人们日常生活中的重要工具,在搜索引擎的各个组成部分中,排序模型直接决定了人们看到的搜索结果,因此这种模型对于搜索引擎的性能起着至关重要的作用。
在信息检索发展的历史上,人们提出了很多排序模型,如进行相关性排序的BM25模型[17]和语言模型[18]以及进行搜索结果多样化的MMR[19]模型等。这些模型对推动搜索技术发展起到了一定作用,但是也存在一些问题:有的模型建立在人们对搜索问题的主观理解之上,需要根据经验人为设定模型参数;还有一些模型虽然可以从大量网页中学习,不断调整参数,但无法利用用户的反馈信息对模型参数进行优化。由于用户提交不同的查询词或者不同用户提交相同的查询词都有可能代表不同的信息需求,因此仅从研究者的主观理解或者仅从网页数据中学习排序模型,都无法很好地解决复杂的网络搜索问题。在这样的背景下,近年来研究人员开始尝试使用有监督的机器学习方法,即从用户标注或者反馈中学习最优的相关性排序模型,称为排序学习(learning to rank)[20]。
为了学习最优的相关性排序模型,需要一个训练数据集。该集合包含随机抽取的查询词、与查询词有关的网页以及这些
2015029-7
TOPIC 专题
朱(Zhu)等人[23]提出了关系排序学习模型R-LTR, 其基本思想是:利用传统的搜索结果多样化模型MMR的思想,使用序列文档选择的方式构造文档排序,即从序列的顶部开始,依次选择排在每一个位置上的文档。在每一次进行文档选择时,考虑查询—文档的相关性和当前文档与已选择文档间的相似性,如图4所示。
因此,R-LTR模型的参数分成两个部分:第一部分为相关性参数,其对应的特征描述了与查询—文档之间匹配的情况和文档的重要性等;第二部分为文档关系参数,其对应的特征描述了文档—文档之间的关系,包括文档在话题、词等级别的相似性等。在训练过程中,R-LTR 通过最大化似然的方式进行参数估计。在TREC标注数据集合上的测试表明,在搜索结果多样化的任务上,R-LTR能够超过传统的排序学习模型,取得了显著的效果提升。
夏(Xia)等人[24]针对R-LTR算法只利用了“正例”排序(如α-NDCG=1的最佳排序)进行训练的问题,提出了PAMM算法,其主要思想是:同时利用“正例”排序和“负例”排序进行训练;在排序过程中直接优化多样化排序评价准则。实验结果表明,上述改进方法进一步改善了搜索结果多样化的排序效果,且使得算法具有优化制定的评价准则的能力。
尽管上述各项工作取得了一定的成功,但是由于搜索结果多样化任务本身的复杂性,且评价准则本身不连续、不可导,使得直接对其进行优化仍然存在很多困难。相关的学习算法可能无法收敛或者很容易陷入局部极值点。总体上讲,这个方向还面临很多挑战,需要不断探索。另外,是否能够利用深度学习的方法自动学习多样性排序的特征和样本之间的依赖关系也是一个非常有前景的方向。
综上所述,内容分析成为理解网络大数据的重要手段。其中,短文本主题建模、单词表达学习和多样性排序学习是网络大数据内容分析的热点问题。随着网络大数据的发展,这些方向还存在很多值得探讨的科学问题,例如多源异构数据的主题建模、如何有效利用监督信息得到特定主题的单词表达以及如何使用深度学习的方法来自动学习多样性的特征等。这些问题的解决有助于更好地理解和挖掘网络大数据,从而达到内容分析的目的,为精准检索、推荐等应用提供支持。
图
4 顺序文档选择过程
3 结束语
参考文献
[1] H ofmann T. Probabilistic latent semantic
a n a l y s i s. P r o c e e d i n g s o f t h e 15t h Conference on Uncertainty in Artificial Intelligence, Stockholm, Sweden, 1999[2] B lei D M, Ng A Y, Jordan M I. Latent
2015029-8
BIG DATA RESEARCH 大数据
d i r i ch l et a l l o c at i o n. T h e J o u r n a l of Machine Learning Research, 2003, 3: 993~1022
[3] M etzler D, Dumais S, Meek C. Similarity
measures for short segments of text. P r o c e e d i n g s o f t h e 29t h E u r o p e a n Conference on IR Research, Rome, Italy, 2007: 16~27
[4] H ong L, Davison B. Empirical study of topic
modeling in Twitter. Proceedings of the 1st Workshop on Social Media Analytics, Washington DC, USA, 2010: 80~88
[5] Z hao W, Jiang J, Weng J, et al. Comparing
Twitter and traditional media using topic models, Proceedings of the 33rd European C onference on I R Re se a rch, D ubl i n, Ireland, 2011: 338~349
[6] L a k k a r a j u H , B h a t t a c h a r y a I ,
B h a t t a c h a r y y a C. D y n a m i c m u l t i -relational Chinese restaurant process for analyzing influences on users in social media. Proceedings of the 12th IEEE International Conference on Data Mining, Brussels, Belgium, 2012
[7] Y an X H, Guo J F, Lan Y Y, et al. A biterm
topic model for short texts. Proceedings of the 22nd International Conference on World Wide Web, Rio de Janeiro, Brazil, 2013: 1445~1456
[8] C heng X Q, Yan X H, Lan Y Y, et al .
BTM: topic modeling over short texts. IEEE Transactions on Knowledge and Data Engineering, 2014, 26(12): 2928~2941 [9] Y a n X H, Guo J F, L a n Y Y, et al . A
pro babi l i st ic mo d e l fo r bu r st y t o pic discovery in microblogs. Proceedings of the 29th AAAI Conference on Artificial Intelligence, Austin Texas, USA, 2015[10] B engio Y, Ducharme R, Vincent P , et al .
A neural probabilistic language model. Journal of Machine Learning Research, 2003, 3: 1137~1155
[11] M o r i n F, B e n g i o Y. H i e r a r c h i c a l
probabilistic neural network language m o d e l. P r o c e e d i n g s o f t h e 10t h I nter nationa l Workshop on A r tificia l
Intelligence and Statistics, Barbados, 2005
[12] M nih A, Hinton G. Three new graphical
models for statistical language modelling. Proceedings of the 24th International Conference on Machine Learning, New York, USA, 2007: 641~648
[13] M n i h A , H i n t o n G E. A s c a l a b l e
h i e r a r c h i c a l d i s t r i b u t e d l a n g u a g e model. Proceedings of the 23rd Annual C o n f e r e n c e o n N e u r a l I n f o r m a t i o n Processing Systems (NIPS), Vancouver, Canada, 2009
[14] M nih A, Kavukcuoglu K. Learning word
e m b e d d i n g s ef f i c i e nt ly w it h n o i s e -contrastive estimation. Proceedings of the 27th Annual Conference on Neural Information Processing Systems (NIPS), Lake Tahoe, Nevada, USA, 2013
[15] M i k o l o v T, C h e n K , C o r r a d o G ,
e t a l . E f f i c i e n t e s t i m a t i o n o f w o r d r e p r e s e n t a t i o n s i n v e c t o r s p a c e. P r o c e e d i n g s of Wo r k s h o p of I C L R, Arizona, USA, 2013
[16] S un F, Guo J F, Lan Y Y, et al. Learning
word representation by jointly modeling syntagmatic and paradigmatic relations. Proceedings of the 53rd Annual Metting of the As sociation for Comput ationa l Linguistics, Beijing, China, 2015
[17] R obertson S E. Overview of the okapi
projects. Journal of Documentation, 1997, 53(1): 3~7
[18] Z hai C, Lafferty J. A study of smoothing
methods for language models applied to Ad Hoc information retrieval. Proceedings of the 24th Annual International ACM SIGIR Conference on Research & Development on Information Retrieval, New Orleans, USA, 2001: 334~342
[19] C arbonell J, Goldstein J. The use of mmr,
diversity-based reranking for reordering documents and producing summaries. P r o c e e d i n g s o f t h e 21s t A n n u a l International ACM SIGIR Conference on Research & Development on Information
2015029-9
TOPIC 专题
Retrieval, Melbourne, Australia, 1998: 335~336
[20] L iu T Y. Learning to Rank for Information
Retrieval. New York: Springer-Verlag New York Inc, 2011
[21] L i a n g S S, Re n Z C, M a a r t e n D R.
Personalized search result diversification via structured learning. In Proceedings of the 20th ACM SIGKDD, New York, USA, 2014: 751~760
[22] Y ue Y, Joachims T. Predicting diverse
s u b s e t s u s i n g s t r u c t u r a l s v m s . Proceedings of the 25th ICML, Helsinki, Finland, 2008:1224~1231
[23] Z hu Y, Lan Y, Guo J, et al . Learning for
search result diversification. Proceedings of the 37th Annual International ACM S I G I R C o n f e r e n c e o n R e s e a r c h & Development on Information Retrieval, G o l d C o a st, QL D, Au st r a l i a, 2014: 293~302
[24] X ia L, Xu J, Lan Y Y, et al . Learning
maximal marginal relevance model via directly optimizing diversity evaluation measures. Proceedings of the 38th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Santiago, Chile, 2015
2015029-10
范文五:数与代数内容分析与建议.doc
一、选择题
1. 小学数与代数内容第一学段包括哪些内容? ( ABCF)
A. 数的认识 B.数的运算 C.常见的量 D.式与方程 E.正比例\反比例 F. 探索规律
2. 数与代数内容的教学应抓住哪几条重要的主线? (ABCD)
A.数概念的建立 B.运算的理解和掌握 C.问题解决与数量关系 D.代数的初步
3. 《标准》对整数的认识在第一学段设4条内容,下面哪几条是第一学段的内容? (ABDE)
A. 在现实情境中理解万以内数的意义,能认、读、写万以内的数,能用数表示物体的个数或事物的顺序和位置 B. 能说出各数位的名称,理解各数位上的数字表示的意义;知道用算盘可以表示多位数 C. 在具体情境中,认识万以上的数,了解十进制计数法,会用万、亿为单位表示大数 D. 结合现实情境感受大数的意义,并能进行估计 E. 理解符号的含义,能用符号和词语描述万以内数的大小 F. 在生活情境中感受大数的意义,并能进行估计
4. 分数和小数的联系是( ACD )
A. 部分和整体的关系 B.具体的量 C.分数起源于分 D.小数是十进分数
5.“数的运算”教学中的核心概念是(C )
A. 数位 B.计数单位 C.运算律
6. 学习估算有( ABCD)价值。(多选)
A .有利于人们事先把握运算结果的范围,是发展学生数感的重要方面。 B.为判断计算器、口算和笔算结果是否合理提供了依据。 C.在具体情境中估算,有利于学生提高判断、选择的能力。 D.估算有利于培养学生做事的计划性。
7. 标准中常见的量基本在第一学段出现,《标准》有关常见的量的规定包括哪些方面? (ABCDE)
A. 在现实情境中,认识元、角、分,并了解它们之间的关系。 B. 能认识钟表,了解24时记时法;结合自己的生活经验,体验时间的长短 C. 认识年、月、日,了解它们之间的关系。 D. 在现实情境中,感受并认识克、千克、吨,能进行简单的单位换算。 E. 能结合生活实际,解决与常见的量有关的简单问题。
8. 保罗用$5去购买牛奶、面包和鸡蛋。当他到达商店时,发现这三种食品的价格如下图所示: (A在下列哪种情况下使用估算比精确计算有意义?
A.当保罗试图确认是否够用时; B.当销售员将每种食品的价钱输入收银机时;
C. 当保罗被告知应付多少钱时; D.当销售员数保罗所付的费用时。
9. 史密斯家每星期的用水量是6000升,他家每年的用水量大约是多少升?
(C)
A.30000 B.24000 C.300000
二、思考题(第2题为必答)
2. 《标准》以于方程学习的要求是:列举教学中的一个案例,体现了促进学生形成符号意识或模型思想。
数学课程标准》从学生的长远发展和中小学教学的衔接出发,要求小学阶段学生也要利用等式的性质解方程。为了让学生联系等式的性质解方程,教学时可以让学生自己说说怎样求出x 的值。同时还要学生注意三点:一是规范解方程的书写格式,等式变换时,每个等式的等号要上下对齐;二是利用等式的意义对方程进行检验,只要看左右两边是不是相等;三是联系上面的过程,深刻领会什么是“解方程”。作为教师要知道方程就是一种数学模型,它是刻画现实世界中
数量相等关系的数学模型。它可以帮助人们更准确清晰地认识、描述和把握现实世界。五上教材主要安排的了求和、相差关系和倍数关系等一些基本问题,它们是最基本的数量关系,所以在列方程解决实际问题的过程中,找到问题中数量之间的相等关系是列方程解决实际问题的关键。列方程解决问题与列算式解决问题相比,在思维方式上是一个飞跃。应引导学生积极参与解决问题的活动,教学时具体分这样几步:(1)明确条件和问题;(2)分析问题中已知量和未知量的相等关系;(3)把数量间的相等关系“翻译”成未知数X 和已知数之间相等关系的方程。这样的过程就是建立数学模型的过程。; 小学数学教材在第二学段分两次教学“方程”。六年级上册是第二次接触方程,教学解形如ax±b=c、ax÷b=c、ax±bx=c的方程,列方程解答两、三步计算的实际问题。我们知道,小学生学习方程,是学习一种有效的解决实际问题的方法,进一步丰富解决问题的策略,更有价值与长远意义的是体现是建模思想。在列方程解决实际问题的过程中,要灵活对问题进行“表征”,建立问题表征时,必须引导学生正确、迅速地收集,处理题目中的信息,去除多余的.选择必需的,问题的表征就是建立在对问题理解的基础上,正是由于问题表征具有不同的方式,所以它也以不同方式影响问题解决的难度。经过问题表征之后,下一个重要步骤就是提示问题中数量之间的相等关系,找到数量之间的相等关系,才能把实际问题转化成数学问题,也才能列出相应的方程解答问题。由于学生已经在五(上)学过列方程解决简单的实际问题,所以这里在揭示等量关系之后,他们一般能够比较熟练地应用列方程解决问题的程序,但在写设句时,我们教师要多加指导,必要时,可以像教科书中处理的一样,在设句中写出两个未知量的表示方法,从而帮助学生完成数量关系式到方程式的转换。当学生得到问题答案之后,教师要引导学生对问题的解答进行回顾与反思。一是检查解答是否正确,这不仅有利于促进学生养成自觉检验的习惯,
而且通过检验,可以帮助学生进一步认识先前解决问题时所建构的解题模型。二是把解决问题的活动作为一个思考对象,反思活动过程中关键的想法与关键的过程,从而帮助学生将解决具体问题中的“经验”推广到更一般的情况。教师要注意设计好能引起学生反思的提问,如解决这个问题,你有哪些体会? 通过反思,解决问题活动中的关键要素和观点得到提升。加深学生对方程作为一种重要的数学思想方法的理解。也正是在多次经历这样的活动过程中,学生感受到方程与实际问题的联系,领会数学建模的思想和基本过程。; “数学教学不能满足于单纯的知识灌输。而是使学生掌握数学最本质的东西,用数学思想和方法统串具体知识、具体问题的解法,循此培养和发展学生的数学能力”因此,我们要在教学中充分认识“方程”这一内容的教学价值与地位,增强学生用方程方法解决问题的意识和能力,丰富学生解决问题的策略,帮助学生加深理解方程是一种重要的数学思想方法,使学生的数学素养得到更好的发展。