范文一:施引关键词与被引作者交叉共现分析方法及实证研究
J0 RNAL0FTHECHINAS0CIETYF0RSCIENTIFIC 惰 报 学 报 SSN1000 0135 I ANDTECHNCALNRMATN SSN1000 0135 IIF0I0I 31 4 362 370 , 2012 4 第 卷 第 期 年 月 V31 N4 362 370 Ap 2012 oo,rl.. il
日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日日
doi:10 .3772 /j.issn.1000 -0135 .2012 .04 .004
1 >施3关键词与腋3作者支叉共现分析方法及实证研究
1 2 1王 林冷伏海
< 1="" .,="" 100190="" :2="" .,="" 100049=""> 国科国家科图书馆 国科 中学院学北京中学院研究生院北京
< aca=""> ,,摘要 作者同被引分析方法是研究领域知识结构的重要手段它能够发现跨领域知识关联的存在借助
,一些辅助的分析方法和步骤也能够发现知识关联的内容但作者同被引网络无法直接反映关联的内容因此这种
< ckca=""> ,际应用效果受到一定限制施引关键词与被引作者的交又共现分析能 够 清 楚 地 发 现 科 学 领 域 方法的实
,, 流派及研究方向以及流派中作者间关联 的 内 容发 现 在 某 一 主 题 领 域 有重 要 贡 献 的 研 究 人 员与 作 者 中的学术
< aca=""> ,CKCA~,被引分析相比分 析在揭示学术流派间学术流派内节点间联系的能力更加出色能够更准确的反 同
, 应学术流派的研究主题和方向并巨具备了更高的可读性
关键词 知识地图 词与引文作者共现 共现分析 交又共现 引文分析
A Methodforldentifying AcademicschoolsbasedonCrossCo-occurrenceof
Citing KeywordsandCitedAuthors
1 2 1, wangLinand LengFuhai
< 1="" .nctionclsciencelibrcry,="" czineseacccemyofsciences,="" beijing="" 100190="" :="">
2 grccuceUnuersyoCzneseacccemyoscences, Beng 100049 > .tiitfifiiji
Abstract ACA istheimportantresearch toolofthestructureofknowledge, and hasbeen widelyused in manyfields. wecan ound heassocaon ohecoced auhobyACA, bucan noknowhemean oheassocaonBycosscoftitift-ittrtttftiti.r- occuenceocngkeywodsand ced auho< ckca=""> , heecan beceayound n heacademcschoososcenceand rrfitirittrtrlrlfitilfiresearch, and thedetailmean ofan association between author, and wecan discoVered aimportantresearchers.Compared with theauthorcitation analysis< aca=""> , network diagram formed byCKCA wasmorereadable, thegroup isVeryclear, p muhph up hmnd dn secfc,ooreaccraeyrefeceyeofresearcgroeearecoiittllttttiti.
Kywo knwdmp wd nd n un unn unerdsoegeas,oracaoco-occrrece,co-occrreceaayss,crossco-occrrece, littilicitation analysis
6 ]20 80 whGh erffitiit世纪 年代 和 提出作者同, 到作者 同 被 引 网 络 中 用 来 识 别 高 影 响 力 作 者 1 ] < aca=""> ,被 引分析方法这种方法逐渐成为研究Schneider等比 较 了 第 一 作 者 同 被 引 网 络 和 全 部 2 ] 3 ] 7 ] 8 ] ,~领域 知识结构的重要手段已经在生物化学, Leydesdorff~ 作 者 同 被 引 网 络 的 区 别
4 5 9 10 ] ] ] ]~~ Ahn~ nVnRuu~ wh greJaregosseaeliit战略 管理半导体等多个领域有了广泛应用和 等 讨 论
,了 作 者 同 被引的相关系数计算方法k述研究推在近 三十年中作者同被引分析方法本身的研究
, 动了作者同 被引分析方法的发展提高了方法的分,Ding也取得 了一些进展将 话题模型和网页排序
析质量但 算法应用
:2011 6 21 收稿日期年 月 日
:,,1983 ,, : 作者简介王林男年生中国 科 学 院 国 家 科 学 图 书 馆 博 士 研 究 生主 要 研 究 方 向高 科 技 信 息 分 析 与 竞 争 情 报
E-mail:wanglin@ mail.las.ac.cn ,,1963 ,,,,冷伏诲男年生教授中国科学院国家科学图书馆博士生导师情报研究部主任主要
: 高科技信息分析与竞争情报 研究方向
1 > ~ < :70873123=""> 本文是国家a然科学基金项目 科技创新演化分析理论与方法研究项目编号的研究成果
ACA是方 法 基 于 作 者 同 被 引 关 系 建 立 的 知 识 DE~ ID~ CR某一条记录至少要包含 三 个 参考文献
地 图虽然可以发现知识关联和结构的存在并巨D宇段中一项
借助 一些辅助的分析方法和步骤也能够发现知识2966 重构后实验数据集共含有效记录数 条其
D ACA关联的 内容但 分 析无法对作者 同 被 引 关 6073 ~ 87 869 中包含 关 键 词 个参 考 文 献篇平 均
系 进 行 区 分也无法直接反映作者同被引关联的内2 05 ~63 D .29 .每 条记录包含关键词 个参考文献 篇
ACAD容这限制 了 分析的实际应用效果 ~ 前 述所得关键词和参考文献经去重合并同义词后
考虑到作者同被引分析在反映知识关联及其结 3075 ~ 53 953 ~ 共 得关 键 词 个 考 文 献 篇 作 参引 文---无 法 直 接 反 映 节 点 关 联 和 构方面存在的问题28 161 < )="" d="" 者="" 位第一="" 作="" 者在="" 所="" 建="" 领="" 域="" 数="" 据="" 集="" 中="" 前="">< 结="" 构="" 的="" 内="" 容="" 本="" 研="" 究="" 提="" 出="" 了="" 施="" 引="" 关="" 键="" 词="" 施="" 引="" 文="" 10="" 1="" d位的高频关键词及参考文献如表="" 所示="" )="">< )="" 献="" 的="" 关="" 键="" 词="" 与="" 被="" 引="" 作="" 者="" 参="" 考="" 文="" 献="" 的="" 作="" 者="" 的="" 交="">
1 表 实验数据隼中的部分高频关键词及高被引作者 < citingkeywordsand="" cited="" authorscrossco-="" 又="" 共="" 现="" occuence="" ckca)="" d="" rr分析方法施引关键词与被引作="" 施引关键词="" 频次="" 被引作者="" 频次="">
~ 者的交又共现网络中同时包含施引关键词被引作 science 500 garfield e 1328 者这两种要素多个被引作者通过与相同施引关键
caon anayss 267 egghe 723 ittilil 词的共现建立了间接的作者同被引网络施引关键
词在这个作者同被引网络中发挥了桥梁的作用并 ounas 257 ganzew 702 jrlll
D CKCA 能够反映两个被引作者关联的内容本文将 impactfactor 256 moed hf 608 Ndw20 erat.方法应用于计量学领域并巨借助 绘制
mp 250 kn 572 acosoffrittCKCA 得到的 计 量 学 研 究 网 络 的 知 识 地 图并 与 作
D者同被引分析所得到的知识地图进行了比较 nd 230 nn 536 oVcaaaaaiitrrfj
pubcaon 223 eydesdo 450 litilrffl1 数据来源
caon 216 baun 429 ittirt1 .1 领域数据隼的建立 bibliometricanalysis 205 narin f 389
考虑到引文数据的可获得性以及数据的全面性 scenomecs 147 whehd 389 ittriit
ISIweb ofKnowledge和权威性最终确定通过 平 D 台 检索 获 得 计 量 学 研 究 的 相 关 文 献检 索 路 径
2 研究方法 :为
$ TS < bbmnm="oercorforercilitiiti矽" 矽="" 2="" .1="" 支叉共现算法="" orsciento-="" metric)="SCI-EXPANDED~" 矽="" 数据库="">
DLG< dmnn="" )="" recargeesegeeraoitlitttissc~="" ccs~="" ccrexanded~c算="" 法="" 是="" ipi--pi="入库时间" 所="">
D 2011 4 22 一 种基于图的关联规则挖掘算法算法通过扫描 年份检索 日期 为 年 月 日共 返
3454 D 回 检 索 结 果 条一次 数据集构建项关联图并为所有项建立位向量
[ 11 ] D然后 对位向量进行正交运算即得到关联项 1 2 .实验数据的规范
DLG交又正交共现算法以 算 法为基础 可以表
TI< )="">< )="" ~ab实验剔除原始数据中="" 标题作者="" :述为="">
< )="">< )="" ~="" id摘要等="" 无="" 用="" 数="" 据仅="" 保="" 留="" 作="" 者="" 关="" 键="" 词="" n="">< )="" ~="">< )="" 数据库补="" 充="" 关="" 键="" 词参="" 考="" 文="" 献这="" 三="" 个="" 数="" 据="">
cb 矽ij zz:D 项规范 后 的 实 验 数 据 集 的 数 据 结 构 如 下 所 示 i=1 j=1
c b$ Record1 =< de1="" :="" de2="" :="" "="" den="" #="" id1="" :="" id2="" :="" "="" idn="" #="" 其中分别表示数据集中的两个不同特征的="" 数="">
c b n~mbc CR1 :CR2 : CRn ) : Rod2 =< de1="" :="" de2="" :="" den="" #="" 据项="" 和="" 为数据项集中特征项="" 和="">
D1 :D2 : Dn # CR1 : CR2 : CRn ) : : Rodn = D DLGDLG II"I""ecr交又 共 现 算 法 的 具 体 过 程 与 共 现 算 < de1="" :="" de2="" :="" "="" den="" #="" id1="" :="" id2="" :="" "="" idn="" #="" cr1="" :="" cr2="" :="" "="" :法="" 类似="">
1 ) X=$ A< 1="" 2="" #="" b1="" b2="" )="" baa假="" 设="" 有="" 数="" 据="" 集="" crn)="" den="" dn="" i其中="" 表示该记录的作者关键词表="">
< 2="" 3="" #b3="" b4="" )="" a~b="" aa"="" crn="" 其中="" 各代表一条数据项集="">
1 ~2 ~3 ~b1 ~ b2 ~ b3 ~ b4 22 371 D aaaab 分 别 代 表 特 征 项 和 施引关键词与被引作者的交又共现对共 组
A< 1="" 2="" #b1="" b2="" )="" a,a,a,的="" 一个数据项表示数据项集="" 分析首先从施引关键词与被引作者的相关注计算入="">
aa1 ~a2 ~a3 b ,由特 征项 的数据项 和特征项 的数据手分析了实验关键词对被引作者研究方向的识别 b1 ~ b2 ~b3 ~b4 :D 项 构成 度最后选择相关注较高的施引关键词与被引作者 2) ,, 扫描数据集中所有数据项分别得到不重复 共现对生成可视化网络并与作者同被引网络进行
aaem=$ a1 , a2 , a3 -ItsD的特征项 的 数 据 项 列 表 比较
b b< ece-="" l与="" 特征项="" 的数据项列表="" 实验数据的研究使用的分析工具主要有="" em="$" b1="" ,b2="" ,b3="" ,b4="" :)="" ~="">< )="" ~="" ts="" it="" 基本分析="" 生="" 成="" 共="" 现="" 数="" 据="" 的="" 社="" 会="" 网="" 络="" 3="" )="" a~="" b="">< )="" dtr分别生成特征项="" 所="" 有="" 数="" 据="" 项="" 的="" 位="" 向="" 量="" 用于生成共现网络的可视图="">
a-Vectors=$ a1 < 1="" ,0="" )="" ,a2="">< 1="" ,1="" )="" ,a3="">< 0="" ,1="" )="" ~b-vectors="">
=$ b1 < 1="" ,0="" )="" ,="" b2="">< 1="" ,0="" )="" ,="" b3="">< 0="" ,1="" )="" ,="" b4="">< 0="" ,1="" )="" ,="" 3="" 其="" 中="" 施引关键词与被引作者的="" a1=""><1 ,0="" )="" a1="" a,表示数据项="" 在数据项集="" 中出现在相关注分析="">1>
B,a1 数 据项集 中没有出现向量的模代表数据项
:10 1300 实验选择交又共现频次大于或等于 的 出现 的频次
4 ) a~ b , 对特征项 所有数据 项 的 位 向 量 做 交 又 组共现 对 作 为 分 析 对 象其 中 共 包 含 施 引 关 键 词
,a~ b 232 ~ 710 D 正交运算得到特征项 所有数据项的交又共现 个被 引 作 者 位施 引 关 键 词 与 被 引 作 者 D ,a1 b2 =<1 ,0="" )="" a1="" :="" 列表例如数据项="" 八表示数据项="" 的相关注分析="" 从="" 以="" 下="" 两="" 个="" 方="" 面="" 展="" 开o="" 施="" 引="" 关="" 键="" ~="" b2="">1>< 1="" 0="" )="" 1="" ~="" b2="" :="" ,,a共现位向量为="" 即数据项="" 只="" 在="" 数="" 词与被引作者="" 的="" 高="" 频="" 共="" 现,="" 施="" 引="" 关="" 键="" 词="" 与="" 被="" 引="">
A D,据 项集 中同时出现正交 向 量 的 模 代 表 数 据 项 作者的相关注
a1 ~ b2 D 此 类 推 得 到 所 有 数 据 项 的 共现的频 次以1 3 .施引关键词与被引作者的高频共现 D共 现 列表
施引关键词与被引作者的共现频次最直接的反 2 2 .分析方法 D 2 映了施引关键词与被引作者的相关注表 中列出
, < ~="" )通过应用交="" 又="" 共="" 现="" 算="" 20="" d法从="" 科="" 学="" 文="" 献信="" 息="" 了共现频次排名前="" 位的共现对="">
2 计量学领域数据集中得到共现频次大于或等于 的
2 20 表 施引关键词与被引作者共现频次前 位
序号 施引关键词 被引作者 共现频次 词频 词频排名 被引频次 被引排名
1 science garfield e 207 500 2 1328 1
2 bbm d 183 604 1 1328 1 oercgarfeeilitiil
3 mp d 143 256 5 1328 1 acfacorgarfeeittil
4 citation analysis garfield e 138 267 3 1328 1
5 n nw 119 500 2 702 3 scecegazeill
6 science moed hf 113 500 2 608 4
7 pubcaon gaed e 108 223 8 1328 1 litirfil
8 nd md h 106 230 7 608 4 caoroefiit
9 science Vanraan afj 105 500 2 536 6
10 on gd 100 216 9 1328 1 citatiarfiele
11 impact garfield e 90 250 6 1328 1
12 n nn 89 500 2 389 9 sciecearif
续表
序号 施引关键词 被引作者 共现频次 词频 词频排名 被引频次 被引排名 13 science smallh 87 500 2 359 14 14 scence baun 86 500 2 429 8 irt
15 h nde hsch e 86 142 12 252 19 i irj
16 indicator garfield e 85 230 7 1328 1 17 ndcao ganzew 83 230 7 702 3 iitrll
18 science seglen po 83 500 2 321 16 19 science leydesdorffl 82 500 2 450 7 20 scence pcedd 79 500 2 364 13 irij
2 表 列出了施引关键词与被引作者共现频次最 ,特征项无法直接应用等价系数用来计算施引关键
20 ,高的前 位 从表中可以看到施引关键词与被引 , 词与被引作者的相关性因此研究设计采用如下算
~ 作者共现频次的高低跟施引关键词词频作者被引 CijCij>< ci="">+Cj>> 槡 式 CEij= ,频次有直接的关系 高被引作者与高频施引关键词 Ci>Cj
,20 容易形成较高的共现频次在共现频次排名的前 C,, ij其中等于施引关 键词与被引作者的共现次数,5 12 ,位中被引排名前 位的被引作者占 位词频排 Ci,Cj,为施引关键词词频为被引 作者的被引频次 5 13 名前 位施引关键词的占 项 施引关键词与被 和 取决于数据集中施引关键词与被引作者的记录
% cence, gaed sirfil引作者 共 现 频 次 排 名 前 四 位 的 是 ,+=1 数并巨 这个公式考虑了施引关键词与被
e ~% bbomec, gaed e ~ % mpacaco, gaed , ilitrirfilitftrrfil引作者的差异性能够凸显高被引作者的重要性
e ~% citation analysis,garfield e ,它们的共现频次分 3 CE表 中列出了施引关键词与被引作者 系 207 ~183 ~143 ~138 别为 这四组共现对都与被引作 20 ,CE数 排名最高的前 位使用 系 数消除了高被Gaed ,rfil20 者 博士相关并巨在前 位共现对中与该 ~,引作 者高频施引关键词的绝对影响得到了一些
8 , 8 被引作者相关的共现对共出现了 次这 个关键 , 3 相对低 被引的施引关键词和被引作者另外表
n" ~ bbm" ~ mp'scece'oerc'aciilitiit 词 分 别 是 KA中还使 用了 稳定度和 稳定度 来 分 别 评 价 被 " ~ n n" ~ pubn" ~ n" ~ facor'caoaayss'cao'caotittililitiitti~引 作 者 对 施引关键词施引关键词对被引作者的重' impact" ~' indicator" , 通过这 些 施 引 关 键 词 能 够 反 ,K要程度其 中的 稳定 度 通 过 共 现 频 次 与 施 引 关 Garfield ---映出 博士的主要研究内容用 于科学评 ,A键 词 频 次 的 比值获得稳定度通过共现频次与 价的引文分析及其影响因素 3 CE 作者被引 频 次 获得表 中 系 数 最 高 的 共 通过施引关键词与被引作者的绝对共现频次可 % word analysis,braam rr ,现 对 是 该共现对有最高, 以在一定程度k反映两者的相关性但是绝对共K,word Analysis的 稳定度在 施引关键词 出 现的 ~ 现 频次容易受到施引关键词词频作者被引频次17 Bm RR raa,次中都引用了 作者 说 明 该 作 者 对 该 ~,的影 响高被引作者高频施引关键词容易组成高A,词 有 很 重 要 的 影 响但是共现对的 稳定度只 有 ,~频共现 对而低被引作者低频施引关键词则很难0 .25 , 25 % 说 明 引 用 该 作 者 的 文 献 中 只 有 的 在共现结 果中处于前列 wod Anay, rlsis文 献 使 用 了 这 个 关 键 词该 共 现
Bm 1991 raa对 指 向 等 在 年提出的 一 种 利 用 词 分 3 2 .施引关键词与被引作者的相关性 I 12 I 析 辅 助 发 现 共 被 引 文 献簇研究主 题 的 方 法,在共词分析中等价系数用来考察共现词对的 3 , 11 % h nd,hh ie irsc在 表 中排 在 第 位 的共现对是2 < c=""> ij,E= ij相关性计算公式为 等价系数是一 ,,je86 它的共现强度为 次该共现对揭示内容指向 Ci>Cj Hirsch 提出了一种用于 评价科学研究产出的文献, 个比较平衡的指标它同时考虑了两个共现词对共 I 13 I ---H , ' h inde " 计量指数指数是该文献的核现频次的影响 但是施引关键词与被引作者非同类 心内容
3 20 表 施引关键词与被引作者相关性排名前 位
KACE序号 施引关键词 被引作者 共现频次 词频 被引频次 稳定度 稳定度 指 数 1 word analysis braam rr 17 17 68 1 .00 0 .25 0 .49 2 wod wdeweb amnd c 27 43 54 0 63 0 50 0 44 rlilit...3 centrality freeman lc 10 11 42 0 .91 0 .24 0 .43 4 euopean unon meags 17 20 76 0 85 0 22 0 39 ril...5 googlescholar meholi 23 29 90 0 .79 0 .26 0 .39 6 links Vaughan l 16 19 73 0 .84 0 .22 0 .38 7 bomedcne cam 21 23 121 0 91 0 17 0 37 iiiij...8 databasetomography hearstma 11 30 12 0 .37 0 .92 0 .37 9 ankng bap 23 43 49 0 53 0 47 0 37 rill...10 webometrics bjorneborn l 16 24 55 0 .67 0 .29 0 .35 11 h inde hirsch je 86 142 252 0 .61 0 .34 0 .35 12 nk mh 10 19 23 0 53 0 43 0 35 ssaliit...13 intellectualstructure mccain kw 29 33 208 0 .88 0 .14 0 .32 14 cowod anayss caon m 21 26 131 0 81 0 16 0 31 rlill...15 world wideweb kim hj 15 43 20 0 .35 0 .75 0 .31 16 links wilkinson d 10 19 28 0 .53 0 .36 0 .31 17 googeschoa acsop 22 29 125 0 76 0 18 0 31 llrj...18 scopus harzingawk 11 28 19 0 .39 0 .58 0 .30 19 h bkkbn 11 29 18 0 38 0 61 0 30 googescoaraaasllli...20 european union ugolinid 13 20 58 0 .65 0 .22 0 .30
效 通过施引关键词与被引作者的绝对高频共现频
CEK~ C次和 相 关系数以及 稳定度稳定度这两
,个 指标能够从微观层次揭示施引关键词与被引作
者 共现所反映的内容 通过施引关键词与被引作
者的 共现能够发现某一领域的有重要贡献的作
者
4 CKCAACA与 可视网络的比较
在施引关键词与被引作者的交又共现生成的网
,络中被引作者通过施引关键词的传递形成了间接
, 的作者同被引网络施引关键词在这个网络中是有
CKCA益的扩展和补充要素 为了检验 方法的有
,性和优势研究使用相同的领域数据集并选择相同
,的作者集分别通过施引关键词与被引作者的交又 < ckca=""> ~ < aca=""> 共现分 析作 者 同 被 引 分 析 生 成
,,可 视网络图并通过识别两个网络中各类团的作者
比 较了这两种方法得到的网络图的异同
CKCACE研究首先从 分析 结果中选择 系
0 .12 185 , 数大 于或等 于 的 组 共 现 对其 中 包 含 73 , Nedaw2 0 89 tr.关 键 词 个被引作者 位借助
, 生成了施 引关键词与 被 引 作 者 的 共 现 网 络见 图
1 ,图蓝 中 红 色圆点代表 施 引 关 键 词 色 方 点 代
,, 89 表 被 引 作 者同时实验使用相同的 位作者
,利用作者同被引 分析生成作者同被引可视网络
2 见图
1 日 施引关键词与被引作者的支叉共现网络
CKCA网络基于施引关 键词与被引作者的高, 析得到的网络中因为缺少了关键词的因素没有区
, 频 共现形成关联网络在这种网络中被引作者只, 1 分作者同 被 引 关 系因 此 无 法 呈 现 图 所 反 映 的 有同 时与某一个或某几个关键词形成稳定的共现 内容
1 A1 ,才会形 成同被 引 关 系如 图 中 类 团 作 者 4 .1 CKCAACA与 网络的类团比较 batistapd~ kellycd~bornmann l~ Vanraan afj因 为 都
nkn~ h ndrageii 与 有稳定共现关系才形成了同被引1 ,从图 中可以看到由施引关键词与被引作者
ACA , 关系但是网络则 是 将 作 者 同 被 引 关 系 不 2 的交又共现 关 系 在 可 视 网 络 中 形 成 了 个 较 大 类
,2 加 区 分 的 形 成 关联网络如在图 中k述作者 ~4 , 团个中等类团以及若干个小的类团这些类团 batistapd~kellycd~ bornmann l~Vanraan afjK在 类 ,反映了当前计量学研究领域的主要研究方向并能 团中完全与其他作者 在一起形成 了 混 合 的 同 被 引 从类团中发现该领域的著名研究人员通过类团中 , CKCA< 1=""> ACA< 网="" 络因="" 此网="" 络图="" 与="" 网="" 络="" 图="" ,1="" 2="" ,="" 作者的比较发现图="" 中不仅包含了图="" 出现类团2=""> ~相 比 在 发 现 作 者 同 被 引原因区分作者同被引~ 并巨能够更清晰的展现这些类团间类团中节点间 ~~关系发现作者同被引关联 的内容清晰反映网络 1 2 , GB1 ~ 的联系在图 与图 中类团 与类团 类ACACKCA,类团组成方面能够比 做 得更好并巨 HF~ JB2 ~ I团 与类团 类团 与 类团 类团 与 类团 分 析不需借助其他分析手段和 步骤就能够反应类C~ KA~LA4 ~M类 团 与类团 类团 与类团 类团 与, 1 团的研究主题和方向例如从图 中可以直接知道 E~ ND 类团 类团 与类团 相对应 A,类团的研究主题是科学评价研 究而 这 个 大 主 CKCAA在 网 络 最 大 的 两 个 类 团 是 类 团 和 A1 ~ A2 题 又 是 由 科 学 家 产 出 评 价世界各国的科B,类 团 这两个类 团构成了当前计量 学 研 究 的 主 ~A3 ~A4 研产出评价科研合作评价引 文分析与评A体 方 向 类团 代表的研究方向是科学计量与评,ACA2 价四个子主题组成而图 通过 分
, 价该
2 日 作者同被引网络
[ 1 ] A1 ~A2 ~A3 ~A4 , A1 ,F1 , 类团由 等四个子类团组成其中 成其中 代表的研究方向是作者同被引分析[ 24 ] HF2 , F3 子类代表的研 究 方 向 是 以 指 数 为 核 心 的 科 学 代表的研究方向是文献同被引 分 析代 表
13 [ 25 ] []A2 , 家 产出评价子 类 代 表 的 研 究 方 向 是 世 界 各 的研究方向是共词分析
14 15 [,] A3 ,国 的科研产出 评 价子 类 代 表 的 研 究 方 向 4 .2 CKCAACA与 网络连接性比较 [ 16 ] , A4 是 以作者合著 研 究 为 主 的 科 研 合 作 评 价子
[ 17 ] 类 代表的研究方向是引文分析与评价类 团 1 2 , CKCA从图 与 图 的 比 较 可 以 发 现网 络 B ACA,代 表的研究方向是网络 信 息 计 量 分 析该 类 团 被 引作者节点的直接连通量相比较 网 络 减
,CKCAB1 ~ B2 , B1 由 少 了 很多这是因为 网 络通过施引关键词对两个宇类团组成其中 子类代表的研[ 18 ] , , B2 作者 的同被引关系进行了区分和限定这使得 究方向 是网 络 信 息 计 量子 类 代 表 的 研 究
19 []GShSCKCAoogecoarII ll方 向 是 等工具对 的挑战 网 络在通过关键词传递扩展作者同被引网络的
4 共现网络中的 个中等类团是对科学计量与评 同时也 减弱了许多的作者关联 < a=""> ~< b=""> ,CKCA价类团 网络信息计量分析类团 这两个主 第一网 络 通 过 关 键 词 传 递 将 更 多 的
,C,体方向的有益补充其中类团 代表的研究方作 者关联在了一起扩充了网络中同类节点的关联
, ACA< 2=""> zhou p~zhaodz向 是国际科学合作分析注并巨关注与医疗领域的例如 网络图 中作者 等[ 20 ] D研究 合作类团 是由文献计量学三大经典,CKCA< 1=""> 作者 呈现出孤立的状态而在 网 络图
, 定律组 成如洛特卡定律和布拉德福定律类团 中这些 作者节点通 过 关 键 词 的 传 递 都 进 入 了 关 联 E,Koostff代表的 研究方向是知识发现该类团由 网 络 中
[ 21 ,22 ] Swanson 的 数据库内 容结构分析和 的基于非<> 实验以相同作者集为对象 [ 23 ] FF1 ~F2 相关文献的知 识发现组成类团 由 ,ACA,第二在 网 络 中 本 来 拥 有 同 被 引 的 作 者 ~F3 三个子类团组 2 Kmod hef例如图 中 类 团 同 被 引 作 者 与
seglen
MunuSuu unh o ooTeaseeecaceJJaerfItlltltrtr.rlfpoyHsmallh callon m1类 团中同被引作者 在图 与
O y1 中都没有形成直接同被引关系但是图 中 md hn pmp oefsegeoacfacor\litt与 通 过关键词
publication garfield e及作者 的 传 递 才 形 成 了 同 被
y 引 关 系而
mah caon m cocaon\ wodsllllittir与 则 经 过 关 键 词 n ymaassbaalirrr及作者 的传递 形成了同被引关O y系因此作者的同被引关系减少或减弱不能完
CKCA全归结 为 在发现作 者关系方面的能力存在
yCKCA不足相 反 网络通过关键词节点使同被引
O作者间的关 系更加明确
y1 2 yCKCA第三从图 与图 的对比中能发现
ACA与 相比在发现类团 间关联的能力方面有所不y ACA( 2 ) yKG足例如在 网 络 图 中类 团 与 通
egghe\Vanaan a\aon lrfjlrsry过 作 者 建立关联类Gouhak\bauek\Vaughan Jksr团 与 通 过作者
l\barilan jyHG建 立关 联类团 与 通过作者 whhd n G H Ke\arsory\\J\itl建 立 关 联但是 这
O y间 的 关 联 并 没 有 得 到 呈 现其原因可能是因为
y 团间发挥连 接 作 关键词的区分和限定原本在类
O用 的 作 者 同 被 引 关 系 消 失 或 者 减 弱了
5 总 结
通 过 施 引 关 键 词 与 被 引 作 者 的 交 又 共 现 分 析
\ ( CKCA) 能够 直 接清 晰 地 发 现 科 学 领 域 中 的 学 术
y流派及研究方向并巨能够细致的观察到作者间关
y联的内容发现在某一主题领域有重要贡献的研究
O yCKCAy人员尽管方法也存 在一些不足如原本
O 重 要的类团间连接节点关系被减弱甚至消失但
y ( ACA) CKCAy 是与作者同被引分 析 相 比分 析
y能 够 更 直接的反应学术流派的研究主题和方向
y更直接的 反映作者同被引关系的内容具备了更高
O yI 的可读性当然目前的研究还存在一些不足
ACAO 分
y 析可以 用 于 发 现 跨 领 域 分 析本 文 研 究 只 检 验 CKCAy了 方法在 某 一 特 定 领 域 中 的 作 用未 来 应
CKCA该 在 跨领域的研究中进一步检验 方 法的有
1效性
CKCA, 方法 在 施 引 关 键 词 与 被 引 作 者 的 相 关
1 性 计算方法仍 然 值 得 进 一 步 研 究, 由 于 数 k
y据 集 中参考文献只有第一作者因此分析结果受
O到了一 些影响
参 考 文 献
1 whiteH DyGriffith BC.AuthorCocitationI A Literature
pphppd uhn n oooooy aacesaeaccaaasesrlifrtr -ittiln Snn Sny1981 y32 3 Amoyoomo()IecaceaceceriitfrIfrtii Snmy 2009 y 80 ( 1 ) 103 130 J ceoercsI -.itti.163 171 -. 8 LddLSmmuy uhn n eyesorffaryeasresaorcocaoa- .iilittitti 2 ZhD ZySmnn Anuuum aoroaIeecasrcreofsett.tlltltttalysisyand information theory J .JournaloftheAmerican cell researchI acomprehensiVeauthorco-citation SocietyforInformation Scienceand Technologyy2005 y56 analysisofa highly collaboratiVe and ( 7 ) I769 772 -.mudscpnay ed J Scenomecsy2011 y87 ltiiilirfil. ittri
9 Ahgen Py JaneVngBy Rousseau RReKuemensoa lrri.irtfr( 1 ) I115 -131 .
ocitation similarity measurey with specialreference to 3 0sareh FyMcCain Kw.TheStructureofIranian Peason , s coeaon coecen J Jounaohe rrrltiffiit.rlftcChemsyReseachy1990 2006 I An i- trr-Amecan Socey onomaon Scence and TechnoriitfrIfrtii- AuhoCocaon Anayss trittililogyy2003 y( 54 ) I550 -560 . J .Journalofthe American Society forInformation
10 whiteH D.Authorcocitation analysisand Pearson , sr Scienceand Technologyy2008 y59 ( 13 ) I2146 -2155 . J Jounaohe Amecan Socey onomaon .rlftriitfrIfrti 4 NeuS Py Rasheed A Ay Naaaan rrtrjScenceand Technoogyy2003 y( 54 ) I1250 1259 il-.V.Theintellectual 11 Yen S JyChen ALP.An efficientapproach todiscoVering structureofthestrategicmanagementfieldI An
knowedgeom agedaabases C Poceedngsohe lfrlrt//riftauhococaon anayss tr- ittili
Fouh nenaonaConeence on Paaeand DsrtItrtilfrrlllitri- J SaegcManagemenJounay2008 y 29 ( 3 ) I319 336 .trtitrl-.buted Information Systemsy1996 I8 -18 . 5 TsayM YyXu Hywu Cw.Authorco-citation 12 Braam R Ry Moed H Fy Van Raan A F J.Mappingof analysisof semiconductorliterature
nbmbnd n nd wd nsceceycoeco-caoaoraayssIII iiittili. Snmy 2003 y 58 J ceoercs.itti
Dnmp unhAmn Syacaasecs J Joraofeercaocey ilt.ltiit( 3 ) I529 -545 .
forInformation Sciencey1991 y42 ( 4 ) I252 -266 . 6 DingY.Topic-Based PageRank on AuthorCocitation 13 h n ndKunn nddun HEAoyV~scJeaaasscec ir.i ttifiiilitifiNewoks J JounaoheAmecan t- r.rlftrieseach oupu C Poccedngs o he Naonarrtt//rifttil Soceyonomaon Scenceand Technoogyy2011 y62 itfrIfrtiilAcademyofSciences of SAy 2005 y V15 y 102 ( 46 ) I ( 3 ) I449 -466 .
7 SchneiderJwy Larsen By Ingwersen P.A
compaaVe sudyosand aauhococaon rtitffirtll-tr-itticounngy and wo deenmageneaon titiffrttri rti万方数据 369
16572 nn1997 109 < 13="" 515="" 524="" 16569="">
14 Bun T GnwnnnCbn w 21 KRNEbhH Thmn DRHpnnd []ra,zeIeraoaoaorao:[]osoff,erarJ,ooayersocal l.ttillltiillit ttt.i
b Kpn AV E Eupn Rh? eeegeasroeaesearc[J]ilit. upn w dmp un bbm nd sersocforoaassgoercsailiiliti
Scientometrics,1996 ,26 < 2="" )="" :147="" -254="" .="" databasetomography[="" j]="" .journaloftheamerican="" society="" [15="" ]="" braun="" t,gl="" nzelw,="" grupp="" h.thescientometricweight="" forinformation="" science,1999="" ,50="">< 5="" )="" :427="" -447="" .="">
o50 Naonsn 27 ScenceAeas, 1989 1993 Paftiiir-.rtII. [ 22 ] [ M] , ..'埃利 泽 盖 斯 勒 科 学 技 术 测 度 体 系 周 萍等
2004 :,..译 LifeSciences[ J] .Scientometrics,1995 ,24 < 2="" )="" :207="" -237="" .="" 北="" 京科学技术文献出版社="" [="" 16="" ]="" glanzelw.nationalcharacteristicsin="" internationalscien-="" [="" 23="" ]="" swanson="" d="" r,="" smalheisern="" r.an="" interactivesystem="" for="">
ccoauhoshp eaons[ J] Scenomecs, 2001 , 51 tifi-trirlti.ittrindngcompemenayeaues: Asmuusoscenc iiltrlitrtrtiltitifi
< 1="" )="" :69="" 115="" -.dscovey[="" j]="" acanegence,="" 1997="" ,="" 91="">< 2="" )="" :="" ir.rtifiilitlli[="" 17="" ]="" garfield="" e.citation="" inde="" ing-evolvinggrammarofcitation="" 183="" -203="" .="">
Analysis[ J] .CurrentContents,1979 ,< 28="" )="" :5="" -6="" .="" [="" 24="" ]="" smallh.cocitation="" in="" scientificliterature-newmeasure="" [="" 18="" ]="" amnd="" t="" c,="" ngwesen="" pnomecanayseson="" he="" liir.ifrtriltoreaonshp="" beween="" 2="" documens[="" j]="" jounaohe="">
wod wde web: Mehodoogca appoaches o rlitlilrtAmerican Societyforinformation Scienge,1973 ,24 < 4="" )="" :="">
webometrics [ J] .JournalofDocumentation, 1997 , 53 265 -269 .
< 4="" )="" :="" 404="" 426="" -.[="" 25="" ]="" caon="" m,couaj,lavefcowod="" anayssasaoollrtilill.-rlitl="" [="" 19="" ]="" mehol="" ,="" yangkmpacodaasouceson="" caon="" i.itftrittiodescbnghenewok="" oneaconsbeween="" basc="">
countsand rankingsofLIS faculty: web ofscienceVersus nd technological research: The case of polymer
copusand googlescholar[ J] .JournaloftheAmerican chemsitry[ J] .Scientometrics,1991 ,22 < 1="" )="" :155="" -205="" .="" asnmn="" snnd="" thn2007="" 58="" oceyforiforaoceceaecoogy,,ittiil="">< 13="" )="" 2105="" 2125="" (="">:-.责任编辑 王建平 [ 20 ] CamiJ.Impactolatry: diagnosisand treatment[ J] .Medi-
万方数据 _ 370 _
范文二:【doc】专题文献高被引论文的连续同被引聚类分析
专题文献高被引论文的连续同被引聚类分
析
喜,.彳呵
n一
??蔷
专题
(由国医科大学医学信息系辽宁】1oo01)2审r
文献高被引论文的连续同被引聚类分析
AbstractThispaperdescribesthatthecocitationclustermethodisapptiedtoanalyse
thehepatitisC.Thisanalysisprocessiseonti~:uausanddynamic,SOitindicatesthattheanaly
sis
iSeffective.
KeywordCitationClustermethodStatisicanalysis
.前言.囝中标号示论文的韪阿差
同被引聚类分析可以用来表示某一学科或专题的
研究结构和状况_1].在此基础之上,对某学科和专题的 高被引论文的连续的同被引聚类分析则应该可以动态 地表示该学科和专题的变化情况-.基于这一设想,本
文利用引文索l光盘,对某一专题文献的高被引论文
进行了连续的同被引聚类分析,试图扩大这种文献计
量学方法的应用范围,井与同行切磋交流
1材料与方法
本文选取了丙型肝炎(Hepatitisc)这一目前正处
于发展之中的研究专题作为所研究文献的范畴;具体
步骤是:
f1)分别从19帅,1993年《科学引文索引》光盘
(SCICD—ROM),套录其标题中,同时含有"Hepatitis"
和"c的论文的引文为分析的样本
(2)应用FOXBASE语言编制程序,统计引文出 现频攻(即伏1次数),将各年被引次数超过40次的引 文定为高被引论文再应用该程序形成这些论文的同 被引矩阵
(3l应用OCHIIA系数将同被引矩阵转换为相关 矩阵甲乙两论文的OCHI1A系数甲乙论文共被引 次数/(甲论文被引次数x?乙论文被引次数).
,采取平均 (1)应用SAS语言的CLUSTER过程
距离法分别聚类,形成聚类树图.
(5)将这些聚类结果依年代加以分析,比较,探求 丙型肝炎研究的变化过程与趋势.
2结果与分析
各年高被日l论文同被日l聚类分析树图,见图 -
46——
圈41993年丙肝高被B1论文的粜娄
?
第19卷1996年第1期?
表1丙型肝炎文献1990,1993年间高被引论文 在过去1o年里.科学家对田输血产生的非甲非己 肝炎的致病日子做了许多研究,确定它是一种病毒.但 对它的性质还缺乏真正的了解.直至1989年.CHOO 和KUO成功地从受感染的黑猩猩的血液标本中克隆 出了非甲非己型肝炎病毒,并命名为丙型肝炎病毒 (HEPAT111sCVIRUS,简称HCV)其成果就是发 表于{SCIENCE》上的两篇论文(文献1和文献2)该 文标志着丙肝研究取得了突破性进展,并为今后的研
究打开了新的局面
通过对丙型肝炎高被引论文4年来同被引聚类结 ?
情报理论与实践?
果的比较,分析,可以发现该研究正在不断探入和扩 展.
?1990年聚类结果的分析:是以1989年发表的 代表着丙肝研究重大突破的两篇论文为核心,附应 用该成果,通过抗原抗体反应检测不同国家(荷兰,酉 班牙)非甲非己肝炎病人中HCV抗体阳性率,由此验 证该研究的有效性与可靠性的文献3,5.这些论文代 表着丙肝研究生长点.
@1991年聚类结果的分析:在1990年取得成果 的基础之上.丙肝研究进一步深化.除应甩抗体反应诊 47
断丙肝的研究范围不断扩大外(如文献8,11研究肝癌 患者中HCV抗体阳性率.文献7则探讨慢性活动性 肝炎患者中HCV抗体阳性率),还出现了应用多聚酶 链反应(简称PCR)技术诊断丙肝的新方法(文献9), 和对HCV结构加研究的论文(文献10). @1992年聚类结果的分析:有关HCV结构的研 究内容明显扩大与深化(文献13,14,15,17和18),抗 贩抗体反应诊断方法(文献12,16,22)和PCR诊断方 法也有深入(文献19).同时叉出现了有关丙肝治疗的 新类别(文献20)
?I993年聚类结果的分析:在基本保持1992年 研究结构原貌的基础上,各类均有不同程度的扩大.如 有关治疗的类别加入了文献24;有关HCV结构的类
别加进了文献27I而有关抗体反应的文献增加不多 值得注意的是有关肝癌的HCV抗体反应的文献8,I1 在聚类圉中消失,而新增加的文献23,25,28等却无法 更好地lI了类.这些有关抗体反应检测方法的可靠性的 文献16,23和PCR法假阳性率的论文(文献28),以及 RNA提取技术的介绍(文献25),即预示着丙肝研究 进入开始回顾与总结的阶段,也表明该研究处于更激 烈的变化的前夜
综上所述,同被引聚类分析比较清晰地为我们勾 勒出近几年来丙型肝炎研究的变化过程.这一过程既 是一个原有题目的延续过程,又是一个不断深入与扩 大的过程,即从最初的抗原抗体反应诊断丙肝,到应用 PCR拄术诊断该病.到有关HCV结构的广泛研究,再 到丙肝治疗的研究的过程
3结论
本研究的结果说明,连续,动态的高频被引论文的 同被引聚类分析是能够反映某一专题研究的结构及这 些结构的发展过程的=
4讨论
连续同被引聚类分析在反映学科或专题研究结构 及其发展趋势的效果上要受到很多固索的影响. (1)选题.本研究选取丙型肝炎这一目前比较活 跃的专题作为研究对象,日此结果比较理想;但除了处 于发展和生长的专题外,是否对其它不是很活跃的领 域也能如此有效,则有待于进一步的研究
(2)方法的选择及统计误差.包括:
?将同被引矩阵转为相关矩阵时相关系数的选 择;?聚类时最大距离法,最小距离法,平均距离法,重 心法…等方法的选择;@被分析的引文中.固输入错误
造成的误差,如姓名拼写杂志缩写的不同等,都会对 统计结果造成一定的影响;0此外,受技术上的限制, 本研究未能应用多维标度技术在平面上更为形象地表 现丙型肝炎研究的变化过程:
(3)主观认识的变化.不同年代高被引论文的连 续同被引聚类分析,不仅能反映这一主题客观上的变 化,同时也反映了不同时间里研究人员对该题目的认 识过程.倒如,有些论文在早期被归入有关HCV结构 的研究之中,但随着研究的探入.更加先进,更加专门 化的研究成果的出现,这些旧的文献逐渐失去其在某 一
方面的特跌意义,而被转入它类,乃至消失.] 参考文献
1SmallHG.eta1.TheStructureofScientificLitera
t…I:IdentifyingandGraphingeciahiesScienceStud— ies.1974,(4):17,40
2SmallHG.ACo—citationMode1ofaScientificSDe— ciak!ALongitudinalStudyofCollagenResearchSocial
StudiesofScience1977.(7):139,166
"中文图书,连续出版物计算机
编目培训班"报名通知
为了在图书隋报界早目实现网络化联机编目和书 目数据共享,根据广大犏目工作者的要求,我杂吾牡与 中国科学院文献情报甲心教育委员会联台干l996年 4月下旬或5月上旬在j:京举办"甲文图书,连续出版 l糟计算机缔目培训班".其课程以《中国祝爱目录通讯 格武》(根据国际标准机读格式)为教学内容,由有关专 家和有实践盔验的老师讲授,理论系实际,学彗 合.在较短的时内达到基本掌握.对通过学习考试台
格者,颁发结业证书.
为保证教学质量,几参加者需具有一定的中置图 书,连续出版物辐目工作基础;由于名瓤有喂(40^左 右),敌参加者请于1996皇3月5日前来函索取报名 表.光址:;0京王府井土街27号吾书骨报工作志 社.联系^:撩健.邮码:100710.
?
第19卷1996年第1期?
范文三:专题文献高被引论文的连续同被引聚类分析
●崔雷 (中国医科大学医学信息系 辽宁 110001)
专题文献高被引论文的连续同被引聚类分析
Abstract T h is paper describes that the co 2citati on cluster m ethod is app lied to analyse
the hepatitis C . T h is analysis p rocess is continuous and dynam ic , so it indicates that the analysis is effective .
Keyword C itati on C luster m ethod Statisic analysis
0 前言
同被引聚类分析可以用来表示某一学科或专题的 研究结构和状况 [1]。 在此基础之上 , 对某学科和专题的 高被引论文的连续的同被引聚类分析则应该可以动态 地表示该学科和专题的变化情况 [2]。 基于这一设想 , 本 文利用引文索引光盘 , 进行了连续的同被引聚类分析 , 量学方法的应用范围 1本文选取了丙型肝炎 (H epatitis C ) 这一目前正处 于发展之中的研究专题作为所研究文献的范畴 。 具体 步骤是 :
(1) 分别从 1990~1993年 《科学引文索引》 光盘 (SC I CD 2ROM ) , 套录其标题中 , 同时含有
“ H epatitis ” 和 “ C ”
的论文的引文为分析的样本 。 (2) 应用 FOXBA SE 语言编制程序 , 统计引文出
现频次 (即次引次数 ) , 将各年被引次数超过 40次的引 文定为高被引论文 。 再应用该程序形成这些论文的同 被引矩阵 。
(3) 应用 OCH II A 系数将同被引矩阵转换为相关
矩阵 。甲乙两论文的 OCH II A 系数 =甲乙论文共被引
次数 (甲论文被引次数 乙论文被引次数 ) 。
(4) 应用 SA S 语言的 CLU ST ER 过程 , 采取平均
距离法分别聚类 , 形成聚类树图 。
(5) 将这些聚类结果依年代加以分析 、 比较 , 探求
丙型肝炎研究的变化过程与趋势 。
2 结果与分析
各年高被引论文同被引聚类分析树图 , 见图 1~
4。
图中标号所示论文的题目见表 1。
1 1990年丙肝高被引论文的聚类图
图 2 1991年丙肝高被引论文的聚类图
图 3 1992年丙肝高被引论文的聚类图
图 4 1993年丙肝高被引论文的聚类图
— 64— ?第 19卷 1996年第 1期?
表 1 丙型肝炎文献 1990~1993年间高被引论文
标号 作者 论文标题 发表年代 期刊 1KUO G 人类非甲非乙肝炎主要致病病毒血中抗体的检测 1989SC IEN CE
2CHOO Q L 血中非甲非乙肝炎基因组衍生 CDNA 克隆的分离 1989SC IEN CE 3EST EBAN J I 西班牙危险人群 HCV 抗体的检出 1989LAN CET 4AL T ER H J 急慢性非甲非乙肝炎前瞻性随访输血接受者丙肝 1989N EN G J M ED 5VAN D PO EL C 抗丙肝抗体和荷兰非甲非乙输血后肝炎 1989LAN CET 6W E I N ER A J 非甲非乙肝炎 HCV 片段的检出 1990LAN CET 7M cGA RLAN E I G 慢活肝中 HCV 抗体 :致病因子或假阳性结果 1990LAN CET 8BRU I X J 西班牙肝癌和肝硬化患者 HCV 抗体的发生率 1990LA CCET
9GA R SON J A 应用 “ 巢式” PCR 检出血中 HCV 片段及传染预测 1990LAN CET 10O KAM AO TO H HCV 基因组的 5θ终端片段 1990JA P J EXP M ED 11COLOM BO M 意大利肝癌患者 HCV 抗体的发生率 1989LAN CET 12VAN D PO EL C 通过新的四抗原重组免疫印迹分析确认 HCV 感染 1991LAN CET 13CHOO Q L HCV 的遗传组织与转向 1991P N A CAD SC I U S A 14KA TO N 日本非甲非乙肝炎病人 HCV 染色体组的分子克隆 1990PRO N A CAD SC I U S A 15TA KAM IZ AW A A 人类携带者分离出 HCV 染色体组的结构与组织 1991J V
16EA T EBAN J I 对输血后肝炎研究中 HCV 抗体检测法的评价 J M ED
17HOU GH TON M HCV 的分子生物学 :
制中的意义
GY
18HAN H HCV RNA 末端区特征 :θ
(A )
1991
P N A CAD SC I U S A
19FA RC I P 1991N EN G J M ED
20DAV IS Α:一次多层随机化对照
1989N EN G J M ED
21KAM O TO H 通过二期 PCR 应用两对来自 5θ非编码区引物检出
HCV RAN
1990JA P J EXP M ED
22VAN D PO EL C HCV 抗体血液阳性的传染性 1990N EN G J M EN 23AA CH R D 输血后肝炎中 HCV 感染 :用一 、 二代检测法分析 1991N EN G J M ED
24D B ISCEGL IE 重组 Α干扰素治疗慢性丙肝 :一次随机 、 双育 、 安慰剂对
照研究
1989N EN G J M ED
25CHOM CZYN SK I 应用硫氰酸 2酚 2氯仿胍酸提取物一步分离 RNA 1987ANAL B I OCH E M 26AL T ER M J 美国急性非甲非乙肝炎危险因素与 HCV 感染关系 1987JAM A
27O KAM A TO H 从人类携带者分离 HCV RNA 基因组核酸片段 :与报导
的存储和发散区域分离物相比较
1991J GEN V I ROL
28K W O K S 避免 PCR 中的假阳性 1989NA TU R E
在过去 10年里 , 科学家对因输血产生的非甲非乙 肝炎的致病因子做了许多研究 , 确定它是一种病毒 , 但 对它的性质还缺乏真正的了解 。 直至 1989年 , CHOO 和 KUO 成功地从受感染的黑猩猩的血液标本中克隆 出了非甲非乙型肝炎病毒 , 并命名为丙型肝炎病毒 (H EPA T IT IS C V I RU S , 简称 HCV ) 。 其成果就是发 表于 《 SC IEN CE 》 上的两篇论文 (文献 1和文献 2) 。 该 文标志着丙肝研究取得了突破性进展 , 并为今后的研 究打开了新的局面 。
通过对丙型肝炎高被引论文 4年来同被引聚类结 果的比较 、 分析 , 可以发现该研究正在不断深入和扩 展 。
① 1990年聚类结果的分析 :是以 1989年发表的 代表着丙肝研究重大突破的两篇论文为核心 , 附以应 用该成果 , 通过抗原抗体反应检测不同国家 (荷兰 、 西 班牙 ) 非甲非乙肝炎病人中 HCV 抗体阳性率 , 由此验 证该研究的有效性与可靠性的文献 3~5。这些论文代 表着丙肝研究生长点 。
② 1991年聚类结果的分析 :在 1990年取得成果 的基础之上 , 丙肝研究进一步深化 。 除应用抗体反应诊
— 7 4
—
?情报理论与实践?
断丙肝的研究范围不断扩大外 (如文献 8、 11研究肝癌 患者中 HCV 抗体阳性率 , 文献 7则探讨慢性活动性 肝炎患者中 HCV 抗体阳性率 ) , 还出现了应用多聚酶 链反应 (简称 PCR ) 技术诊断丙肝的新方法 (文献 9) , 和对 HCV 结构加以研究的论文 (文献 10) 。
③ 1992年聚类结果的分析 :有关 HCV 结构的研 究内容明显扩大与深化 (文献 13、 14、 15、 17和 18) , 抗 原抗体反应诊断方法 (文献 12、 16、 22) 和 PCR 诊断方 法也有深入 (文献 19) 。同时又出现了有关丙肝治疗的 新类别 (文献 20) 。
④ 1993年聚类结果的分析 :在基本保持 1992年 研究结构原貌的基础上 , 各类均有不同程度的扩大 。 如 有关治疗的类别加入了文献 24; 有关 HCV 结构的类 别加进了文献 27; 而有关抗体反应的文献增加不多 。 值得注意的是有关肝癌的 HCV 抗体反应的文献 8、 11在聚类图中消失 , 而新增加的文献 23、 25、 28等却无法 更好地归类 。 这些有关抗体反应检测方法的可靠性的 文献 16、 23和 PCR 法假阳性率的论文 (文献 28) , 以及
RNA 提取技术的介绍 (文献 25) , 即预示着丙肝研究
进入开始回顾与总结的阶段 , 烈的变化的前夜 。
综上所述 , 这一过程既 , 又是一个不断深入与扩 大的过程 , 即从最初的抗原抗体反应诊断丙肝 , 到应用
PCR 技术诊断该病 , 到有关 HCV 结构的广泛研究 , 再
到丙肝治疗的研究的过程 。
3 结论
本研究的结果说明 , 连续 、 动态的高频被引论文的 同被引聚类分析是能够反映某一专题研究的结构及这 些结构的发展过程的 。
4 讨论
连续同被引聚类分析在反映学科或专题研究结构 及其发展趋势的效果上要受到很多因素的影响 。
(1) 选题 。 本研究选取丙型肝炎这一目前比较活
跃的专题作为研究对象 , 因此结果比较理想 。 但除了处 于发展和生长的专题外 , 是否对其它不是很活跃的领 域也能如此有效 , 则有待于进一步的研究 。
(2) 方法的选择及统计误差 。 包括 :
①将同被引矩阵转为相关矩阵时相关系数的选 择 ; ②聚类时最大距离法 、 最小距离法 、 平均距离法 、 重 心法…等方法的选择 ; ③被分析的引文中 , 因输入错误 造成的误差 , 如姓名拼写 、 杂志缩写的不同等 , 都会对 统计结果造成一定的影响 ; ④此外 , 受技术上的限制 , 本研究未能应用多维标度技术在平面上更为形象地表 现丙型肝炎研究的变化过程 。
(3) 主观认识的变化 化 , HCV 结构 , 但随着研究的深入 , 更加先进 、 更加专门 化的研究成果的出现 , 这些旧的文献逐渐失去其在某 一方面的特殊意义 , 而被转入它类 、 乃至消失 。 □
参考文献
1 Sm all H G . et al . T he Structure of Scientific L itera 2ture , I :Identifying and Graph ing Specialties
. Science Stud 2ies , 1974, (4) :17
~402 Sm all H G . A Co 2citati on M odel of a Scientific Spe 2cialty :A L ongitudinal Study of Co llagen R esearch . Social
Studies of Science 1977, (7) :139
~166“ 中文图书 、 连续出版物计算机
编目培训班” 报名通知
为了在图书情报界早日实现网络化联机编目和书 目数据共享 , 根据广大编目工作者的要求 , 我杂志社与 中国科学院文献情报中心教育委员会联合于 1996年
4月下旬或 5月上旬在北京举办 “中文图书 、 连续出版
物计算机编目培训班” 。 其课程以 《中国机读目录通讯
格式》
(根据国际标准机读格式 ) 为教学内容 , 由有关专 家和有实践经验的老师讲授 , 理论联系实际 , 学用结
合 , 在较短的时间内达到基本掌握 。 对通过学习考试合 格者 , 颁发结业证书 。
为保证教学质量 , 凡参加者需具有一定的中文图 书 、 连续出版物编目工作基础 。由于名额有限 (40人左 右 ) , 欲参加者请于 1996年 3月 5日前来函索取报名 表 , 地址 :北京王府井大街 27号 , 图书情报工作杂志 社 , 联系人 :徐健 , 邮码 :100710。
— 84— ?第 19卷 1996年第 1期?
范文四:COPD高被引文献分析
CNKI 核心期刊源慢性阻塞性肺疾病高被引文献的计量分析
慢性阻塞性肺疾病(COPD )是老 年常患的疾病之一,以气流受限为主 要特征,其进展缓慢,但反复发作, 呼吸困难、咳嗽、咳痰等症状进行性 加重,为患者的生活能力和劳动能力 带来影响。目前临床尚未有完全治愈 该疾病的报道,为家庭带来严重的负 担,因此总结慢性阻塞性肺疾病研究 的最新变化是非常有必要的。运用文 献计量学方法,分析文献特征,有助 于掌握相关研究现状,研判未来发展 趋势,日益受到学者重视。为此,本 文对国内核心期刊源慢性阻塞性肺疾 病高被引文献进行了计量分析。 1 文献与方法
1. 1 文献获取 选中国学术期刊全文 数据库 ( CNKI) ,检索主题词 =“慢 性阻塞性肺疾病”,选择核心期刊的 文献。
1. 2 高被引文献确定 借用普赖斯 定律确定核心机构的方法 [1],被引 频次 N =0. 749 ×√ ηmax 以上的 文献为高被引文献。其中 ηmax ,为 最高被引频次。结果 ηmax=1052, N =24.29,即被引频次≥ 25的文献为 高被引文献。
1. 3 指标及统计 将符合主题词并 为核心期刊来源的文献,按被引频次 由高到低排列,选取慢性阻塞性肺疾 病相关的高被引文献 100篇,其中有 意识地选取被引频次相近且剔除交叉 重复和一稿多投的高被引文献。将期 刊名称、发表年份、作者姓名、作者 单位、关键词、基金名称、被引频次 输入 Excel 文档,校对无误后统计 分析。
2 结果
2. 1 一般结果 CNKI含慢性阻塞 性肺疾病相关且为核心期刊来源的文 献 36476篇。其中,被引文献 1663 篇,占 4.6%;高被引文献 155 篇, 占总文献 0.25%、总被引文献 9.32%。 选取高被引频次排名前 102名,并剔 除被引频次相差太多的文献 3篇 [2-4]。 终纳入核心期刊源的高被引文献 100 篇,累计被引 5250次,篇均被引 52.5次。其中, 54篇被引 30 ~47 次,占 54%; 28篇被引 48 ~65次, 占 28% ; 8篇被引 66 ~83次,占 8% ; 3篇被引 84 ~101次,占 3%; 1篇被引 102 ~119次,占 1%; 2篇被引 120 ~137次,占 2%; 1篇被 引 156 ~ 173次; 1 篇被引≥ 174次,占 1%。见图 1。
2. 2 发表年份 文献年代分布情况 能够揭示该领域文献研究发展历程、
发展趋势,通过文献年代分布计量可 以系统的了解该领域学科产生、发展 与成熟的过程。所纳入的 100篇
CNKI 核心期刊源慢性阻塞性肺疾病 高被引文献,发布年份为 1998 ~ 2012年,最早见于 1998年 [5],
1998 ~2004年呈波浪发展,年均
2.14篇; 2005 ~2012年慢性阻塞性 肺疾病研究的稳步发展阶段,虽
2005 年至峰值 19篇迅速逐年下降至 2008年的 7篇, 2009年稍有回升后 降至最低 2012年的 5篇,年均
10.75 篇,依然可以观察到文章数量 平稳发展。总体呈缓慢下降趋势。见 图 2。
2. 3 载文期刊 通过分析期刊载文 量,总被引频次、篇均被引频次的期 刊分布情况能够确定研究慢性阻塞性 肺疾病的主要核心期刊、较权威的期 刊有哪些,有助于选择该领域主要靶 向投稿刊物。同时可了解慢性阻塞性 肺疾病研究与其他学科融合状况。 100篇慢性阻塞性肺疾病高被引文献 来自 51 种期刊,总载文比 1.96。 表 1 显示,文献数量排名第 1和第 2的是《中华护理杂志》、《中华结 核和呼吸杂志》,《北京中医药大学 学报》和《中国呼吸与危重监护杂志》 并列第 3。《中华结核和呼吸杂志》、 《中华护理杂志》、《中华中医药杂 志》、《北京中医药大学学报》、 《中国中西医结合杂志》总被引频次 依次居前 5 位。《现代康复》、 《中国中西医结合杂志》、《中国实 用内科杂志》、《中华结核和呼吸杂 志》、《中华中医药杂志》的篇均被 引频次依次居前 5 位。其中,《中 华护理杂志》、《中华结核和呼吸杂 志》,《北京中医药大学学报》、 《中国呼吸与危重监护杂志》共载文 38篇、 2135次,占 100篇高被引文 献 38%、高被引文献总被引频次 40.42%,可见以上几个期刊可作为本 领域主要靶向投稿期刊;以及选择该 领域参考文献时,可优先选择的发布 在该类期刊文献。
2. 4 文献作者 分析文献作者,可 以了解该领域研究的核心研究人员是 谁,当研究该领域时可优先参考这些 作者的文献,或直接联系他们。 100篇慢性阻塞性肺疾病高被引文献涉及 作者 343人、署名 460次。其中,署 名 10次、 9次各 1人,分别是李建 生、王明航,署名 7次、 5次各 2人, 署名 4 次 7人,署名 3次 9人,署 名 2 次 42人,署名 1次 278 人。独 撰 10篇,占 1%; 2 人合作 12篇, 占 12%; 3人合作 16篇,占 16%; 4人合作 15 篇,占 15%; 5 人合作 11篇,占 15%; 6人、 7人合作各 10 篇,
各占 10%; 8 人合作 5篇,占 5%; 9人合作 3篇,占 3%; 10人合作 2篇, 占 2%; 12人合作 1篇,占 1% ;协 作组撰写 2篇 [5-6],占 2%。累计合作 90篇,总合作率 90% 。见表 2。 2. 5 作者机构 分析作者来源机构, 可以了解该领域哪些机构在从事慢性 阻塞性肺疾病的研究;分析机构发文 数,可以了解该领域热门研究机构以 及权威机构有哪些,有助于欲从事该 领域研究者收集资料找寻靶向机构。 剔除机构不详的文献 2篇 [5-6],将 n 人合作的文献每人计 1/n 篇、大学 附属医院的文献计入相应大学, 100篇慢性阻塞性肺疾病的高被引文献共 涉及机构 95个。其中,医院 35个 (36.84% ) 、院校 59个 (62.11% ) 、 科研院所 1个 (1.05% )。最高产发文 机构为北京中医药大学,共 5.82篇。 根据普赖斯定律 [1],核心发文机构 文献数≥ 1.80 篇,共 19个,折合发 文 49.54 篇 , 涉及文献数 69篇。其 中,院校 16个、医院 2个、科研院 所 1个,依次占 84.21%、 10.52%、 5.26%。署有北京中医药大学、河南 中医学院、北京大学的文献数居前 3位,依次为 10篇、 9篇、 6篇;中北 京中医药大学、河南中医学院、北京 大学的折合文献数居前 3位,依次 为 5.82篇、 5.16篇、 4.86篇。见 表 3。
2. 6 关键词 关键词是论文的 文献检索标识,是表达论文主题概念 的自然语言词汇,在很大程度上反映 了论文的主要研究内容。在大量同专 业论文的关键词集合中,隐含着该学 科的研究现状、研究热点、发展规律 和发展趋势等线索 [7]。通过分析某 学科领域期刊论文的关键词的词频, 可以描述该研究领域的研究状况,进 而揭示该领域的热点和发展趋势。 100篇慢性阻塞性肺疾病高被引 文献均列有关键词 2 ~11个,共涉 及关键词 180个、 394次,篇均关键 词 1.8个。其中,使用 2个、 3个、 4个、 5个、 6个、 9个、 10个、 11个关键词的文献,分别有 7篇、 30篇、 34篇、 21篇、 5篇、 1篇、 1 篇、
1 篇,依次占 7%、 30% 、 34% 、
21% 、 5% 、 1% 、 1% 、 1%。关键词 “慢性阻塞性肺疾病”、“肺疾病”、 “慢性阻塞性”、“急性加重期”、 “生活质量”使用频次居前 6位。见 表 4。排名前三位的关键词非常相近, 这与检索使用的主题词“慢性阻塞性 肺疾病”相符合。除去已用于搜索条 件的主题词 “慢性阻塞性疾病”及 其相近的词,以及一些非实质性词语, 如随机对照试验、临床研究等,从表
4可以看出, 1998 -2012 期间慢性 阻塞性肺疾病研究的重点和热点所在。 大致归类为 5个方面 :(1)中医方 面的研究,包括症候分析、中医治疗;
(2)护理、健康教育、生活质量;
(3)急性加重期和稳定期研究;(4) 流行病学研究;(5)新型治疗方法 --无创正压通气的研究。
2. 7 基金类别 通过对基金项目的 统计,可以客观地反映该研究领域所 获得的资金支持和重视程度。在 100篇慢性阻塞性肺疾病高被引文献中, 获基金支持的文献共 23篇,占 23%。 其中,国家自然基金 8项次、国家科 技攻关计划 6项次、国家重点基础研 究发展计划项目 5项次、国家科技支 持计划项目 4项次、跨世纪优秀人才 赔偿计划项目 4项次。基金资助研究 将会大大提升研究文献的质量及水平, 在未来的研究中该领域的研究如若能 获得更多的基金项目资助,能够推动 医学期刊的质量及核心竞争力的发展。
参考文献
[1]马费成,胡翠华,陈 亮主编 . 信息管理学基础 . 武汉 : 武汉大学出版社, 2002.83-90.
[2]慢性阻塞性肺疾病 (COPD)诊治规范 (草案 )[J].中华结核和呼吸杂志, 1997, 04:8-12
[3]柳涛,蔡柏蔷 . 慢性阻塞性肺疾病诊断、处理 和预防全球策略 (2011年修订版 ) 介绍 [J]中国呼 吸与危重监护杂志, 2012, 01:1-12 [4]程显声,李景周,张珍祥,刘国华,华毅,李 清,徐希胜,赵玉霞,徐永健,张学功,李亚辉, 马秀平 . 慢性阻塞性肺疾病、肺心病人群防治的研 究基线资料分析 [J].中华结核和呼吸杂志, 1998, 12:45-48
[5]慢性阻塞性肺疾病无创机械通气治疗研究协作 组 . 早期应用无创正压通气治疗慢性阻塞性肺疾病 急性加重期患者的多中心随机对照研究 [J].中华 结核和呼吸杂志, 2005, 10:20-24
[6]有创 -无创序贯机械通气多中心研究协作组 . 以 肺部感染控制窗为切换点行有创与无创序贯机械 通气治疗慢性阻塞性肺疾病所致严重呼吸衰竭的 随机对照研究 [J].中华结核和呼吸杂志, 2006, 01:14-18
[7]尹相旭,张更平,李晓菲 . 基于关键词统计 的情报学研究现状分析[J ].情报杂志, 2009 ( 11) : 1- 4
范文五:零被引研究文献的知识图谱分析
摘要:基于Web of Science和中国知网中“零被引”方面的文献数据,融合TDA、 HistCite、 CiteSpaceII、 Ucinet和SATI 3.1等文献计量与可视化分析软件绘制出: ①引文编年图谱,展示零被引研究领域不同年代文献之间的关系,反映出该领域的历史发展脉络,锁定领域内的重要文献和洞察领域的最新进展(如最新的重要文献)等。②作者科研合作网络,揭示出国内外零被引研究领域科研团队的数量和规模情况,以及这些科研团队形成的合作模式。③引文期刊共被引聚类网络,揭示出国际零被引研究参考引用的主要期刊及其之间的关系。④国家和机构的科研合作网络,揭示出国际零被引研究领域主要发文国家、机构及其之间的合作情况; ⑤关键词共现聚类网络和关键词年度--数量分布的气泡图,识别出国内外零被引研究的高频主题词及其之间的相互关系,同时清晰地看出不同主题历年关注度的时间演化规律。
转载请注明出处范文大全网 » 施引关键词与被引作者交叉共现