范文一:右图表示在25条件下研究种子萌发过程中温度变化的实...
八年级科学期末训练 第1页 共2页
1、右图表示在25?条件下研究种子萌发过程中温度变化的实验装置:取甲、乙成熟季节采摘下来,然后利用低温储藏的方法进行保存,等到第二年提前上市,两个暖水瓶,甲瓶内装有萌发的豌豆种子,乙瓶内装有煮熟并冷以卖个好价钱。但是这类水果吃起来感觉水分不足,甜度降低。造成这种现象的却至25?的豌豆种子,两瓶均用包有温度计的棉团塞严。下列各主要原因是 ( ) 图能正确表示几小时后温度计读数的是 ( ) A(蒸腾作用 B(光合作用 C(呼吸作用 D(同化作用
7、下列四幅实验装置图所反映的原理,对发电机的发明有直接影响的是( )
2、不法养猪户在饲料中添加大量瘦肉精,目的是促进猪的瘦肉生长、抑制肥肉生
长。人食用这种猪肉易引起中毒。有一种瘦肉精(CHCNO),白色粉末,无1218l22
, B C D 臭、味苦,熔点161?,溶于水 ,则下列有关瘦肉精说法正确的是 ( )
A、人可以直接食用瘦肉精减肥 B、该瘦肉精属于晶体 O)的各种意义,其中描述错误的一幅是 ( ) 8. 下图中关于化学式(H2
C、该瘦肉精的相对分子量是45 D、该瘦肉精属于混合物
3、预防“禽流感”可用0.5%的漂白粉溶液作为消毒剂,漂白粉的主要成分是次
氯酸钙[Ca(ClO)],次氯酸钙中氯元素的化合价是 ( ) 2
A.+1价 B.+2价 C.+7价 D.-1价
4、如图,有许多小鸟停在高压输电线上并不会触电,以
下解释合理的是 ( )。
A.小鸟是绝缘体,此时通过小鸟身体的电流也很小 9、锂电池是新型的高能电池,以质量轻、电容量大,颇受手机、手提电脑等用户
B.小鸟是导体,此时通过小鸟身体的电流很大 的青睐。某种锂电池的总反应可表示Li+MnO=LiMnO。以下说法正确的是: 22
C.小鸟站在电线上,相当于和电线并联,两脚间的?该反应中Mn的化合价发生了变化 ?该反应属于化合反应 距离很小,分得的电压很小 ?LiMnO为新型的氧化物 2
D.小鸟的电阻很大,即使电压很高,通过身体的电流也很小 A(?? B(?? C(?? D(??? 5、我国赢得了2008年第29届夏季奥运会的举办权。为向世界展现一个新的形象,10、下列有关叙述正确的是 ( )
A(硫在氧气中燃烧发出明亮的蓝紫色火焰 王一翔同学提了下列建议:?开发新能源,减少化石燃料的燃烧;?开发生产无
B(磷在氧气中燃烧时产生白雾 汞电池;?分类回收垃圾;?提倡使用一次性发泡塑料餐具和塑料袋;?提倡使
C(铁丝在氧气中燃烧时,产生明亮的火焰,同时生成黑色物体 用手帕,减少餐巾纸的使用;?提倡不使用含磷洗衣粉;?农业上控制化肥和农
D(木炭在空气中燃烧时,产生黄色的浓烟 药的使用。从“绿色奥运”角度分析,你认为可以采纳的是 ( )
11. 硫化氢能溶于水,其水溶液显酸性,在空气中燃烧生成二氧化硫和水。 A、?????? B、?????? C、?????? D、全部 (1)可用 (填一种试剂)检验硫化氢水溶液的酸性; 6、现在市场上经常可以买到还未到果实成熟季节的水果,商家们把这些水果都说 (2)硫化氢在空气中燃烧的化学方程式为 。 成是进口水果或大棚水果,其实并非都是如此。其中有一些水果是在前一年果实
八年级科学期末训练 第2页 共2页
12、某宿舍楼一单元的几家住户为增强安全
感,在单元楼梯口安装了防盗门。如图所示为
单元防盗门门锁的原理图,各家住户都安有一
个控制开关S,用来控制门锁,图中只画出了
其中一家住户的控制开关。该门锁的工作过程
15、右图是某厂生产的加钙碘盐包装袋商标的部分内容。请仔细阅读后回答以下是:楼上的人闭合控制开关S门锁上通电后的
问题: 电磁铁吸引卡入右侧门上门扣中的衔铁,衔铁配料表:氯化钠、食用碳酸钙、(1)碘酸钾(化学式为KIO)属于 3脱离门扣,门可打开。关于该门锁,下列说法 碘酸钾 (KIO) 3A(混合物 B(化合物 C(氧化物 中正确的是: ( ) 净含量:500g (2)碘酸钾中碘元素的质量分数是多少, ?闭合开关后,电磁铁的右端为S极; ?闭合开关后,电磁铁的右端为N极; (3)一袋该食盐中KIO的质量最多是多少? 成份表:氯化钠?88% 3?该单元的各住户控制门锁的开关是并联的;?该单元的各住户控制门锁的开关16、原煤中含有硫元素,在燃烧过程中产生的二钙含量:0.5%,1.3% 是串联的( 氧化硫会造成大气的污染。某煤场向原煤中加入碘含量:40,50mg/Kg
A.?? B.?? C.?? D(?? 适量的生石灰制成供居民采暖用的“环保煤”,以 13、如图14所示,将一对磁性材料制减少二氧化硫的排放,消弱二氧化硫对空气的污染。燃烧时生石灰吸收二氧化硫 碘(以I计)(20,50)mg/Kg S S 成的弹性舌簧密封于玻璃管中,舌簧 L 舌簧 L 舌簧 E 端面互叠,但留有间隙,就制成了一的化学方程式为:。请回答下列问题: E 220V, 种磁控元件——干簧管,以实现自动220V, (1)m值是________; 干簧管 干簧管 控制。某同学自制了一个线圈,将它 (2)若煤厂一次共加入含氧化钙80%的生石灰1400吨 ,则理论上最多可吸收图14 图15 图14 图15 套在干簧管上,制成一个干簧继电器, 二氧化硫多少吨, 用来控制灯泡的亮灭,如图15所示。17、二氧化硫溶于水并生成亚硫酸,使雨水呈酸性。某煤厂生产的“环保煤” 可干簧继电器在工作中所利用的电磁现象不包括 ( ) 有效地减少二氧化硫的排放,削弱二氧化硫对空气的污染。生产“环保煤”的原
A(电流的磁效应 B(磁场对电流的作用 C(磁极间的相互作用 D(磁化 理是:向煤中加入适量的生石灰可吸收煤燃烧时产生的二氧化硫,反应的化学方14、2009年2月9日(元宵节)晚九时左右,央视副楼着火,火势从西侧升起,
程式为:2CaO+2SO+O2CaSO 。该煤厂现有含硫3.2 ,的原煤1000t。 224受风势影响,蔓延至东侧,并且范围一再扩大,而后不少消防车赶到,却没能马
上控制火势,浓烟不断加剧。22:05 很多群众手持相机摄像机在拍摄。22:12 火 ?如果这些原煤不经过“加工处理”直接燃烧,硫完全转化为二氧化硫时,势已经控制了。据说是在院子里放烟花点燃,火从三楼开始然后一直往上。烟花可生成二氧化硫 t 。
燃烧时把燃料的 能转化为内能和光能。以下几种安全标志中,禁止燃放鞭?写出二氧化硫与水反应的化学方程式 。 炮的是__ __(填序号)。大楼内部的工作人员应该如何自救。请说出一种合适的?如果要将这些原煤全部制成合格的“环保煤”,理论上需含氧化钙98,的自救行为: 。 生石灰多少吨?(计算结果保留1位小数)
范文二:(2)右图表示在低倍显微镜下观察到小鱼尾鳍内血液
1、根据“用显微镜观小鱼尾鳍内的血液流动”实验,回答下列问题:(1)观察前,需用 的棉花把小鱼头部的
鳃盖和躯干部裹起来,并露出尾部,原因是:
(2)右图表示在低倍显微镜下观察到小鱼尾鳍内血液 流动的情况(箭头表示血流的方向),据此判断:?所示的 血管是 ,?所示的血管是 。 (3)血液在标号 所示血管中流动最快;红细胞在标号 所示的血管中呈单行通过,血液在标号 中流速最慢。
2、实验与探究
完成“模拟胆汁能否乳化脂肪”的实验。
材料和用具:试管(或小瓶)植物油、玻璃棒、试管架、蒸馏水、热水、洗涤剂。
?两人为一组,取两个大小相同的试管或小瓶,分别贴上甲乙标签,各加入1/2容量的清水。
?向甲、乙试管或小瓶中各滴入5,6滴植物油,用玻璃棒搅拌后观察现象。
?向甲试管中加入10滴洗涤剂(模拟的胆汁),向乙试管中加入等量的蒸馏水,用玻璃棒充
分搅拌使之混合。
?将甲乙两试管置于装有37?温水的烧杯中,恒温10分钟后,观察两试管中植物油的变化。
请根据上述实验回答下列问题:
(1)想一想,为什么要将试管放置在37?条件下, (2)在实验中乙试管加入蒸馏水的目。
(3)通过模拟实验,你得出的结论。
1、根据右图回答问题:
(1)能够分泌胆汁的器官是, , 。
(2)胃是图中所指的, ,,通过 搅拌
食物,使食物与 充分混合。
(3)图中6的名称是 ,分泌的物质叫 。 (4)在消化系统中,具有蠕动功能的器官有 。 (5)哪种器官分泌的消化液中含有消化糖类、蛋白质和脂肪的酶: 。
2、根据图解回答问题:
(1)在血液循环的过程中,红细胞中的血红蛋白与氧结合是在 ,此时血液发生的变化是由 变成 。 红细胞中血红蛋白与氧分离的部位是在 ,此时血液发生的变化是由 变成 。
(2)与吸入气相比,人的呼出气中 减
少,二氧化碳增多。据图回答,消耗氧和产生
二氧化碳的部位是 。
(3)危重病人往往需要吸氧和点滴葡萄糖,
葡萄糖和氧气对病人的意义是:氧与葡萄糖进
入组织细胞的 后,通过 作
用,释放 ,供细胞生命活动的需要。
3、右图是人体泌尿系统的模式图,据图回答
问题:
(1)填写各部位名称:
B 、C 、D 、E 。
(2)M血管把血液送入肾脏中,N血管是把血液运
离肾脏,M内的血液成分和N内的血液成分相比较,N
血管内的血液 含量明显降低。
4、下面是某人的血常规化验单:
姓名:张×× 性别:男 年龄:41
检查结果 急 普通 检号
项目 测定值
RBC 3.59×1012/L
WBC 4.8×109/L
Hb 107g/L
9 PLT 140×10/L
(1)根据上面的数据,判断该人的各项数值是否正常,如果你是一名医生,你能得出什么结论,(2分)
(2)根据上面的数据,判断一下张××应该表现出的症状是什么,(2分)
(3)假设张××的PLT的值为60×109/L,而且他的皮肤上发现有许多暗红色的斑点,请说明该人皮肤上出现斑点的可能的原因。(2分)
5、下表是探究唾液对淀粉分解的试验,请作答:
试管编号 加入材料 水温(?) 恒温时间(分钟) 加碘液后的现象 1 馒头碎屑,唾液2mL 90 10 A 2 馒头,唾液2mL 37 10 B 3 馒头碎屑,唾液2mL 37 10 C 4 馒头碎屑,清水2mL 37 10 D
(1)以唾液为变量时,其互为对照的一组是 号试管和 号试管 (2)以牙齿的咀嚼、舌的搅拌为变量时其互为对照的一组是 号试管和 号试管 (3)一号试管的颜色变化是 的原因是 。 (4)四号试管的颜色变化是 的原因是 。 (5)在1,4号试管中分别加入实验材料后,为使实验现象更加明显,应采取的操作方法是_____________________________。
(6)如果在三号试管中直接加入馒头碎屑、唾液2mL和稀碘液,现象是 。
范文三:PCA_SVM模型在几丁质酶最适温度建模中的应用
( )第 29 卷 第 2 期 自 然 科 学 版 Vol . 29 No . 2 华 侨 大 学 学 报
2008 年 4 月 ( )Ap r . 2008 J o ur nal of H uaqiao U niver sit y Nat ural Science
() 文章编号 : 100025013 20080220236205
PCA2S VM 模型在几丁质酶最适温度
建模中的应用
林 毅 , 蔡福营 , 袁孙熹 , 张光亚
( )华侨大学 材料科学与工程学院 , 福建 泉州 362021
( ) 摘要 : 采用主 成 分 分 析 法 PCA 对 样 本 数 据 集 进 行 预 处 理 , 将 得 到 的 新 样 本 数 据 集 输 入 支 持 向 量 机
( ) ( ) SV M,籍助均匀设计 UD,构建几丁质酶氨基酸组成和最适温度的数学模型 . 当径向基核函数的 3 个参
εγ数 ,惩罚系数 C 为 10 ,为 0 . 5 ,为 5 时 ,模型对温度拟合的平均绝对百分比误差为 5 . 06 % ,预测的平均绝对 误
差为 1 . 83 ?,说明具有良好的预测效果且优于神经网络的预测结果 .
关键词 : 几丁质酶 ; 数学模型 ; 主成分分析 ; 支持向量机 ; 最适温度+ 中图分类号 : Q 556 . 2 ; Q 141 文献标识码 : A
( ) 几丁质酶 Chiti na se , EC3 . 2 . 1 . 14是能够催化水解 N2乙酰2D2葡萄糖胺糖苷键的酶. 在自然界 中 ,几丁质酶在碳和氮的循环中扮演着重要的角色 ,它存在于多种物种体内 ,包括人 、细菌 、真菌 、病毒 、 线虫 、昆虫 、鱼等. 几丁质酶在工业上有重要的应用 ,主要是降解壳聚糖为低聚物 ,此外 ,几丁质酶还有杀
[ 1 ] [ 2 ] 虫活性和抗菌作用. 工业应用的几丁质酶的最适温度为 30,70 ?,p H 值为 4,8 . 近年来 ,有两种 方法可获得耐碱 、耐热的几丁质酶. 一种方法是通过从极端环境中筛选几丁质酶产生菌株 ; 另一种方法
[ 3 ] [ 4 ] 是对几丁质酶进行遗传改造. 随着理性定向进化和非理性定向进化技术的发展 ,又提出了一种半理
[ 526 ] 性的定向进化技术. 本文利用几丁质酶的序列信息及最适温度 ,利用主成分分析的支持向量机 ,建立
了氨基酸组成和最适温度之间的数学模型 .
1 材料与方法
) (几丁质酶蛋白质序列数据 ,均来源于 N CB I 美国国立生物技术信息中心上的蛋白质数据库 . 26 个 几丁质酶 ID 号分别为 P32823 ,B A C53628 , A A K69033 , A A F23368 , A A O22144 , A A C23715 ,J C7996 , B A A34922 , A A K69033 , A A A98644 , A A K26395 , Q9 F RV1 , A A C09387 , 2DB TC , Q05638 , B A C99074 , B A A88833 , BA A88834 , B A C76622 , BA A88835 , A A Y99632 A A M93195 , A AL 01886 , A AL 46648 ,
[ 7 ] [ 8 ] [ 9210 ] A A G12973 ,B A A36460 . Na ka shi ma, Klei n和 Cho u 等研究表明 , 蛋白质的折叠信息与氨基酸 组成有明显的关联性 1 鉴于几丁质酶的相对分子量差别很大 ,所以用几丁质酶的 20 种氨基酸组成和氨 基酸残基数作为输入数据 ,对应的最适温度为支持向量机的输出数据 ,则几丁质酶蛋白序列的特征向量
可表示为
v T( )X = [ x| x, x, , x, x] 11 i 1 2 20 21
v 上式中 , X 表示蛋白质序列的特征值 , x为蛋白质序列中氨基酸的特征向量 , x 为第 T 个蛋白质序列i i
) ( 第 i i = 1 , , 20种氨基酸出现的频率数 , x为蛋白质序列氨基酸的个数 , T 表示蛋白质序列的个数 , 21
特征向量中元素的顺序按照 20 种氨基酸的字母顺序排列. 所有几丁质酶的氨基酸组成分析由 Bioe dit
软件完成 , 主 成 分 分 析 由 SPSS10 . 0 完 成 , 支 持 向 量 机 是 由 Tho r st e n J oachi ms 用 C 语 言 编 写 的.
207206 2007收稿日期 : () 林 毅 19762,男 ,副教授 ,主要从事应用与环境微生物的研究 . E2mail :lyhxm @hqu. edu. cn. 国家自然科 作者简介 :() () 学基金资助项目 40601046; 福建省高等学校新世纪优秀人才计划支持项目 2006; 福建省 自然科学基 基金项目 :()金资助项目 B0510011
2 结果与分析
2 . 1 氨基酸组成的主成分分析
( ) 原始数据经主成分分析 PCA 后得到的特征值及累计方差贡献率 ,如表 1 所示. 表中 , P为主成 c
φφα分 , E为特征值 ,为贡献率 ,为累计贡献率. 分析表 1 中的数据 ,选择显著水平= 95 % ,只挑选前v VA cu
表 1 主成分特征值及累计方差贡献率
Ta b. 1 Princip al co mpo nent a nd t heir explaining va ria nce s
φφφφPE/ % / %PE/ % / %c v VA cu c v VA cu 1 5 . 21 24 . 79 24 . 79 12 0 . 30 1 . 42 97 . 31 2 4 . 19 19 . 97 44 . 76 13 0 . 18 0 . 83 98 . 14 3 2 . 84 13 . 51 58 . 27 14 0 . 14 0 . 67 98 . 81 4 2 . 19 10 . 45 68 . 71 15 0 . 08 0 . 38 99 . 19 5 1 . 50 7 . 14 75 . 85 16 0 . 06 0 . 27 99 . 46 6 1 . 07 5 . 12 80 . 96 17 0 . 05 0 . 25 99 . 72 7 0 . 92 4 . 40 85 . 36 18 0 . 03 0 . 16 99 . 87 8 0 . 80 3 . 80 89 . 16 19 0 . 02 0 . 10 99 . 98 9 0 . 60 2 . 86 92 . 01 20 0 . 01 0 . 02 100 . 00 10 0 . 434 2 . 07 94 . 08 21 0 . 00 0 . 00 100 . 00 11 0 . 38 1 . 80 95 . 88
(11 个主成分即可代表原始数据中蕴涵的绝大部分信息. 11 个主成分和原 21 个变量之间的关系 限于篇
) 幅 ,仅写出前 3 个主成分为
P = 0 . 200 A + 0 . 063 C + 0 . 116 D + 0 . 146 E - 0 . 212 F - 0 . 004 G + 0 . 267 H - c , 1
0 . 319 I - 0 . 271 K - 0 . 059 L - 0 . 225 M - 0 . 327 N + 0 . 311 P + 0 . 034 Q +
0 . 344 R - 0 . 265 S + 0 . 204 T + 0 . 194V + 0 . 150 W - 0 . 236 Y + 0 . 159 n
= - 0 . 326 A - 0 . 333 C + 0 . 386 D + 0 . 363 E - 0 . 0342 F - 0 . 289 G + 0 . 117 H + P c , 2
0 . 115 I + 0 . 302 K + 0 . 128 L - 0 . 012 M - 0 . 035 N + 0 . 053 P - 0 . 317 Q +
0 . 043 R - 0 . 143 S - 0 . 133 T + 0 . 101V + 0 . 044 W + 0 . 186 Y + 0 . 301 n
= - 0 . 014 A - 0 . 038 C + 0 . 162 D + 0 . 114 E - 0 . 363 F + 0 . 029 G - 0 . 351 H - Pc , 3
0 . 060 I - 0 . 030 K - 0 . 341 L + 0 . 045 M + 0 . 100 N - 0 . 269 P + 0 . 249 Q -
0 . 312 R - 0 . 008 S + 0 . 369 T + 0 . 350V + 0 . 019 W + 0 . 105 Y + 0 . 260 n. 上式中 , n 表示几丁质酶含有的氨基酸个数向量 .
各氨基酸与 11 个主成分之间的关系 , 如表 2 所示 1 为简单起见 , 表 2 中氨基酸正负相关系数保留 1
表 2 几丁质酶氨基酸与各主成分的关系
Tab. 2 Mea ning of p rinciple co mpo nent s i n chitina se
正相关氨基酸 负相关氨基酸 P0 . 2 A 0 . 3 H 0 . 3 P 0 . 3 R 0 . 2 T 0 . 2V 0 . 2 F 0 . 3 I 0 . 3 K 0 . 2 M 0 . 3 N 0 . 3 S 0 . 2 Y c , 1
Pc , 2 0 . 4 D 0 . 4 E 0 . 3 K 0 . 2 Y 0 . 3 A 0 . 3 C 0 . 3 G 0 . 3 Q P0 . 4 F 0 . 4 H 0 . 3 L 0 . 3 P 0 . 3 R 0 . 2 D 0 . 2 Q 0 . 4 T 0 . 4V c , 3
P0 . 3 C 0 . 3 E 0 . 2 G 0 . 2 K 0 . 2 N 0 . 5 W 0 . 2 Y c , 4 0 . 2 A 0 . 3 I 0 . 4 L 0 . 2 M 0 . 2V P0 . 2 A 0 . 3 F 0 . 3 N 0 . 2V c , 5 0 . 2 D 0 . 6 G 0 . 5 M
P0 . 2 I 0 . 3 M 0 . 2 T 0 . 4 Y c , 6 0 . 3 L 0 . 6 S 0 . 2 W
P0 . 4 C 0 . 4 F 0 . 2 I 0 . 4V c , 7 0 . 3 A 0 . 2 H 0 . 3 L 0 . 3 N 0 . 2 W 0 . 2 Y P0 . 3 I 0 . 3 N 0 . 3 P 0 . 5 Q 0 . 2 W 0 . 2 A 0 . 2 D 0 . 2 S 0 . 4 T 0 . 2 Y c , 8
P0 . 2 C 0 . 2 G 0 . 2 H 0 . 2 N 0 . 2 P 0 . 2 S 0 . 3 Y c , 9 0 . 3 A 0 . 2 M 0 . 2V 0 . 6 W Pc , 10 0 . 3 C 0 . 4 H 0 . 3 L 0 . 3 T 0 . 4 A 0 . 2 G 0 . 5 P
P0 . 2 A 0 . 2 C 0 . 4 Q 0 . 2 H 0 . 2 M 0 . 3 Q 0 . 2V 0 . 2 Y 0 . 2 G 0 . 4 I 0 . 6 T c , 11
( ) 位小数 ,且仅列出相关系数绝对值大于等于 0 . 2 的氨基酸. 与蛋白质结构数据库 M M PD中所报道的
为无规卷曲 、转角 、折叠 、转角 、转角 、螺旋和折叠 . 这与几丁质酶结构特征基本吻合 ,但略有差异 ,可能与
所选择的样本有关.
2 . 2 支持向量机模型结构的优化
[ 11213 ] 由于支持向量机的核函数及其参数的选取 ,对分类结果有一定的影响. 选取多项式和 Si gmoid二核函数 , 通过计算发现 ,运算不是速度慢就是发散 , 因而不对其进行详细研究. 对于径向基核函数 ,
εγ 有 3 个参数 ,分别为惩罚系数 C ,和,常规的参数选取方法是“一对多”策略 ,就是先确定一个值 ,令这 个
子值不变再确定另外一个值 ,最后找出一组最优的参数 ,不过这样的方法很笨拙 ,而且也体现不出各因 之间的交互影响 . 本文设计的 3 因素 15 水平均匀设计表来优化参数 ,如表 3 所示 . 表 3 中 , e, e, RMS MA P e分别为平均绝对百分比误差 ,均方极误差 ,平均绝对误差 , N 为运算次数.MA
表 3 均匀设计表
Tab. 3 U nifo r m de sign
εeee N C γ RMS MA P MA
5 . 00 1 10 . 00 0 . 50 0 . 05 1 . 80 4 . 35
2 0 . 10 0 . 80 1 . 00 0 . 06 2 . 58 5 . 93
3 0 . 005 0 . 40 0 . 09 0 . 11 4 . 74 9 . 23
4 1 . 00 0 . 10 0 . 50 0 . 07 3 . 00 6 . 89
0 . 10 5 50 000 . 00 0 . 20 0 . 11 4 . 53 9 . 05
6 0 . 01 0 . 01 0 . 90 0 . 06 2 . 66 6 . 08
7 100 . 00 0 . 000 01 0 . 30 0 . 07 3 . 22 7 . 46
8 10 000 . 00 0 . 05 0 . 01 0 . 20 8 . 61 11 . 75
9 50 . 00 0 . 15 0 . 001 0 . 23 9 . 94 12 . 34
0 . 005 10 0 . 50 0 . 60 0 . 22 9 . 26 11 . 94
11 0 . 05 0 . 000 1 0 . 03 0 . 17 6 . 97 10 . 91
12 5 . 00 0 . 005 0 . 07 0 . 13 5 . 26 9 . 67
13 500 . 00 1 . 00 0 . 05 0 . 14 5 . 99 10 . 23
14 5 000 . 00 0 . 70 0 . 10 0 . 11 4 . 53 9 . 05
15 1000 . 00 0 . 001 1 . 50 0 . 06 2 . 30 5 . 34
εγ计算结果显示 ,当 C 值为 10 ,为 0 . 5 ,值为 5 时 ,对温度
预测的平均绝对百分比误差为 5 % ,均方根误差为 1 . 8 ,平均绝
( ) 对误差为 4 . 35 ,具有比神经网络更好的拟合效果 图 1. 后续
( εγ) 训练及测试均采用上述参数 C = 10 ,= 0 . 5 ,= 5.
2 . 3 主成分分析 - 支持向量机模型预测
对支持向量机而言 ,由于训练样本集的大小有限 ,训练后
对训练集外输入的响应如何 ,直接决定了支持向量机的性能 . 对预测结果的评价基于两种较为客观和严格的检验方法 , 一 图 1 结构优化后支持向量机的拟合值 种是 J ack k nif e 检验 , 另一种为 k2fol d cro ss2vali datio n 检验 ,
Fig. 1 The fit ting temperat ure of suppo rt 在 J ac k k nif e 检验方法中 ,每一种蛋白质依次从数据库中取出 vecto r machine being op timized 作为测试蛋白 ,而剩余的蛋白质作为训练集 ; 在 k2fol d cro ss2
( ) vali datio n k2CV检验方法中 ,随机将数据库分为 k 个子集 , 依次取出一个子集作为测试集 , 而其余的 k - 1 个子集作为训练集 , 此过程循环 k 次 . 由于数据量较少 ,为了提高检验的灵敏度 ,采用 J ac k k nif e 检 验方法 ,每次从 26 组数据中取出 25 个序列作为训练数据 ,留出一个作检测 ,依次循环 ,共进行 26 次循
() ( ) ( ) 环测试. B P 神经网络 B PN N、支持向量机 SV M和主成分分析2支持向量机 PCA2SV M的测试结果 , 如表 4 所示 . n 为循环次数 . 由于篇幅所限 ,只列出 5 组较好的结果和 5 组较差的结果 . 从表 4 中可以看 出 ,主成分分析2支持向量机模型的拟合值总体上要好于预测值 ,训练和测试的平均绝对百分比误差分 别为 0 . 05 和 0 . 24 ,训练和测试的平均绝对误差为 1 . 83 和 9 . 94 . 没有经主成分分析优化过的支持向量 机模型 ,其训练和测试的平均绝对百分比误差分别为 0 . 06 和 0 . 26 ,训练和测试的平均绝对百分比误差
分别为 2 . 61 和 10 . 76 . 显然 ,主成分分析在支持向量机模型的数据优化中起了重要的作用 .
表 4 3 种模型的测试结果
Ta b. 4 Re sult s of t he cro ss2validatio ns of t hree mo del s
ee MA PMAn 方式 B PN N SV M PCA2SV M B PN N SV M PCA2SV M
训练值 0 . 06 0 . 06 0 . 05 2 . 66 2 . 59 1 . 82 1 测试值 0 . 01 0 . 07 0 . 05 0 . 59 3 . 39 2 . 72 训练值 0 . 08 0 . 06 0 . 05 3 . 68 2 . 46 1 . 68 测试值 2 0 . 51 0 . 58 0 . 60 15 . 44 17 . 51 18 . 06 训练值 测试值 0 . 07 0 . 05 0 . 05 3 . 02 1 . 89 1 . 79 7 0 . 54 0 . 31 0 . 31 34 . 78 20 . 10 20 . 04 训练值 测试值 0 . 08 0 . 07 0 . 05 3 . 23 2 . 67 1 . 91 9 训练值 0 . 46 0 . 34 0 . 04 16 . 06 11 . 74 1 . 25 测试值 0 . 06 0 . 05 0 . 03 2 . 45 2 . 73 1 . 53 10 训练值 2 . 17 1 . 35 1 . 40 43 . 43 27 . 02 27 . 91 测试值 0 . 07 0 . 06 0 . 05 2 . 75 2 . 68 1 . 96 训练值 20 0 . 08 0 . 23 0 . 22 4 . 66 13 . 97 13 . 35 测试值
训练值 0 . 08 0 . 06 0 . 05 3 . 14 2 . 65 1 . 90 21 测试值 0 . 01 0 . 16 0 . 15 0 . 42 8 . 72 8 . 05 训练值 0 . 06 0 . 06 0 . 05 2 . 39 2 . 53 1 . 82 测试值 22 0 . 47 0 . 18 0 . 20 18 . 99 7 . 23 7 . 82 训练值 0 . 07 0 . 06 0 . 05 2 . 92 2 . 55 1 . 84 测试值 25 0 . 47 0 . 36 0 . 37 16 . 33 12 . 52 13 . 05 训练值 0 . 06 0 . 06 0 . 05 2 . 42 2 . 68 1 . 96 测试值 26 0 . 15 0 . 23 0 . 22 8 . 91 13 . 97 13 . 35
0 . 07 0 . 06 0 . 05 3 . 00 2 . 61 1 . 83 平均值 0 . 36 0 . 26 0 . 24 14 . 60 10 . 76 9 . 94 2 . 4 3 种预测模型的比较
参考文 [ 14 ]的研究结果 ,选择 1 个隐含层的神经网
络 ,B P 神经网络的训练误差仍设为 0 . 01 ,其运算次数为
1 000 ,用均匀设计方法优化 B P 神经网络的 4 个参数 :
学习速率 、动态参数 、Si gmoi d 参数和隐含层结点数 . 当
4 个参数分别为 0 . 09 ,0 . 4 ,0 . 98 和 10 时 ,B P 神经网络
具有最佳的 拟合 结果 . 后 续训 练 及测 试 均 采 用 上 述 参
数 . 同样 ,用 J ac k k nif e 检验方法来检验 B P 神经网络的
测试结果 ,测试结果如表 4 所示. 其 26 个样本的训练和 测试的平均绝对百分比误差的平均值为 0 . 07 和 0 . 36 , 图 2 3 种模型的比较 而支持向量机训练和测试的平均绝对百分比误差的平 Fig. 2 The co mp ari so n bet ween mo del 均值为 0 . 06 和 0 . 26 ,都比主成分分析2支持向量机模型
的结果略差些 ,如图 2 所示 . 26 个测试样本预测结果的平均绝对误差为 14 . 6 ,高于支持向量机模型的
10 . 76 ,更高于主成分分析2支持向量机的预测结果 9 . 94 .
从图 2 可以看出 ,用 B P 神经网络预测几丁质酶最适温度 ,结果比较差 ,其预测结果不稳定 ;而支持 向量机模型的出的结果要好的多 ,其预测结果浮动较小 ,且大部分预测值接近于真实的实验值. 经过主
成分分析处优化输入数据后的支持向量机 ,其预测值明显比没用主成分分析优化数据的支持向量机模
型更接近实验值. 这大大提高了模型的运算速度和测试精度 .
3 结束语
本文利用主成分分析法对样本集进行预处理 ,利用均匀设计对其拓扑结构进行了优化 ,大大提高了 支持向量机的学习速率和性能 . 利用几丁质酶的晶体数据 ,结合多序列比对等手段 ,可寻找出有利和不 利于提高该酶最适温度的可能位点 ,然后有目的地利用仿真软件进行随机突变. 利用基于本文所得数学 模型的计算机软件进行虚拟筛选 ,可减轻筛选工作量 ,提高效率 . 尽管本文采用了均匀设计的方法对支
持向量机的检测效果还会有所改善 . 由于本文仅考虑了 20 种氨基酸的频率分布和氨基酸的个数 ,排除 了其他影响因素 ,这是一种最简单的情形 . 同时 ,样本中噪声的影响也不可忽视 ,对于进一步提高该模型 质量的相关研究仍需要逐步深入 ,所得结果仍需要实验进一步验证.
参考文献 :
[ 1 ] BU SSIV K A P , V A N EIJ K M . The Biolo gy of t he ga ucher cell : The cradle of huma n chitina se [ J ] . A Survey of
() Cell Biolo gy ,2006 ,23 2:712128 .
() 蒋红彬 ,蒋千里 . 几丁质酶的研究概况 [J ] . 山东科学 ,2000 ,13 3:41245 . [ 2 ]
C HA N G Mi ng2Chun , L A I Pe2L in , WU Mei2L i . Biochemical characterizatio n a nd site2directed mutatio nal a nalysi s [ 3 ]
of t he do uble chitin2binding do main f ro m chitina se 92 of A e rom on as h y d ro p hi l a J P101 [J ] . F EM S Micro biolo gy L et2
() ter s , 2004 ,232 5:1261 .
ALL EN S. Enzyme f unctio nalit y :De sign ,engineering , and screening [ M ] . New Yo r k : Marcel Dekker ,2004 :12712 . M [ 4 ]
() IL DV A N A S. Inver se t hinking a bo ut do uble muta nt s of enzyme s [J ] . Biochemi st r y ,2004 ,43 2:14517214520 . ROB [ 5 ]
ER T J H , J O R G B , MA R IE L A . Co mbining co mp ut atio nal a nd experimental screeni ng fo r rapid op timizatio n of p [ 6 ]
() ro tein p rop erties [J ] . Proc Natl Acad Sci , 2002 ,99 3: 15926215931 .
N A KA S H IMA H , N IS H I KA WA K , OO I T. The folding t yp e of a p ro tein i s releva nt to t he amino acid co mpo si2 [ 7 ]
() tio n [J ] . J Biochem , 1986 , 99 1: 1532162 .
() KL EIN P. Predictio n of p ro tein st r uct ural cla ss by di scriminate a nalysi s [J ] . Biochem Biop hys Acta , 1986 , 874 2: [ 8 ]
2052275 .
() C HO U K C , MA GGIO RA G M . Do mai n st r uct ure p redictio n[J ] . Pro t ein Eng , 1998 , 11 7: 5232538 . [ 9 ]
C HO U K C. A key driving fo rce in deter minatio n of p ro tein st r uct ural cla sse s [J ] . Biochem Biop hys Res Co mmun , [ 10 ]
() 1999 , 264 1: 2162224 .
V A PN I K V . Stati stical lea r ning t heo r y[ M ] . New Yo r k : Wiely , 1998 :12736 . [ 11 ]
() CO R T ES C , V A PN I K V . Suppo rt vecto r machine net wo r k s [J ] . Machi ne L ea r ning ,1995 ,20 4:2732297 . [ 12 ]
FA N G K T. The unifo r m design applicatio n of number t heo retic met ho ds in exp erimental design [ J ] . Acta Mat h [ 13 ]
() Appl Sin , 1980 , 66 3: 3632372 .
() 张光亚 ,方柏山 . 木聚糖酶氨基酸组成与其最适 p H 的神经网络模型 [J ] . 生物工程学报 ,2005 ,21 4:6582661 . [ 14 ]
A Un if orm Design Ba sed PCA2SVM Model f or Predict ing
Opt imum Temperature in Chit ina se
L IN Yi , CA I Fu2yi ng , YU A N Yu2xi , Z H A N G Gua ng2ya
( )College of Mat erial Science and Engi neeri ng , Huaqiao U niver sit y , Q ua nzho u 362021 , Chi na Abstract : The p ri ncip al co mpo nent a nalysi s wa s applied to t he data p roce ssing in t raining set s , t he new p rincipal co mpo2 nent s were t hen used a s inp ut dat a of suppo rt vecto r machine mo dle. A p redictio n mo del fo r op timum temp erat ure of chiti2
εγna se wa s esta bli shed ba sed o n unifo r m de sign. When t he regula rized co nst ant C , a nd were 10 , 0 . 5 a nd 5 , re sp ective2 ly , t he calculated temperat ure fit ted t he repo rted op timum temperat ure of chitina se ver y well and t he mean a bsol ute per2 cent
( ) er ro r MA P Eswa s 5 . 06 %. At t he sa me time , t he p redicted temperat ure fit t ed t he repo rted op timum temperat ure
( ) well a nd t he mea n a bsol ute er ro r MA Ewa s 1 . 83 ?. It wa s superio r in fit tings and p redictio ns co mpa red to t he mo delba sed o n back p rop agatio n neural net wo r k .
Key words : p rinciple co mpo nent a nalysi s ; suppo rt vecto r machine ; chitina se ; op ti mum temperat ure
()责任编辑 : 黄仲一 英文审校 : 陈国华
范文四:PCA-SVM模型在几丁质酶最适温度建模中的应用
PCA-SVM模型在几丁质酶最适温度建模中
的应用
第29卷第2期
2008年4月
华侨大学(自然科学版)
JournalofHuaqiaoUniversity(NaturalScience)
VoI.29No.2
Apr.2008
文章编号:1000—5013(2008)02—0236—05
PCA-SVM模型在几丁质酶最适温度
建模中的应用
林毅,蔡福营,袁宇熹,张光亚
(华侨大学材料科学与工程学院,福建泉州362021)
摘要:采用主成分分析法(PCA)对样本数据集进行预处理,将得到的新样本数据集输入支持向量机
(SVM),籍助均匀设计(UD),构建几丁质酶氨基酸组成和最适温度的数学模型.当径向基核函数的3个参
数,惩罚系数C为10,,为0.5,y为5时,模型对温度拟合的平均绝对百分比误差为5.06,预测的平均绝对
误差为1.83?,说明具有良好的预测效果且优于神经网络的预测结果. 关键词:几丁质酶,数学模型;主成分分析;支持向量机;最适温度
中图分类号:Q556.2;Q141文献标识码:A
几丁质酶(Chitinase,EC3.2.1.14)是能够催化水解N一乙酰一D一葡萄糖胺糖苷键的酶.在自然界
中,几丁质酶在碳和氮的循环中扮演着重要的角色,它存在于多种物种体内,包括人,细菌,真菌,病毒,
线虫,昆虫,鱼等.几丁质酶在工业上有重要的应用,主要是降解壳聚糖为低聚物,此
外,几丁质酶还有杀
虫活性和抗菌作用….工业应用的几丁质酶的最适温度为30~70?,pH值为4,8[2].近年来,有两种
方法可获得耐碱,耐热的几丁质酶.一种方法是通过从极端环境中筛选几丁质酶产生菌株;另一种方法
是对几丁质酶进行遗传改造.随着理性定向进化[3]和非理性定向进化技术]的发展,又提出了一种半理
性的定向进化[5剞技术.本文利用几丁质酶的序列信息及最适温度,利用主成分分析的支持向量机,建立
了氨基酸组成和最适温度之间的数学模型.
1材料与方法
几丁质酶蛋白质序列数据,均来源于NCBI(美国国立生物技术信息中心)上的蛋白质数据库.26个
几丁质酶ID号分别为
P32823,BAC53628,AAK69033,AAF23368,AAO22144,AAC23715,JC7996,
BAA34922,AAK69033,AAA98644,AAK26395,Q9FRV1,AACO9387,2DBTC,Qo56
38,BAC99074,
BAA88833,BAA88834,BAC76622,BAA88835,AAY99632AAM93195,AAL01886,A
AL46648,
AAG12973,BAA36460.Nakashima[,KleinE和Chou等研究表明,蛋白质的折叠信息与氨基酸
组成有明显的关联性.鉴于几丁质酶的相对分子量差别很大,所以用几丁质酶的2O种氨基酸组成和氨
基酸残基数作为输入数据,对应的最适温度为支持向量机的输出数据,则几丁质酶蛋白序列的特征向量
可表示为
X一[Iz1,zz,…,z2o,z21]丁.(1)
上式中,X表示蛋白质序列的特征值,为蛋白质序列中氨基酸的特征向量,z为第T个蛋白质序列
第i(一1,…,20)种氨基酸出现的频率数,z为蛋白质序列氨基酸的个数,T表示蛋白质序列的个数,
特征向量中元素的顺序按照2O种氨基酸的字母顺序排列.所有几丁质酶的氨基酸组成分析由Bioedit
软件完成,主成分分析由SPSS10.0完成,支持向量机是由ThorstenJoachims用C语言编写的.
收稿日期:2007—07—06
作者简介:林毅(1976一),男,副教授,主要从事应用与环境微生物的研究.E-mail:lyhxm@hqu.edu.cn.
基金项目:国家自然科学基金资助项目(40601046);福建省高等学校新世纪优秀人才计划支持项目(2006),福建省
自然科学基金资助项目(B0510011)
第2期林毅,等:PCA—SVM模型在几丁质酶最适温度建模中的应用237 2结果与分析
2.1氨基酸组成的主成分分析
原始数据经主成分分析(PCA)后得到的特征值及累计方差贡献率,如表1所示.表中,P为主成
分,E为特征值,为贡献率,为累计贡献率.分析表1中的数据,选择显着水平a一95%,只挑选前
表1主成分特征值及累计方差贡献率
Tab.1Principalcomponentandtheirexplainingvariances
PcE9v^f%'p/%P9v^//
15.2124.7924.79120.3O1.4297.31 24.1919.9744.76130.180.8398.14 32.8413.5158.27140.140.6798.81 42.1910.4568.71150.080.3899.19 51.507.1475.85160.060.2799.46 61.075.1280.96170.050.2599.72 70.924.4085.36180.030.1699.87
80.8O3.8O89.16190.020.1099.98
90.6O2.8692.01200.010.02100.O0
100.4342.0794.08210.O00.O0100.O0
110.381.8O95.88
11个主成分即可代表原始数据中蕴涵的绝大部分信息.11个主成分和原21个变量之间的关系(限于篇
幅,仅写出前3个主成分)为
Pc.1—0.2OOA+o.063C+0.116D+0.146E一0.212F一0.004G+0.267H一
0.319I一0.271K一0.059L一0.225M一0.327N+0.311P+0.034Q+ 0.344R一0.265S+0.204T+0.194V+0.150W一0.236Y+0.159n
Pc_2一一0.326A一0.333C+0.386D十0.363E一0.0342F一0.289G+0.117H+ 0.115J+0.302K+0.128L一0.012M一0.035N+0.053P一0.317Q十
0.043R一0.143S一0.133T+0.101V+0.044W+0.186y+0.301n Pm一一0.014A一0.038C+0.162D十0.114E一0.363F+0.029G一0.351H一
0.060I一0.030K一0.341L+0.045M+0.100N一0.269P+0.249Q一
0.312R一0.008S+0.369T+0.350V+0.019W+0.105Y+0.260n. 上式中,i'1表示几丁质酶含有的氨基酸个数向量.
各氨基酸与11个主成分之间的关系,如表2所示.为简单起见,表2中氨基酸正负相关系数保留1
表2几丁质酶氨基酸与各主成分的关系
Tab.2Meaningofprinciplecomponentsinchitinase 正相关氨基酸负相关氨基酸
O.2AO.3HO.3PO.3RO.2TO.2VO.2FO.3jO.3KO.2MO.3NO.3SO.2y
O.4DO.4EO.3KO.2yO.3A0.3CO.3G0.3Q
O.2D0.2Q0.4T0.4V0.4FO.4H0.3L0.3PO.3R O.3CO.3E0.2G0.2K0.2N0.5W0.2Y0.2AO.3jO.4LO.2M0.2V O.2DO.6GO.5MO.2AO.3FO.3NO.2V
O.3LO.6SO.2WO.2jO.3MO.2TO.4y
O.4CO.4FO.2j0.4V0.3A0.2H0.3L0.3N0.2W0.2Y O.3f0.3N0.3P0.5Q0.2W0.2A0.2DO.2SO.4TO.2y
0.2C0.2G0.2H0.2N0.2P0.2S0.3Y0.3A0.2M0.2V0.6W
O.3CO.4H0.3L0.3T0.4A0.2G0.5P 0.2A0.2C0.4Q0.2H0.2M0.3Q0.2VO.2y0.2G0.410.6丁
位小数,且仅列出相关系数绝对值大于等于0.2的氨基酸.与蛋白质结构数据库(MMPD)中所报道的
几丁质酶蛋白质三级进行了比较,发现主成分分析的前7个主成分所代表的几丁质酶的二级结构,分别
I234S6789?
238华侨大学(自然科学版)
为无规卷曲,转角,折叠,转角,转角,螺旋和折叠.这与几丁质酶结构特征基本吻合,但略有差异,可能与
所选择的样本有关.
2.2支持向量机模型结构的优化
由于支持向量机的核函数及其参数的选取,对分类结果有一定的影响11-13].选取多项式和Sigmoid
二核函数,通过计算发现,运算不是速度慢就是发散,因而不对其进行详细研究.对于径向基核函数,
有3个参数,分别为惩罚系数C,e和y,常规的参数选取方法是"一对多"策略,就是先确定一个值,令这
个值不变再确定另外一个值,最后找出一组最优的参数,不过这样的方法很笨拙,而且也体现不出各因
子之间的交互影响.本文设计的3因素15水平均匀设计表来优化参数,如表3所示.表3中,eM,e,
e分别为平均绝对百分比误差,均方极误差,平均绝对误差,N为运算次数. 表3均匀设计表
Tab.3Uniformdesign
NCeRMS
0.05
0.O6
0.11
0.07
0.11
0.06
0.07
0.20
0.23
0.22
0.17
0.13
0.14
0.11
0.06
1O.OO 0.10
O.OO5 1.OO
50000.00 0.01
1OO.OO l0000.OO 5O.OO O.5O
0.05
5.OO
5OO.OO 5000.OO 1000.00 计算结果显示,当C值为10,,为0.5,),值为5时,对温度
预测的平均绝对百分比误差为5,均方根误差为1.8,平均绝
对误差为4.35,具有比神经网络更好的拟合效果(图1).后续
训练及测试均采用上述参数(C一10,,:0.5,y一5).
2.3主成分分析一支持向量机模型预测
对支持向量机而言,由于训练样本集的大小有限,训练后
对训练集外输入的响应如何,直接决定了支持向量机的性能.
对预测结果的评价基于两种较为客观和严格的检验方法,一
种是Jackknife检验,另一种为志一foldcross—validation检验, 在Jackknife检验方法中,每一种蛋白质依次从数据库中取出
作为测试蛋白,而剩余的蛋白质作为训练集;在志一foldcross一 图1结构优化后支持向量机的拟合值
Fig.1Thefittingtemperatureofsupport vectormachinebeingoptimized validation(忌一CV)检验方法中,随机将数据库分为k个子集,依次取出一个子集作为测试集,而其余的
k一1个子集作为训练集,此过程循环k次.由于数据量较少,为了提高检验的灵敏度,采用Jackknife检
验方法,每次从26组数据中取出25个序列作为训练数据,留出一个作检测,依次循环,共进行26次循
环测试.BP神经网络(BPNN),支持向量机(SVM)和主成分分析一支持向量机(PCA—SVM)的测试结果,
如表4所示.为循环次数.由于篇幅所限,只列出5组较好的结果和5组较差的结果.从表4中可以看
出,主成分分析一支持向量机模型的拟合值总体上要好于预测值,训练和测试的平均绝对百分比误差分
别为0.05和0.24,训练和测试的平均绝对误差为1.83和9.94.没有经主成分分析优化过的支持向量
机模型,其训练和测试的平均绝对百分比误差分别为0.06和0.26,训练和测试的平均绝对百分比误差
分别为2.61和10.76.显然,主成分分析在支持向量机模型的数据优化中起了重要
的作用.
%叭盯
一LL
跚鼹?鹃%?鹃?
一L钆&
,
一??????叭???? 一5lOOOOOOOOOOOOl
—OO5l一?舳?加叭??????一L
l23456789uM
第2期林毅,等:PCA—SVM模型在几丁质酶最适温度建模中的应用239
1
9
9
1O
2O
21
22
25
26
平均值
训练值
测试值
训练值
测试值
训练值
测试值
训练值
测试值
训练值
测试值
训练值
测试值
训练值
测试值
训练值
测试值
训练值
测试值
训练值
测试值
训练值
测试值
O.O6 0.01 O.O8 0.51 0.07 0.54 O.O8 0.46 0.06 2.17 O.O7 0.O8 0.O8 O.O1
0.06 0.47 0.07 0.47 O.O6 0.15 O.O7 O.36 O.O6 0.07 O.O6 0.58 0.05 0.31 O.O7 0.34 O.O5 1.35 0.06 O.23 0.06 0.16 O.O6 0.18 0.06 0.36 O.O6 0.23 0.06 O.26
O.O5 0.05 0.O5 0.60 0.05 0.31 0.05 0.04 O.O3 1.4O O.O5 0.22 0.05 O.15 0.05 0.2O 0.05 0.37 O.O5 0.22 0.05 O.24 2.66 0.59 3.68 15.44 3.O2 34.78 3.23 16.06
2.45 43.43 2.75 4.66 3.14 0.42 2.39 18.99 2.92 16.33 2.42 8.91 3.00 14.6O 2.59 3.39 2.46 17.51 1.89 20.1O 2.67 11.74 2.73 27.O2 2.68 13.97 2.65 8.72 2.53 7.23
2.55 12.52 2.68 13.97 2.61 1O.76 1.82 2.72 1.68 18.06 1.79 20.O4 1.91 1.25 1.53 27.91 1.96 13.35 1.9O 8.05 1.82 7.82 1.84 13.05 1.96 13.35 1.83 9.94 2.43种预测模型的比较
参考文[14]的研究结果,选择1个隐含层的神经网
络,BP神经网络的训练误差仍设为0.01,其运算次数为
1000,用均匀设计方法优化BP神经网络的4个参数:
学习速率,动态参数,Sigmoid参数和隐含层结点数.当
4个参数分别为0.09,0.4,0.98和1O时,BP神经网络
具有最佳的拟合结果.后续训练及测试均采用上述参
数.同样,用Jackknife检验方法来检验BP神经网络的
测试结果,测试结果如表4所示.其26个样本的训练和
测试的平均绝对百分比误差的平均值为0.07和0.36,
而支持向量机训练和测试的平均绝对百分比误差的平
均值为0.06和0.26,都比主成分分析一支持向量机模型
图23种模型的比较
Fig.2Thecomparisonbetweenmodel 的结果略差些,如图2所示.26个测试样本预测结果的平均绝对误差为14.6,高于支持向量机模型的
1O.76,更高于主成分分析一支持向量机的预测结果9.94. 从图2可以看出,用BP神经网络预测几丁质酶最适温度,结果比较差,其预测结果不稳定;而支持
向量机模型的出的结果要好的多,其预测结果浮动较小,且大部分预测值接近于真实的实验值.经过主
成分分析处优化输入数据后的支持向量机,其预测值明显比没用主成分分析优化数据的支持向量机模
型更接近实验值.这大大提高了模型的运算速度和测试精度.
3结束语
本文利用主成分分析法对样本集进行预处理,利用均匀设计对其拓扑结构进行了优化,大大提高了
支持向量机的学习速率和性能.利用几丁质酶的晶体数据,结合多序列比对等手段,可寻找出有利和不
利于提高该酶最适温度的可能位点,然后有目的地利用仿真软件进行随机突变.利
用基于本文所得数学
模型的计算机软件进行虚拟筛选,可减轻筛选工作量,提高效率.尽管本文采用了均匀设计的方法对支
持向量机的结构进行了优化,但在各因素水平的选择上仍带有一定的随意性,如果经过精心的选择,支
240华侨大学(自然科学版)2008钲
持向量机的检测效果还会有所改善.由于本文仅考虑了20种氨基酸的频率分布和氨基酸的个数,排除
了其他影响因素,这是一种最简单的情形.同时,样本中噪声的影响也不可忽视,对于进一步提高该模型
质量的相关研究仍需要逐步深入,所得结果仍需要实验进一步验证. 参考文献:
[1]BUSSIVKAP,VANEUKM.TheBiologyofthegauchercell:Thecradleofhumanchitinas
e[J].ASurveyof
CellBiology,2006,23(2):71—128.
[2]
[3]
[4]
[5]
[63
[73
[8]
[93
[103
[
[
[
1]
2]
3]
[143
蒋红彬,蒋千里.几丁质酶的研究概况[J].山东科学,2000,13(3):41—45.
CHANGMing—Chun,LAIPe—Lin,WUMei—Li.Biochemicalcharacterizationandsite
—directedmutationalanalysis
ofthedoublechitin-bindingdomainfromchitinase92ofAeromonashydrophilaJP101[J].FEMSMicrobiologyLet
ters,2004,232(5):1-61.
ALLENS.Enzymefunctionality:Design,engineering,andscreening[M].NewYork:MarcelDekker,2004:1_712.
MILDVANAS.Inversethinkingaboutdoublemutantsofenzymes[J].Biochemistry,2004,43(2):14517-14520.
ROBERTJH,JORGB,MARIELA.Combiningcomputationalandexperimentalscreeningforrapidoptimization
ofproteinpropertiesEJ].ProcNatlAcadSci,2002,99(3):15926—15931.
NAKASHIMAH,NISHIKAWAK.00IT.Thefoldingtypeofaproteinisrelevanttotheaminoacidcomposi
tion[J].JBiochem,1986,99(1):153—162.
KLEINP.Predictionofproteinstructuralclassbydiscriminateanalysis[J].BiochemBiophysActa,1986,874(2):
205—275.
CHOUKC,MAGGIORAGM.Domainstructureprediction[J].ProteinEng,1998,11(7):523—538.
CHOUKC.AkeydrivingforceindeterminationofproteinstructuralclassesEJ].BiochemBiophysResCommun,
1999,264(1):216-224.
VAPNIKV.StatisticallearningtheoryEM].NewYork:Wiely,1998:1-736. CORTESC,VAPNIKV.Supportvectormachinenetworks[J].MachineLearning,1995,20(4):273—297.
FANGKT.Theuniformdesignapplicationofnumbertheoreticmethodsinexperimentaldesi
gn[J].ActaMath
ApplSin,1980,66(3):363—372.
张光亚,方柏山.木聚糖酶氨基酸组成与其最适pH的神经网络模型[J].生物工
程,2005,21(4):658—661.
AUniformDesignBasedPCA—SVMModelforPredicting
OptimumTemperatureinChitinase
LINYi,CAIFu—ying,YUANYu—xi,ZHANGGuang—ya
(CollegeofMaterialScienceandEngineering,HuaqiaoUniversity,Quanzhou362021,China)
Abstract:Theprincipalcomponentanalysiswasappliedtothedataprocessingintrainingsets,thenewprincipalcompo—
nentswerethenusedasinputdataofsupportvectormachinemodle.Apredictionmodelforoptimumtemperatureofchiti—
nasewasestablishedbasedonuniformdesign.WhentheregularizedConstantC,,andywere10,0.5and5,respective—
ly,thecalculatedtemperaturefittedthereportedoptimumtemperatUreofehitinaseverywellandthemeanabsoluteper
centerror(MAPEs)was5.06.Atthesametime,thepredictedtemperaturefittedthereportedoptimumtemperature
we11andthemeanabsoluteerror(MAE)wasi.83?.Itwassuperiorinfittingsandpredictions
comparedtothemodel
basedonbackpropagationneuralnetwork.
Keywords:principlecomponentanalysis;supportvectormachine;chitinase;optimumtemperature
(责任编辑:黄仲一英文审校:陈国华)
范文五:最适洗澡温度
39℃度水最适合洗澡 人体健康的温度计
洗澡水最佳温度:39℃ 洗澡的水温应该在35—40℃之间,略高于体温的39℃最适合。过高的水温会破坏皮肤保护层,使皮肤丧失对污染及细菌的抵抗力。建议洗时先用手试试,如果手觉得烫,身体其他部位也会觉得烫。
正常体温:37℃左右
这一数据最早来自1868年,是当时测量了2500名成年人的腋下体温后,得出的平均值。不过,美国专家后来又测量过148人的口腔温度,得出的平均值是36.8度。测定结果表明:个体之间体温变动范围在2.7度之内,都是正常的。人的体温高低,有细微的差别。美国耶鲁大学一项最新研究显示,体温较高的人一般来说比较友善,更愿意把自己的东西赠予他人;体温较低的人则相反。
正常人的不同时间又不同体温
正常人的体温在一天24小时内会略有波动,不同时间体温可相差0.6度。“早晨6时,是体温最低的时候,下午4时则最高。”妇女月经期前或妊娠期体温稍高,而老年人体温偏低。另外,“肌肉活动可以产生热量,导致体温上升。”精神紧张和情绪激动也能让体温升高。人在紧张的时候,体温最多会升高2℃左右。而手术麻醉后,体温会下降,所以要注意保暖。 皮肤的最佳温度
除了体温外,人还有“皮肤温”,也就是皮肤表面的温度。在环境温度为23℃时,人的额部皮肤温一般为33—34℃,手为30℃,脚为27℃。就连人的内脏也各有温度:肝脏温度最高可达38℃;脑产热量较多,温度也接近38℃;肾脏、胰腺及十二指肠的温度则略低。 水温:
澡水的温度应与体温接近为宜,即35~37℃,若水温过高,会使全身表皮血管扩张,心脑血流量减少,发生缺氧。孕妇洗澡时的水温更要注意不要太高,以防发生胎儿缺氧,影响胎儿发育。
其实,洗澡的水温有不少讲究,依正常体温,可分为热水浴、温水浴、冷水浴三类。它们对人体可起到不同的作用。
热水浴解乏,水温约为40℃
热水浴温度大约为40℃,用手试一下,感觉略有点烫为宜。其最大的作用是可以帮助清洁皮肤。此外,由于热水浴的温度与多数温泉相似,略高于人体体温,因此具有和温泉类似的功能。比如,能扩张皮肤血管,促进血液循环,增强新陈代谢,对神经痛、风湿性关节炎等都有一定疗效。冬天洗热水澡比较适合,夏天运动后大汗淋漓的状态下,也最好洗个热水澡。 温水浴止痒,水温约为35℃
温水浴在35℃左右,用手试,感到稍热。这是一种比皮肤温度略高,比体温略低,非常适合泡澡的温度。一般情况下,夏天提倡洗温水浴。温水浴能镇静神经,减轻心血管负担,对高血压、神经衰弱、失眠、皮肤瘙痒等有良好的疗效,也是皮肤去垢的最佳温度。研究发现,健康人如在35℃的水中浸泡2小时,出浴后尿量就会增多,心脏供血能力增强,体重平均减轻0.5千克。常泡温水浴,还可使食欲增加,面色变得更红润。
冷水浴健身,水温约为20℃
冷水浴水温大约是20℃,是三者中健身效果最明显的一种。现代医学研究表明,坚持冷水浴不仅能显著增加白细胞数量,提高免疫力;而且有促进血液稀释,改善血液循环和血液质量,防止血栓形成的作用。
需要注意的是,老人和孕妇洗热水浴应对温度有所控制,否则可能导致老人昏倒,或令胎儿缺氧,影响发育。由于不同水温对身体的影响有所区别,所以,要选用适合自己洗澡的
水温。
转载请注明出处范文大全网 » 右图表示在25条件下研究种子