智能云运维管理解决方案 OpenStack 维
平台架构设计
流程
门户
内部门户、服务网站、
APP
、统一认证
自动化
CMDB 展示
可 视 化 展 示 运 维 数
析 监控
大
规
模
云
监
控
Monitor 应 用
监
控
APM
应
用
访
问
监
控
UEM WEB
统一事件管理
端到端的全栈式监控
用户体验监控
大规模云监控 应用性
大规模监控 Monitor
传统架构的全面采集能力 数据中心机房环境 业务应用 各类业务应用测
互联网架构的全栈采集
大规模云监控工具
“ 万台设备的秒级控 ” 是诠释 Monitor 监控能力的最佳形容。 Monitor 采用 微服务架构设计,易于实水平扩与高可用。当被监控规模增加时, 可过加 Monitor 务节点,部署更多的进实现性能的提升。同时 单个服务节点的停止工,也能避免整体务的不
大规模、分布式的采集
Monitor 监控不仅盖传统 ”IOE” 架构资源,更满足互联网、云架资源 监控需求,支持对 Nginx 、 Docker 、 Hadoop 、 Openstack 等对有效监控。 Monitor 通过安装服务器本地采集代理,可实现粒度指标采集,并 有效提高实时性,一些指标的采集周期做到 15秒以内。时,基于 Python 的动脚本技术以及丰富的社区资源,易于快扩展采集能 适用物联和混合云的
Monitor 采集代理提供手动部署、自动部署、镜像部署等种维护方式, 降低了人工维护本和
? 自动部署:通过自动化运维系统,批量地远程执行部署命令,完大 量同类型器
? 镜像部署:通过在虚拟机镜像中提前部署好 Agent ,当镜像生成虚机 时自动运并上
采集代理的自动化
应用性能监控 APM
敏 捷 运 维 , 成 就 数 字 化 业 务 强
层协议解码能力
200+
应用性能监控工具
呈现业务系统应用拓扑结构,展 现各组件间用
实时监视各环节交易量、平均响 应时间,提
业务系统全过程监测
实时监测应用系统、关键交易的 用户
监测不满意用户数的来源、地理 位置,确定业务响
最终用户体验监测
实时监测关键交易的访问人数、 访问次数、用户体验、不满意用 户数、访
端到端的交易跟踪
关键业务交易监测
通过时间轴查看压力传导图,确 定
查看从前端最慢页面,直至最后 台最慢 SQL
查看错误页面、错误码
定位性能瓶颈
APM 用性能管理工具,支持 Agent 和镜像模式,可以多度透视业务应用各节的性能和数据流 (易 ) ,定位性能瓶和故 原
用户体验监测 UEM
用户操作体验分析
操作响应时间 AJAX 请求响应时间 平均可操作时间
资源加载耗时 JS 错误 漏斗分析 路径分析 自
?用户体验:哪些应用的页 面体验不好,响应慢,错误多,浏览器兼性
用户行为轨迹追踪(关键用户
?行为分析:应用的使用者具体是哪些人,访问频率如何,访问路径是怎么的? ?重点保障:领关心哪些应用,看哪些内,哪些是应该重点保障 VIP 用
UYUN CMDB
圈子化的配置管理
基于资源间的关联关系,可随需 组织可视化系
直观的关系可视化
支持网络、服务器、数据库、中 间件、虚拟化等资源配置数据自 动发现、采,减少数据人工 护
全面的自动发现能力
采用建圈子、社交化的思路,通 过文化引导和规范约束结合方 法,促进配的鲜活、保证配置 准确率,激发用户做配置
圈子化的审核维护
简捷配置维护:基于圈化配置数据维护,实现据
维护自治:
支持支持按部门、按团队、按业务等维度建立维护圈,配置数据护包产到户,维护 圈负责人自主决定数变更是否生效,提升据维效
自动 /人工认领配置项 配置数据
高效维护协作:
激发圈子协作力量,提升使
社交化的点评点赞
圈子维护动时间线 ?动态跟踪:定期探测配置数据的变化,及时向订者推送变化信息,帮数据关注者掌握最新数动态。 ?协作、分享及据维护活
UYUN Automation
Automation Automation 品
产品目标:提供从云基础架构到业务应用的全栈自动化交付和运
提供面向各维场景 的操作编排功能 可根据运维需求设定 作业自执行策略 提供丰富 API 供其他 模块平台调用 操作编排
运维自动化(Automation )技
平 台 架 构 层 功
软件定义自动化运维
运维自动化工具特点
国网行业运维自动化场
国网行业运维自动化场
国网行业运维自动化场
部委行业自动化场景
运维管理流程 ITSM
政务云运维管理规范(试行)
附件8:
政务云运维管理规
(试行)
年 月
I
目录
引 言 ...........................................................................................................................................................................................1 务云运维管理规范.....................................................................................................................................................................2 1 范围 ...........................................................................................................................................................................................2 2 术语和定义 ..............................................................................................................................................................................2 2.1 术 ..................................................................................................................................................................................2 2.2 缩略语 .............................................................................................................................................................................3 3 政务云运维管理要素架 ...................................................................................................................................................4 4 政务云业务运维活动角色及运维理组织构 ...........................................................................................................4 5 政务云业务运维服务支撑系统...........................................................................................................................................4 6 政业务维管理对象 ...................................................................................................................................................5 7 务云业务运维管理流程 ...................................................................................................................................................5 8 政务云业务IT运维服务 ......................................................................................................................................................6 9 政务云系统维 .....................................................................................................................................................................6 9.1 计算源池.....................................................................................................................................................................6 9.2 存储资源池.....................................................................................................................................................................8 9.3 网络资.................................................................................................................................................................. 11 9.4 机房基础设施、软件和数据 .................................................................................................................................. 13 10 传统数中心与云计算数据中心的服务内容区别.................................................................................................. 14 11 维服务报告 .................................................................................................................................................................... 14 11.1 则............................................................................................................................................................................. 14 11.2 常规报告.................................................................................................................................................................... 14 11.3 事件报告.................................................................................................................................................................... 15 11.4 专报告.................................................................................................................................................................... 15 附录一: 政务服务等级协议SLA模
II
引 言
政务云运维管理规范遵ISO20000和ITSS的基本准则,对政务云的技术构成方式、服务供应特征、务评价方式,通过基本标准框架下的扩充形成,规范政云运维活中涉及的各类实体,以及这些体间相关系。组成运维服务管理体的实体包括运维服务管理对象、维活动色及运维管理组结构、运维服务管理流程、运服务支撑系统和运维务五个
1
政务云运维管理规
1 范围
本部分规定了政务云运维管理的要素、流程和主要
本部分适用于规范政务云运维活动中涉及的各类实体,以及这些实体间的相关系。 2 语和
以下术语和定义适用于本部
2.1 术语
政务云
在电子政务领域以云计算模式提供服务的各类云平台的
运维服务
运维服务是指运维服务供应商或运维部门综合利用各种IT运维支工具提供的确保IT基础设施和应用系统常、安全、高效、经运行的
本部分中规范的运维服务包括IT基础设施运维服务、IT应用统运维服务、安全理服务、网络接入服、内容信息服务以及综管理
运维服务管理流程
运维服务管理流程是指为了支持运维服务的实现和提供,以确定的式执行或发生的系列有规律的行或活
运维服务支撑系统
参与运维的各方为支持运维服务目标所使用的信息化工具,是支撑维服务实施平
配置管理数据库 configuration management database
包含每一个配置以及配置项之间重要关系的详细情况的数
[ISO/IEC20000-1:2005,定义2.5]
工作说明书 statement of work
合同的重要附件之一,详细规定了合同双方在合同期内应完成的工作,如目范围、工作描述、进度表、风险、方责
service level agreement 服务级别
服务提供商与顾客之间签署的记录了服务和约定服务级别的
[ISO/IEC20000-1:2005,定义2.13]
外部事件 external events
为服务对象运行提供支撑的、协议获得的、不可控、非自主维的服务资源(如互联网、市电、租的机房等等)中断发的
系统事件 system events
在运维对象范围内的、自主管理或运维的系统资源服务中断引发的
安全事件 security events
2
由于安全边界破坏、安全措施或安全设施失效,造成的安全等级下降或息被非法盗用需
据中心)利益被侵害的事
2.2 缩略语
CMDB Configuration Management Database 配置管理数据库 SOW Statement Of Work 工说
SLA Service Level Agreement 服务别
APU Auxiliary Power Units 辅助力
ATS Automatic Transfer Switch 电源快速换
UPS Uninterrupted Power Supply 不断
** Virtual Private Network 虚专
QOS Quality of Services 服
ISO International Organization for Standardization 国标准化组织 IT Information Technology 息
ITIL Information Technology Infrastructure Library IT基础构
3
3 政务云运维管理要素
政务云运维务管理由运维活动角色及运维管理组织结、运维服务支撑系统、维管理对象、运维管理流和IT运维服务等五个要组成,其主要内容及其相互系如下图
运运使用 维运维服务供应商 维管活理运维管理部门 动组制定/实 角服务台 织运部门 色结配置
变更管理 使用
事件管理
外包管理 运问题管 IT基础设施运维服务 维运综合管理 测调IT发布管理 IT应用系统运服务 服维试试 调用 提供 流程管 务管务级别管 维运安全管理服务 2 理维全管理 知识管理 网络入服务 撑流服务 系监控理 程 务财务管理 内容信息服务 统 资产管理 1 供应商管理 合管理
值班管理 管理
作业计划管理 运维部门和人员 考核管理 运IT供应商 维急预案管理 管IT用户 理培训管理 IT应用系统 对象 IT基设
图1 政务云运维管理
4 政务云业务运维活动角色及运维管理组织
政务云业务运活动角色是指从事运维活动的所有组织、部门或者体工作人员,一般包括运维服务供者、运维服务使用者、以及维服务管理者三角色。各类角色运维活动中所构成的组织形式构成运维管理组结
5 政务云业务运维服务支撑
运维服务支撑系统是支运维管理组织中各运维角色按照规定的运流程开展运维活动的信息化系统。一方面,运维服务支撑系统支持运维服务提供者对运服务管对象进行理,以实现运维服务的能力;一方,持运维服务提供者按照商的服务级别协议方便地向运维务使用者提供运维服务;时,要支持运维服务管理者对个运维服务的考核、监督和
4
6 政务云业务运维管理
运维服务管理象主要包括基础设施、物理资源、虚拟资源、数据、平台资源、应用资源、用户和IT供应商。广义念下,有时也将组织内部从事IT运维活动的部门和人员作为维服务管对
图2 政务云运维管理
7 政务云业务运维管理
运维服务管理流程是联系运维服务提供者、运维服务使用以及运维服务管理者之间开展规范协同工作的机制和方法。完整的运维服管理流应该覆盖运维服务的规划、设计、行持改进等各个环节,本规主要针对支撑运维服务运阶段的相关流程。运维服务管理流程的信息化可借运维服务支撑系得以实
政务云运维管理的流程如图3所
规划
政务云运维管理
响应咨询例行优化持续
支持 评估 操作 改
SLA需求 SLA满足 远程 运维方式
供方 需方
运行
设计
政务云运维管理
5
图3 政务云运维管理
8 政务云业务IT运维
IT运维服务是运维务提供者向运维服务使用者提供的服务产,相关的运维服务质量应该可度量,服提供方式应该符合规定的流程。在本部分规范的维服务括云设施运维服务、基于云的用统维服务、云安全管理服务、支持政务云网络接入服务、容信息服务以及其他综合管理服务。运维服务的自动化施需要依靠运维服支撑系
联系运维服务提供者、运维服务使用者以及运维服务管理之间开展规范化协同工作的机制和法。完整的运维服务管理流程应该覆运维服的规划、设计、运行和持续改进等个节,本规范主要针对支撑务云运维服务运行阶段的关流程。运维服务管理流程的信息化可借助政务运维服务支撑系得以实
9 政务云系统运
9.1 计算资源池
9.1.1 服务实施对象和活
对象为分布式的虚拟计资源(虚拟机、虚拟机监控器(Hypervisor)、虚拟计算资源池(Resource Pool))集群,充分利集群汇的强大威,对海量数据做分布式的处快速完数据分析工作。集群的维特点是集中管理,集中控制,集中运维,有效监控,提预警感知,为计算系统的正而有序的运行提供坚的基
9.1.2 例行操作
9.1.2.1 监控
虚拟计算资源监控主要监控虚拟计算资源的运行状况变化趋势及其指标。具体表1,包括但
表1
服务对象 监控内
虚拟计算资源 虚拟机监控器CPU负
虚拟机监控器磁盘IO负
虚拟机监控器内存负荷
虚拟机监控器网络IO负
虚拟机监控器网络链路状态监
虚拟机监控器服务进程监
虚拟机监控器计算资源分配监
虚拟机监控器系统日志异常监
计算资源池资源分配监
虚拟机CPU负荷
虚拟机磁盘IO负荷
虚拟机内存负荷
虚拟机网络IO负荷
6
9.1.2.2 预防性检
对于虚拟计算资源预防性的检查,包括:虚拟计算资源故障的提前预,系统运行趋势分析,安全日志的
虚拟计算资源的预防性检查参见表,包括但不限
表2 虚拟计算资源预防性检
服务对象 性能检查 脆弱性
虚拟计算资源 检查虚拟机监控器CPU使用峰值情况 检查物理服务器关硬件部件是否在故
检查虚拟机监控器内存使用峰值情况 检查计算资源池资源分配是否超过预阀
检查虚拟机监控器文件系统空间使用情当前虚拟机监控器版本是否安装相关风补
况 检查虚拟机监控器服务进程的健康状
检查虚拟机监控器IO读写情况 检查虚拟机监控器文件空间使用是达
检查虚拟机监控器网络流量情况等 阀
检查虚拟机的资源分配情况 检查虚拟机监控器系统数据安全防设
检查计算资源池的资源分配情况与分配满足要
策略 检查虚拟计算资源安全隔离有效性 9.1.2.3 常规
对虚拟计算资源的常规作业参见表,包括但不限
表3 虚拟计算资源常规作
服务对象 常规作业内
虚拟计算资源 更换损坏的硬
虚拟机监控器软件升级
日常的可靠性计划制定与演
脚本维护
制作虚拟机快照
虚拟机手工迁移
虚拟机资源配置更改
虚拟机备份、克隆与恢
虚拟机的维护包括创建虚拟机,
启动、停止、删除、回收等操
虚拟资源池的扩容与资源再分
制作与升级标准虚拟机模
虚拟机映像维护
虚拟机转换
虚拟资源的访问控制与权限管
制作系统运行状况报
9.1.3 响应支持
9.1.3.1 事件驱动响应:
针对虚拟计算资源所依赖的硬件,网络及软件故障而进行的响应,包括但限
a) 解决物理服务器故
b) 解决物理网络设备故
7
c) 解决虚拟机监控器软件故障或者缺
d) 虚拟机紧急迁
e) 虚拟资源池紧急扩
9.1.3.2 服务请求响应:
根据应用系统运行需要或需方、服务相关方的请求,而进行的响应服,包括但不
a) 数据备份与恢
b) 虚拟机备份与恢
c) 系统扩容
d) 虚拟机供应
e) 虚拟机迁移、回收、变
f) 虚拟资源池变
g) 虚拟资源池的高可用配置、计划实施与
h) 报表清单
9.1.4 优化改善
9.1.4.1 适应性改
根据应用系统的要求,进行改
a) 虚拟计算资源CPU、内存容量、硬盘容量、网络的
b) 虚拟计算资源迁
c) 虚拟机监控器资源调度的算
9.1.4.2 增强性改
根据应用的特点和发展要求,以及数据量处理能力要求进行升级,容
a) 物理服务器计算能力扩
b) 物理服务器内存扩
c) 物理服务器网络吞吐能力扩
d) 虚拟计算资源高可用性增强与演
e) 虚拟计算资源容错机制增强与演
f) 虚拟计算资源备份恢复测
9.1.4.3 预防性改
根据对虚拟计算资源的运行记录和趋势的分析发现潜在的隐患而进行的改进业,包括但
a) 根据系统监控得到的信息替换可能存在问题的内存,CPU,硬盘,网络备
b) 根据系统的压力增长趋势主动对物理服务器的数量进行必要扩
c) 根据系统的发展趋势对网络系统采取必要的
9.1.5 咨询评估
通过对虚拟计算资源的运行记录、运行趋势进行分析,根据应用系统的特点运行需求,出物
设备、虚拟机监控器、虚拟计算资源池、虚拟机的改进建议和方案。 9.2 存储源
9.2.1 服务实施对象和活
服务实施对象是通过虚拟化建立大规模的分布式虚拟存储资源(虚拟存储卷、储资源池、服控制
8
提供安全、靠、实时、高吞吐的数据存储。虚拟化存储集群集中管理、集中运营、集中维护,以更小的硬件资源和人资源投入,提供更坚实存储平
9.2.2 例行操作
9.2.2.1 监控
虚拟存储资源监控主要监控各软硬件的运行状况和指标。具体内容参见4,包括但不
表4 虚拟存储资源主要监控
服务对象 监控内容
虚拟存储资源 服务控制器CPU负载情
服务控制器内存消耗情
服务控制器整体数据吞吐带宽、IOPS、响应时间和请求队列时
服务控制器后端数据吞吐带宽、IOPS、响应时间和请求队列
服务控制器间数据吞吐带宽、IOPS、响应时间和请求队列
服务控制器cache利用情
存储资源池分配策略与空间使用情
虚拟存储卷访问吞吐率、IOPS、响应时间和请求队列
仲裁控制点(磁盘、服务器等)健康
服务控制器前后端IO链
服务控制器后端分布式物理存储健康
服务控制器各服务网络端口监听情
服务控制器服务进程的运行状
服务控制器日志
9.2.2.2 预防性检
在监控服务的基础上,对虚拟存储资源进行预防性检查,包括:性检查、脆弱性检查。对虚拟存储资源的预性检查参见表5,包但不限
表5 虚拟存储资源预防性检
服务对象 性能检查内容 脆弱性检查内容 虚拟存储资源 查服务控制器下列景的数据吞吐带宽、IOPS、检查服务控器冗
响应时间和请求排队时间 检查服务仲裁控制点健
-整体 检查服务控制器微码版
-后端 检查存储资源池分配策略
-控制器间 度分配
检查虚拟存储卷访问吞吐率、IOPS、响应时间和请检查控制器存储虚拟软
求队列时间 一致性
检查各服务控制器cache利用率,做为后端存储优化检查虚拟存储资源授的
依据 和统一性
检查存储资源池分配策略与空间使用率 检查数据副
检查虚拟存储卷后端存储的性能匹配 检查数据保存的出
检查服务控制器日志 检查数据传输的出错
检查用户请求的错误率 检查数据副本的一
检查所有服务所接受的请求错误率 统计数据恢复时
9
9.2.2.3 常规作
对虚拟存储资源的常规作业参见表6,包括但不限
表6 虚拟存储资源常规作
服务对象 常规作业内
虚拟存储资源 SAN拓扑,端口,Zoning配置
服务控制器配置备份和恢复
虚拟存储资源划分
虚拟存储资源权限设置
扩充存储资源池容量
制定和实施异构存储资源池数据快照,镜像,容灾
存储资源池内数据在线迁
数据分层管理
维护数据副本数
资源使用情况统计
用户使用情况统计
服务控制器软件升级
更换损坏硬件
日志文件分析和备份 9.2.3 响应支
9.2.3.1 事件驱动响
针对虚拟存储资源的软、硬件故障而进行的响应服务,包括但不限
a) 解决存储虚拟化软件缺陷或故障;
b) 解决服务控制器宕机、重启、死机等;
c) 解决服务控制器前后端网络故障;
d) 数据恢复;
e) 硬件损坏更换;
9.2.3.2 服务请求响
根据应用系统运行需要或需方、服务相关方的请求,而进行的响应服,包括但不
a) 数据统一备份;
b) 数据容灾计划制定,实施与演练;
c) 数据访问性能优化;
d) 数据在线迁移;
e) 数据分级存储,降低存储成本;
f) 新增主机分配存储空间;
g) 现有主机存储空间调整;
h) 主机端多路径软件的安装配置。
9.2.4 优化改善
9.2.4.1 适应性改进
根据应用系统特点和运行需求,对虚拟存储资源进行调整,包括但不
a) 服务控制器内存、数量和磁盘数量、容量间的配
10
b) 根据数据生命周期,进行存储资源分层调
c) 数据存储平衡算法调整;
d) 服务控制器前后端网络(SAN或IP)端口吞吐速率的
9.2.4.2 增强性改
根据应用系统的特点和运行需求,通过对虚拟存储资源的运行录、趋势的分析,对存储设备进行调、扩容或升级,包括不限
a) 存储容量增加;
b) 服务控制器数量增加;
c) 服务控制器内存容量增加;
d) 服务控制器CPU增强;
e) 服务控制器前后端网络(SAN或IP)端口增
f) 存储虚拟化软件升级。
9.2.4.3 预防性改
根据对虚拟存储资源的运行记录、趋势的分析,结合应用系统的求,发现存储设备脆弱点,有针对性地行改进性作业,包括不限
a) 收集磁盘空间的使用情况,及时清理垃圾数据或增加存储设备
b) 监控负载情况,必要时增加硬件数量,或提高硬件规
c) 监控硬件出错率,替换存在问题的硬
d) 服务控制器微码升级;
e) 存储虚拟化软件升级。
9.2.5 咨询评估
通过对虚拟存储资源的运行记录、运行趋势进行分析,根据应用系统的点和运行需求,提处理或改进的建和方
9.3 网络资源池
9.3.1 服务实施对象和活
运维对象是虚拟网络资源(虚拟网卡、虚拟网络资源池、虚拟机络)和网络设备,本活动包括例行操作、响应支持、优化改善、询评
9.3.2 例行操作
9.3.2.1 监控
重点是对虚拟网资源的运行状态、运行性能、资源使用分配情况进行控,以便了解其是否满足运行要。监控应当采用合适的装备与手,分配专门人员期或全时段进行监。对虚拟网络资源的监控内容参见表7,包括但不
表7 虚拟网络资源监控内
运维对象 监控内
虚拟网络资源 虚拟网络资源的健康
虚拟网络资源池分配状
虚拟网络资源的链路状况如端到端时延
链路端口工作稳定性、链路负载百
虚拟网络资源配置变动
11
虚拟网络资源操作日志
虚拟网络资源安全事件
9.3.2.2 预防性检
应在监控服务的基础上,对虚拟网络资源进行预防性检查。包括:性检查、脆弱性检查。虚拟网络资源的预防检查内容参见表8,包但不限
表8 虚拟网络资源预防性检查内
运维对象 性能检查内容 脆弱性检查内容 虚拟网络资源 检查虚拟网络资健康状态 检查拟网络资源的链路余度
检查虚拟网络资源CPU使用峰值情况 虚拟网络资源使用度和调度情评
检查虚拟网络资源内存使用峰值情况 虚拟网络资源可用性周期检
检查虚拟网络资源端口的吞吐率 虚拟网络资源安全事件周期性理
检查虚拟网络资源链路的健康状况,包
包传输延时、IP包丢失率、IP包误差率、
IP包(包括攻击性IP包、欺骗性IP包、
包等)
9.3.2.3 常规作
虚拟网络资源的常规作业内容参见表9,包括但不限
表9
运维对象 常规作业内
虚拟网络资源 虚拟网络资源配置备份及存
监控虚拟网络资源日志备份及存
虚拟网络资源日志数据分析与报告生
虚拟网络资源配置变更文件的审
虚拟网络资源配置变更的操
虚拟网络资源配置变更的
9.3.3 响应支持
9.3.3.1 事件驱动响
针对虚拟网络资源故障引起的业务中断或运行效率无法满足正常运要求,而进行的应服务,包括但
a) 故障定位;
b) 虚拟网络资源更换;
c) 中断、连通网络连接;
d) 关闭、启动端口;
e) 更改、恢复配置;
f) 停止、启动进程;
g) 虚拟网络资源重新调配。
9.3.3.2 服务请求响
12
根据应用系统运行需要或需方、服务相关方的请求,而进行的响应服,包括但不
a) 增加、降低虚拟网络资源网络接入数量或速
b) 更改虚拟网络资源配置;
c) 启动、关闭端口或服务;
d) 更换、更新或升级虚拟网络资源硬件或软
e) 调配虚拟网络资源。
9.3.4 优化改善
9.3.4.1 适应性改
根据应用系统特点和运行需求,对虚拟网络资源进行调整,包括但不
a) 设备或链路负载调整;
b) 安全策略调整;
c) 监控对象覆盖范围调整;
d) 路由策略调整;
e) 局部交换优化;
f) 局部冗余优化;
g) 虚拟网络资源调配。
9.3.4.2 增加性改
根据应用系统的特点和运行需求,通过对虚拟网络资源的运行记录、势的分析,对拟网
进行调整、扩容或升级,包括但不限于:
a) 虚拟网络资源调整,如CPU、内存、端口的调配、扩容
b) 虚拟网络资源网络架构变动;
c) 网络架构容量变化,如网络子系统的增减
d) 系统功能变化,如新增安全系统、新增审计系统
e) 路由协议应用及部署调整;
f) 整体安全策略收紧;
g) 虚拟网络资源冗余优化。
9.3.4.3 预防性改
根据对虚拟网络资源的运行记录、趋势的分析,结合应用系统的需求,发现拟网络资源脆弱
针对性地进行改进性作业,包括但不限于:
a) 配置参数优化,例如虚拟网络资源的VLAN、QoS、ACL、带
b) 部署路由策略情况下端到端选路变化、端口流量变化、路由条目变化 9.3.5 询评
咨询评估服务包括但不限于:
a) (整体或局部)虚拟网络资源实际负荷与承载能力分
b) (整体或局部)虚拟网络资源预期负荷与承载能力分析与
c) (整体或局部)虚拟网络资源架构变动分析与建
d) (整体或局部)虚拟网络资源路由策略变动分析与建
e) (整体或局部)虚拟网络资源安全策略变动分析与建
f) (整体或局部)虚拟网络资源配置调优分析与建议等。 9.4 机基础设施、软和数
13
机房基础设施、软件和数据等与传统数据中心运维方式一致,照国标送审稿《信技术服务 运行维护 第4部分:数据中心务规
10 传统数据中心与云计算数据中心的服务内容
云计算是目前国外广泛关注的一项技术和应用,具有大规模、虚拟化、高可、高扩展和通用、按需服务等特点。云算与数据中心相结合,是未来一时数据中心发展的趋。云计算数据中心与统数据中心在运维对象、服务内容等方面在差异,如下
表10 传统数据中心与云计算数据中心服务内容的主差
运维对象 服务内
传统数据中心 机房基础设施 从以下视角开展例行操作、响应支持、化改善和咨询
1.单一设备运行维护; 网络及网络
2.以网络关联其他设备及基础设施的运行维护; 服务器
3.以应用系统关联设备及基础实施的运行维
软件
数据 围绕数据及时性、可用性、完整性、安全性开展的例
响应支持、优改善和咨询评估服务。 云计算数据中虚拟资(包括网络资源、围绕资源健状况、使用情况和调度情况展的例行操作、心 计算资源和储资源等) 响应支持、优化改和咨询评服
软件 围绕软件提供、软件定制、本地化或统一部署、统
开展例行操作、响应支持、优化改善和咨询评估
平台 围绕平台运行、组件服务、个性化定制、场景式服
管理等开展例行操作、响应支持、优化改善和咨询评估
数据 基于虚拟资源,依托软件、平台开展的满足数据及
用性、完整性、安全性要求的例行操作、响应支持、优
善和咨询评估服务。
11 运维服务报
11.1 总则
运维服务实施中,供方应按要求进行服务报告编制、提交。服务报告常分为常规报告、事件报告和专题告三
11.2 常规报
常规报告包括的种类:提交分为定时、非定时,其内容包括但不
a) 报告名称、报告周
b) 需方、供方相关信
c) 服务综述;
d) 服务对象(机房基础设施、网络、硬件、软件、数据),包括但限
1) 服务内容;
2) 服务完成情况及下一步工作计
3) 服务工作量;
4) SLA目标相关绩效表现(事件量、问题数、变更实施、故障时/次数、影响务
/次数等);
5) SLA达成及未达成情况、安全违规及考核实施
6) 服务对象情况分析、隐患及相关的纠正和预防措施(或建
14
7) 重大事件(故障)的分析(对需方业务的影响和成本分析)、正和预防措及
踪情况,相关变更和发布的绩
8) 趋势分析和预警(响应事件量、问题数、故障时间/次数、影业务的时间/
9) 改进/提升建议。
e) 满意度分析。
11.3 事件报
事件报告内容包括但不限
a) 报告名称;
b) 需方、供方相关信
c) 事件描述;
d) 事件发生时间/地
e) 事件受理时间;
f) 恢复时间;
g) 事件处理结束时
h) 事件提出人;
i) 事件受理人;
j) 事件处理人;
k) 事件级别;
l) 事件的影响程度、范
m) 事件处理情况/工作
n) 事件发生频度;
o) 事件原因分析及建
p) 后续改进计划。
11.4 专题报
内容包括但不限于:
a) 报告名称;
b) 需方、供方相关信
c) 专题存在(或发生/灭失)所需要件(环境或机制) ; d) 专题对象(房基础设施、网络、件、软件、数据),包但不
1) 分析与解决方案建
2) 对专题对象所造成的变
3) 时间计划与各时间工作量安
4) 对其他任何可能相关的服务内容的影
5) 资源协调与配合;
6) 保护或应急措
15
附录一: 政务云服务等级协议SLA
政务云等级协议包括但不限于如下要
, 服务描述:务云服务工作分解结构各层面定义的服务自然状态的定。 , 服务标准:包括功能性、全性、可靠性、响应性、有形性、友好性。 , 级规则:用户要求高服务等级或提高供应量或增加服务目时遵循的务开
理流程。
, 罚则:不能提供约定的服务服务供应方应当支付的
, 期限:定的服务起始时间和该时间段内服务间隙,以及期限延长或缩短的理规程。 , 角色和职:服务提供方、用户方及它相关方与服务过程相关人的分工与
及协同工作的方式等。
, 联系信息:各方相关人等的联系方式和约定的沟通
, 评估标准:服务提供方在服务过程中遵循的标准,包括但不限于:服务标准、理
质量标准与技术标准。
政务云等级协议建议指标如
故障分序析报告备服务 分类 SLA项目 SLA时限 号 提
限 1 服务可性 >=99.99, 2 服务请求响应及时率 >=95% 云服务编号 3 务 平均响应时间 <=5分钟 24小时="" 或合编号="" 4="" 平均故恢复时间="">=5分钟><=60分钟 5="">=60分钟>
16
政务云运维管理规范20121122( 试行)
附件8:
政务云运维管理规范
(试行)
2012年11月
目录
引 言 .............................................................................................................................................................. 1 政务云运维管理
2.1 术语 .............................................................................................................................................................. 2 2.2 缩略语 .......................................................................................................................................................... 3 3 政务云运管理要素框架 ................................................................................................................................... 4 4 政务云业运活动角色运维管理组织结构 ............................................................................................... 4 5 政务云业务运维服务支撑系统 ........................................................................................................................... 4 6 政务云业务维管理对象 ................................................................................................................................... 5 7 政务云业务运管理流程 ................................................................................................................................... 5 8 政云业务IT 运维服务 ..................................................................................................................................... 6 9
附录一: 政务云
引 言
政务云运维管理规范遵循ISO20000和ITSS 的基准,针对政务云的技术成方式、服供应特征、服务评方式,通过基本标准框架下的扩充形成,规范政务云运维活动中涉的各类实体,以及这体间的相互关系。组成运维服务管体系实体包括运维服务理象、运维活动角色及运维理组织结构、运维服务管理流程、运维服务支撑系统和运
政务云运维管理规范
1 范围
本部分规定了政
本部分适用于规务云运活动中涉及的各类实体,以及这些实
以下术语和定
政务云
在电子政务领以计算模式提供服务的各类
运维服务是指运维服务供或运维部门合利用各种IT 运支撑工具提供的确保IT 基础施和应用系统正常、
本部分中规范的运维服务括IT 基设施运维服务、IT 用系统运维服务、安全管理服务、网络接入服务、内
运维服务管理流程
运维服务管理流程为了支运维服务的实现和提供,以确定的方式执或发生的一系
运维服务支撑系统
参与运维的各方为支持运服务目标所使用的信息化工具,支运维服务实施的平。 配置管数据库 configuration management database 包含每一个配置配置项之间重要关系的详细情况的据
合同的重要附件之一,细规定合同双方在合同期内应完成的工作,如项目范、工作描述、进
服务级别协
服务提供商与顾客之间签署的了服务约定务级别的协议。 [ISO/IEC20000-1:2005,
为服务对象运行提供支的、协议获的、不可控、非自运维的服务资源(例如互联网、市电、租赁的机
系统事件 system events
在运维对象范围内的、自主管理运维的系统资源服务中断引发的事件。 安
由于安全边界破坏、安施或安全设失效,造成的安全等下降或信息被非法盗用等需方(数据中心)利益被侵
CMDB Configuration Management Database 配管理数据库 SOW Statement Of Work 工作明 SLA Service Level Agreement 服务级别协 APU Auxiliary Power Units 辅助动力装置 ATS Automatic Transfer Switch 电源速切换装置 UPS Uninterrupted Power Supply 间断电源 ** Virtual Private Network 虚拟专用
3 政
政务云运维服务管理由运维活色及运管理织结构、维服务支撑系统、运维管理对象、运维管理流程和IT 维服务等五个要素组成,
4 政务云业运维活动角色及
政务云业务运维活动角色是指从事运维活动有组织、部或者具体作人员,一包括运维服务提供者、运服务使用者、以及运维服务管理三类角色。各类角色在维活动中所构成组织形式构成了运维理组织结构。 5 政务云业务运维
运维服务支撑系统是支撑维管理组织中各运维角色按照规的维流程开展运维活的信息化系。一方面,运维服支撑系统支持运维服务提供者对运维务管理对象进行管理,以实现运维服务的能力;一方面,支持运维服务提供者按照定服务级别协议方便向维服务使用者提供运维
图1
6 政
运维服务管理对象主要包括基础设、物理资、虚拟源、数据、平台资源、应用资、用户和IT 供应商。广义概念下,有时将组织内部事IT 运维活
图2
7 政
运维服务管理流程是联系运维服务提供者、运维服使者以及运维服务理者之间展规范化协同工的机制和方法。完整的运维服务理流程应该覆盖运维服务的规划、设计、行和持续改进等各个环节,本范主要针对支撑运维运行阶段的相关流程。运维服务管理流程的信息化可借助运维服务支撑
政务云运
政务云运维管理
图3
8 政务
IT 运维服务是运维务提供者向运维服务使用者提供服产品,相关的运维务质量应可度量,服务提供式应该符合规定的流程。在本部分规范的运维服务包括云设施运维服务、基于云应用系统运维服务、云安全管理务、支持政务云网络接服、内容信息服务以及其综合管理服务。运维服务的自动化实施需要依靠运维
联系运维服务提供者、维服务使用者以及运维服务管理者间展规范化协同工的机制和方。完整的运维服务理流程应该覆盖运维服务的规划、计、运行和持续改进等各个环节,本规范主要支撑政务云运维服务运行阶段的关程。运维服务管理程信息化可借助政务云运
9.1.1 服务实施对象和活动
对象为分布式的虚拟计算资(虚拟机、虚拟机监控器(Hypervisor )、虚拟计算源(Resource Pool))集群,充分利用集群汇聚的强大威力,对海量数据做分布式的处理速的完成数据分析工作。群的维护特点是集中管理,集中控制,集中维,有效监控,提前警知,为计算系统的正常而有
虚拟计算资源监要监控拟计算资源的运行状况变化趋势及其
9.1.2.2 预防性检查
对于虚拟计算资源性的检,包括:虚拟计算资源故障的提前预警,系运行趋势的分
虚拟计算资源预防性检查参见
9.1.2.3 常规作业
对虚拟计算资的常规作业参见
表3 虚
9.1.3 响应支持
9.1.3.1 事件驱动响应:
针对虚拟计算资源所依赖件,网络及件故障而进行的响应,包括但不限于 a) 解决
c) 解决虚拟机监控软件故障或缺陷 d) 虚机紧急迁移 e) 虚拟资
根据应用系统运行需要或需、服务相关方的请求,而进行的响应服,括但不限于: a) 数据备与恢复 b) 拟机备份与恢复 c) 系统扩容 d) 虚拟机供应 e) 虚拟机迁移、收、变更 f) 虚拟资源池变 g) 虚拟资源池高
根据应用系统的要求,进行改善 a) 虚计算资CPU 、内存容量、硬盘容量、网络的调整 b) 虚拟计算资源迁移 c) 拟机监控器资源
根据应用的特点和发展要,以及数据量处理能力要求进行级,扩容等 a) 物理服务计算能力扩容 b) 物理服务器内存扩容 c) 物理服务器网络吞吐能力扩容 d) 虚拟计算资源高可用性增强与演 e) 虚拟计资
根据对虚拟计算资源的行记录和趋势的分析发现潜在的隐而行的改进作业,包但不限于: a) 根据统监控得到的信息替换可能存在问的内存,CPU ,硬盘,网络设备等 b) 根据系统的压力增长趋势主动物服务器的数量进行要扩容 c) 根
通过对虚拟计算资源的运行记录、行趋势进分析,根据应系统的特点和运行求,提出物理计算设备、虚拟机监控器、虚计算资源池、虚拟机的改
9.2.1 服务实施对象和活动
服务实施对象是通虚拟化立大规模的分布式虚拟存储资源(虚拟
提供安全、可靠、实时、高吞吐的存储。虚化存储群集中管、集中运营、集中护,以更小的硬件资源和人力资源投入,提供坚实的存储平
虚拟存储资源监主要监各软硬件的运行状况和指标。具
表4
9.2.2.2 预防性检查
在监控服务的基础上,拟存储资源行预防性检查,包括:性能检查、脆弱性检查。对虚存储资源的预防性检
9.2.2.3 常规作业
对虚拟存储资
表6 虚
9.2.3 响
针对虚拟存储资源的、硬件故障而进行的响应服务,括但不限于: a) 解决存储虚拟化件缺陷或故障; b) 解决服务控制器宕机、重启、死机等; c) 解决服务控制器前端网络故障; d) 数据恢复; e) 硬件损坏更换; 9.2.3.2
根据应用系统运行需要或需方、服务相关方的请求,而进的应服务,包括不于: a) 数据一份; b) 数据容灾计划制,实施与演练; c) 数据访问性能优; d) 据在线迁移; e) 数据分级,降低存储成本; f) 新增主机配存空间; g) 现主存储空间调整; h)
根据应用系统特点和运求,对虚拟储资源进行调整,括但不限于: a) 服控制器内存、数量
b) 根据数生命周
d) 服务控制后端网(SAN 或IP )端口吞吐速率的
根据应用系统的特点和运行求,通过对虚拟存储资源的运行记录、趋的析,对存储设备进行调、容或升级,包括但不限于: a) 存储容量增加; b) 服控制器数量增加; c) 服务控制器内存容量; d) 服务控制器CPU 强; e) 服务控器前
根据对虚拟存储资源的运行记、趋势的分析,结合应用系的需求,发存储备的脆弱点,有针对性进改进性作,包括但不限于: a) 收集磁盘空间的使用情况,及时清理圾数据或增加存储备容量; b) 监控负载情况,必要时增加硬件数量,或提高硬件规格; c) 监控硬件出错率,换
通过对虚拟存储资源的记录、运行势进行分析,根据应系统的特点和运行需求,提出理或改进的建议和方
9.3.1 服务实施对象和活动
运维对象是虚拟网络资源(虚拟、虚拟网资源、虚拟机络)和网络设备,本活动包括例行操作、响应支持、优化改
重点是对虚拟网络资源的运行状态、运能、资源使分配况进行监控,以便了解其是否满足运要求。监控应当采用合适的装与手段,分配专门员定期或全时段行监控。对虚拟
表7 虚
9.3.2.2 预防性检查
应在监控服务的基础上,拟网络资源行预防性检查。包括:性能检查、脆弱性检查。对虚拟络资源的预防性检查
9.3.2.3 常规作业
虚拟网络资源的
表9
9.3.3 响
针对虚拟网络资源故障引的业务中断或运行效率无法满足正常行求,而进行的响应务,包括但不于: a) 故障定位; b) 虚拟网络资更换; c) 中
根据应用系统运行需要或方、服务相关方的请求,而进行的响服,包括但不限于: a) 加、降低虚拟网络源网络接入数量或速率; b) 更改虚拟网络资源配置; c) 启动、端口或服务; d) 更换、新升级虚拟网络资源硬或件; e) 调配
根据应用系统特点和运需求,对虚拟网络资源进行调整,包但不限于: a) 设或链路负载调整; b) 安全策略调整; c) 监控对象覆盖范围调整; d) 路由策略调整; e)
根应用系统的点和运行需求,过对虚拟网络资源的运行记录、趋的分析,对虚拟络源进行调整、扩容或升级,包但限于: a) 虚拟网络资源调整,CPU 、内存、端口的调配、扩容回收 b) 虚拟网络资源网络架构动; c) 网络架构容量变化,如子系统的增减等; d) 系统功能变化,新增安系统、新增审计系统等; e) 路由协议应用及部署调整; f) 整体安全策略收紧; g) 虚拟网络资
根据对虚拟网络资源的行记录、趋势的分析,结合应用统需求,发现虚拟络资源的脆点,有针对性地进改进性作业,包括但不限于: a) 配置参数优化,例如虚拟网络资源VLAN 、QoS 、ACL 、带等; b) 署路由策略情况下端到
咨询评估服务包括但不限于: a) (整体或局部)虚网络资源实际负与载能力分析; b) (体或局部)拟网络资源预期负荷与承能力分析与建议; c) (整体或局部)拟网络资源架构变动析与建议; d) (整体或局部)拟网络资源路由策略变动分析与建议; e) (整体或局部)虚拟网络资安全略变动分析与建议; f) (整体或局部)虚拟网络资源配置调优分析与建议。 9.4 机房基
机房基础设施、软件和等与传统据中心运维方式一致,参照国标送审稿《信息技术服 运行维护 第4
10 传统数中心与云计算数据
云计算是目前国内外广泛关注的一项技术和用,它具有大规、虚拟、高可靠、高展和通用、按需服务等特。云计算与数据中心相结合,是未一段时间数据中心发展趋势。云计算数中心与传统数据中心运维对象、服务内容等方面存在差异,
表10 传统数中心与云计算数据中
11 运
运维服务实施中,方应要求进行服务报告编制、提交。服
和专题报告
常规报告包括的种类:提交为定时、非定,其内容包括但不限于: a) 报告名称、报告周期; b) 需方、供方
d) 服务象(房基础设施、网络、硬件、软
1) 服务内容;
2) 服完成
4) SLA 标相关
/次数等);
5) SLA 成及未达成情况、安
6) 服务象况分析、隐患及相关的纠
7) 重大事(故障)的分析(对需方业务的影响和成本
踪情况,
8) 趋势分析和预警(事件量、问题、故障时间/次数、影响务的时间/次数); 9) 改进/提升建议。 e)
事件报告内容
b) 需方、供方相关信息; c) 事件描述;
d) 事件生时/地点; e) 事件受理
g) 事件处理结间; h) 事件提出人; i) 事件受理人; j) 事件处理
l) 事件的程度、范围; m) 事件处理情况/
o) 事件因分及建议; p) 后续改进
内容包括但
b)
c) 专存在(或发生/灭失) 所需
d) 专题象(房基础设施、网络、硬件、软
1)
2) 对专对象造成的变动; 3) 时
4) 对其他任可能相的服务内容的影响; 5) 资源协
附录一: 务云服务等级
政务云等级
● 服务描述:政务云服作分解结构层面定义的服务自然态的定义。 ● 服务标准:包括能性、安全性、可靠
● 升级规则:户要求高服务等级或提高供应量或增
理流程。
● 罚则:不能供约定的服务服务供
● 期限:约定的服务起始时该时间内服间隙,以期限延长或缩短处理规程。 ● 角色和职责:服务提方、用户方及其它相关方
及协同
● 联系信息:方相关人等的联系方
● 评估标准:务提供在服务过程中遵循的标准,包括
质量标
政务云运维管理规范 政务云运维管理规范20121122( 试行)
导读:就爱阅读网友为您以下“政务运维管理规范20121122( 试行)”的资讯,希望您有所帮助,感谢您
附件8:
政务云
(试行)
2012年11月
目录
1
引
言 .............................................................................................................................................................. 1
政务云运维管理规
范 ........................................................................................................................................... 2 1 范
围 ....................................................................................................................................................................... 2 2 术语和定
义 ........................................................................................................................................................... 2
2.1 术
语 .............................................................................................................................................................. 2
2.2 缩略
语 .......................................................................................................................................................... 3 3 政
框
架 .................................................................................................
2
.................................. 4 4 政务云业
理组织结
构 ............................................................................................... 4 5 政务云业务运
统 ........................................................................................................................... 4 6 政务云业
象 ................................................................................................................................... 5 7 政务云
程 ................................................................................................................................... 5 8 政务云
务 ..................................................................................................................................... 6 9 政务云系统运
维 ................................................................................................................................................... 6
9.1 计算资源
池 .................................................................................................................................................. 6
9.2 存储资源
池 .................................................................................................................................................. 8
3
9.3 网络资源
池 ................................................................................................................................................ 11
9.4
据 .................................................................................................................... 13 10 传统数据中心与云计算数
容区别 ....................................................................................... 14 11 运维服务报
告 ................................................................................................................................................... 14 11.1 总
则 .......................................................................................................................................................... 14 11.2 常规报
告 .................................................................................................................................................. 14 11.3 事件报
告 .................................................................................................................................................. 15 11.4 专题报
告 .................................................................................................................................................. 15
附录一:
4
板 .................................................................................................
....... 16
引 言
政务云运维管理规范遵循ISO20000和ITSS的基本则,针对政务云的技术构方式、服务应特征、服务评价式,通过基本标准框架下的扩充形成,范政务云运维活动中涉及各类实体,以及这些间的相互关系。组成运维服务管理系的体包括运维服务管对、运维活动角色及运维管组织结构、运维服务管理流程、运维服务支撑系统和运维
政务云
1 范围
本部分规定了政
本部分适用于规政务云运维活动中
5
这些实体间
以下术语
2.1 术语
政务云
在电子政务领域云计算模式提供服务的
运维服务
运维服务是指运维服务供商或运维部综合利用各种IT运维撑工具提供的确保IT基础设施应用系统正常、安
本部分中规范的运维服务括IT基础施运维服务、IT应系统运维服务、安全管理服务、络接入服务、内容
运维服务管理流程
6
运维服务管理流程为了支运维服务的实现和提供,以确定的方式执行发生的一系列
运维服务支撑系统
参与运维的各方为支持运维服标所使用信息工具,支撑运维服务实施
包含每一个配置以配置项之间重要关系
[ISO/IEC20000-1:2005,定义2.5]
工作说明书 statement of work
合同的重要附件之一,细规定了同双方在合同期内应完成的工作,如项目范围、工作描述、进度
服务级别协议 service level agreement
7
服务提供商顾客间签署的记录了服务和
[ISO/IEC20000-1:2005,定义2.13]
外部事件 external events
为服务对象运行提供支的、协议获的、不可控、非自运维的服务资源(例如互联网、市电、租赁的机
系统事件 system events
在运维对象范内的、自主管理或运维的系统资源
8
云运维
群英网
紧随云计算、云存储、云安之后,运维出现了。云运维是拥有深 IDC 运维经验 的广东群网络有限公司所提出的
什么是云运维
云运维这种运维模式打破的传统需要大量工干、 实性差等缺点。 云维服务 模式为用户提供了一种快速部署和用运维系统的方法, 彻
即通过群英维护工程师在云维护平台撑下实现测、 监控、 除的自动化、 智能。 并通过云数据挖掘、 处理、运算手段对工师的工作进行
云运维的应用
在企业内部,用各种物理资源(硬件服务器、软件服务、网络设备、机房控备等) 组成了庞大的产境。 监、 控制和管理大量的理资源成为保证企业正常生产的一个重 要作。 随着云计算术的不断展, 基于云技术的运维系统必将成为一种新的解决方 案,其监的要对象就是这些软硬件施 。当有突发问题时,能及时发问题,解决问 题,保证它们正常地运行。而这一切基本不需要人工
云运维的优势
与传统的运维服务相比,基于云算运维服务实现了三大转。先它变被动为主。 基于云计算的运维服务以各监、 告警、志、报告服务工具为依托, 通过全面的网络式 监控可以及早发现故障隐患, 从而可以建立起主式运维。 次, , 它大幅降低了运本。 云计算运维服务把数据乃至应用程序全部中到端, 也就是数据中心的务器。 对于运 维来说,这意味着量在本地的运维工作转移到云服务器端,运维的总体作量大大减少, 运维
1
转载请注明出处范文大全网 » 智能云运维管理平台方案