范文一:信息存储与管理
信息存储与管理------数字信息的存储、管理和保护笔记(EMC)
1. 存储技术
1) 冗余磁盘阵列(RAID)
2) 直连存储(DAS)
3) 存储区域网(SAN)
4) 网络互联存储(NAS)
5) IP存储区域网(IPSAN
2. 一盒数据中心要实现基本功能(5个核心部件)
1) 应用
2) 数据库
3) 服务器和操作系统
4) 网络
5) 存储阵列
3. CPU
1) 数据逻辑单元(ALU)
2) 控制单元
3) 寄存器(Register)
4) 一级高速缓存(L1 Cache)
4. 存储设备
1) 随机存取储存器(RAM)
2) 只读存储器(ROM)
3) 硬盘(磁性介质)
4) CD-ROM或 DVD-ROM(光学介质)
5) 软盘(磁性介质)
6) 磁盘(磁性介质)
5. 连接逻辑部件
1) PCI协议-----本地总线连接外设一般采用的接口协议
2) IDE/ATA-------磁盘常用接口协议
3) SCSI--------并行接口,连接主机
6. RAID级别
1) 分条
2) 数据镜像
3) 奇偶校验
7. RAID级别
1) RIAD 0:无容错性的分带阵列
2) RIAD 1:磁盘镜像
3) RIAD 3:带专用校验磁盘的并行访问阵列
4) RIAD 4:带独立磁盘和专用校验磁盘的分带阵列
5) RIAD 5:带独立磁盘和分布式校验的分带阵列
6) RAID 6: 带独立磁盘和双重分布式校验的分带阵列
7) 嵌套的:以上RAID级别的组合。如RAID 1+RAID 0
8. DAS 优点和局限性:
DAS前期投资成本低,配置简单并且部署容易和快捷,不存在存储器的互连问题和网络延迟等问题。但是DAS不易于扩展,同时有限的带宽也限制了I/O的处理能力。此外,无法优化资源使用。
9. SAN组件
1) 节点端口(全双工传输模式,拥有一个发送链路和接受链路)
2) 布线(多模光纤MMF短距离传输和单模光纤SMF长距离传输) 3) 互连设备(集线器、交换机和控制器)
4) 存储阵列
5) SAN管理软件
10. FC交换机与FC集线器的差异
可扩展性和性能是两个主要的差异。一个交换机可以使用24位的地址编码,支持超过1500万个设备,但集线器实现的FC-AL只支持最多126个节点。
Fabric交换机在多端口间通过fabric提供全带宽,于是成为了一个可扩展性很强的结构, 可同时支持多点间的通信。集线器提供共享带宽,在同一时刻只可以支持单个通信。集线器提供的是低廉的连接扩展解决方案。交换机则用于建立动态的、高性能的Fabric,可以支持多点间的通信。但交换机却比集线器要昂贵许多。
11. NAS优点
1) 支持全面信息存取。
2) 提高效率
3) 增强灵活性
4) 集中式存储
5) 管理简单化
6) 可扩展性
7) 高可用性
8) 安全性
12. NAS文件共享协议(运行在TCP上)
NFS 基于UNIX的操作系统环境中。
CIFS基于微软windows操作系统环境中。
13. 基于IP网络的传输协议
1) ISCS:基于IP的协议,它通过IP来建立和管理存储设备、主机和桥接设备之间的连接。
ISCSI通过基于IP的网络来进行块级别的数据传输,包括以太网和互联网。ISCSI使
用SCSI协议封装命令和数据。然后使用TCP/IP数据包来进行传送。 2) FCIP
PCIP标准作为一个可管理、能发挥成本效益的方案迅速获得接受,它结合了FC块数
据存储以及成熟并广泛部署的IP基础设施二者的优势。FCIP是一种隧道协议,使分
散的FC SAN孤岛通过现有的IP网络可以透明的在局域网。城域网之间进行互联。FCIP
使用TCP/IP作为其底层协议。
14. BC术语(业务连续性)
1) 灾难恢复:灾难发生时为了支持重要业务操作而进行的对系统、数据和基于架构的
恢复等一系列过程。一旦完成了全部恢复,为确保数据正确必须对其进行验证。 2) 灾难重启动:指利用基于镜像的一致的数据和应用的备份重新启动业务操作的过程。 3) RPO:指中断之后系统和数据必须恢复到的时间点。
4) RTO: 指中断后系统、应用和功能用于恢复的时间点。
15. 故障分析
1) 单点故障:哪些能够终止整个系统或者IT服务可用性的单个部件的故障。 2) 容错:缓解单点故障,系统设计时采用的冗余方式。
3) 多路径软件。
16. 本地复制技术
1) 基于主机的本地复制
1.1) 基于 LVM的复制。一个(LVM包括物理卷、卷组和逻辑卷)
1.2) 文件系统快照
2) 基于存储阵列的复制
2.1) 全卷镜像
2.2) 基于指针的全卷复制
2.3) 基于指针的虚拟复制
范文二:信息的存储与管理
第五讲 信息的存储与管理
主要内容
一、基础知识 计算机信息的表示与存储 计算机信息的分层存储原理
北京大学信息科学技术学院 2005年10月
外部存储设备的结构特点和工作原理 文件系统 数据库系统 二、应用知识 Microsoft Excel
1 2
一、基础知识
计算机信息的表示与存储 计算机信息的分层存储原理 外部存储设备的结构特点和工作原理 文件系统 数据库系统
1.1 计算机信息的表示与存储
信息的保存、信息的共享与传播、信息的查找与使用
大脑:兴奋/知觉/多次刺激/联想记忆/遗忘(随时间而衰亡) 纸张等其他介质:传播、复制、修改、查询 计算机信息存储:数字化信息,网络传输与共享
3
4
1.1 计算机信息的表示与存储
计算机信息的表示与存储
计算机通过二进制数0/1序列来表示信息 计算机存储设备:利用半导体固态材料、磁性材料、光学材料和其他各 种可兹利用的物理介质 根据材料的不同,有些设备需要电源才能保持存储能力(硅半导体存 储),有些则不需要(铁磁存储、光存储) 存储设备(半导体/磁性材料)使用电磁力保持物质状态( 0 or 1),从而达 到存储信息的目的,一般不会由于外界干扰力而丢失,不会因时间而衰亡; 外界使用 ‘读’命令,可以读出其状态 0 or 1,但不破坏其原有物质状态; 外界使用 ‘写’命令,可以改变其状态 0 or 1,使其物质状态发生变化 (0 1 or 1 0);
5
1.1 计算机信息的表示与存储
物理的存储部件和配套的控制设备是计算机存储系统的物 质基础(存储器的硬件),它们和配套的软件一起,共同构成 了计算机的存储系统。
6
1
1.1 计算机信息的表示与存储
存储容量的量化单位
位(bit):计算存储的基本单位,表示0/1的基本单位 字节(Byte):8个bit为1字节 千字节(KB):存储容量一般使用2的整数幂次,所以 10 1KB表示的是2 = 1024个字节。 20 兆字节(MB,Mega Byte):百万字节,2 字节 30 千兆(吉)字节(GB,Giga Byte):十亿字节,2 字节 40 兆兆字节(TB,Tera Byte):万亿字节,2 字节 通常在市场上购买存储设备时,其标出的容量单位是按十 进制换算的。粗略地1KB=1000B,1MB=1000KB,1GB= 1000MB,1TB=1000GB。 7
1.2 计算机信息的分层存储原理
计算机系统基本结构
8
1.2 计算机信息的分层存储原理
与信息存储有关的部件
CPU
(寄存器)
1.2 计算机信息的分层存储原理
存储器硬件的金字塔结构
高速缓存
主存储器
外存储器
主存储器里存放正在运行的程序和数据,而在外围存储 器(外存,包括硬磁盘、软磁盘、光盘、和磁带等)则存放 着更大量的备用信息。计算机系统所需要的系统软件和应用 软件都
存储在外存储器中。
9
速 度 越 来 越 快
寄存器
高速缓存 主存储器 软磁盘 硬盘
其它外存设备
容 量 越 来 越 大
10
1.2 计算机信息的分层存储原理
寄存器
位于金字塔顶端的是计算机中工作速度最快又最紧缺的 存储资源:CPU中的“寄存器”。“寄存器”是高速存储单 元,其工作速度与信息处理的运算部件合拍,一次存取 数据所花费的时间大约是从一纳秒到十纳秒的量级。从 信息传输的通路上看,寄存器与处理部件距离最 近,处 理部件执行指令时一般都直接对寄存器进行操作。这样 的寄存器制作成本很高,一个CPU芯片中通常只配备几十 个寄存器(也有的芯片含寄存器数量更多一些)。
11
1.2 计算机信息的分层存储原理
主存储器
从塔尖往下一个层次,是主存储器(常简称为“主存”或“内 存”),计算机系统工作时主存里存放着与当前工作有关的程 序和数据。主存储器目前采用超大规模集成电路技术制造的 半导体存储芯片组成,主存储器访问一次(读写一次)的时 间通常在几十纳秒的数量级。今天主存的存储芯片一般被安 装制成标准存储模块(俗称“内存条”),以一个(或一组) 模块为单位安装到计算机印制电路板(例如微机的主机板) 的标准插槽里。有限数量的主板存储模块插槽对计算机的主 存储器最大容量是一种限制。计算机系统一个重要功能指标 就是主存容量的大小,在其他指标相同的情况下,主存储器 大的计算机能够运行更大的程序,速度也更快。 12
2
1.2 计算机信息的分层存储原理
高速缓存
与 CPU 工作节拍相比,主存储器的速度显得太慢(“速度比”一般是 一比十),这种情况使主存访问速度成为制约 CPU 能力发挥的一个主 要因素。由于 CPU 每执行一条指令都要由存储器取指令,指令执行中 还可能需要存取相关数据。也就是说,在一条指令执行过程中,CPU 可能几次访问主存储器,访问花费的时间当然都是指令执行所花费时间 的一部分。由于主存储器跟不上 CPU 的节拍,那就会使 CPU 空闲等待。 虽然今天已经有制造速度更高的存储器的技术,但由于生产成本过高, 不适宜用于生产大容量的主存储器芯片。 为了缓和CPU与主存储器之间的速度矛盾,在 CPU 和主存储器之间 设置一个缓冲性的高速存储部件(硬件),这个部件称为高速缓存(简 称“缓存”,英文词是cache)。 命中和失误
13
1.2 计算机信息的分层存储原理
外部存储设备
金字塔中,位于主存储器下面一个层次的是各种外围存储设 备,包括常见的磁盘、磁带、光盘存储器等。这些存储器的 共同特点是存储容量大,单位存储价格便宜。外存储器采
用 磁性的或其他的方式存储信息,其存储方式的一个重要特点 就是非易失性,不需要外部提供能量就可以保持存储媒介上 的信息不丢失。另一方面,这类存储设备的数据访问速度比 主存储器慢得多。外存储器的这些特点正好与主存互为补 充,共同支撑着整个计算机存储体系的有效功能。
14
1.2 计算机信息的分层存储原理
1.3 外部存储设备的结构特点 和工作原理
软盘及软驱 硬磁盘 磁带及磁带机 光盘及光盘驱动器 优盘及闪存卡
CPU
(寄存器)
高速缓存
主存储器
外存储器
寄存器、高速缓存、主存储器是计算机系统进行信息处理时 所需要的临时信息存储设备,因此,这类往往需要加载电源 才能工作,一旦掉电,就不能保存任何信息。而外存储器则 往往具有非易失性,不需要外部提供能量就可以保持存储媒 介上的信息不丢失。
15
16
1.3 外部存储设备的结构特点 和工作原理
读写头
1.3 外部存储设备的结构特点 和工作原理
铁 磁 体 的 工 作 原 理
17
面surface,道track,扇区sector,柱面cylinder
磁性外部存储设备的基本结构
18
3
1.3 外部存储设备的结构特点 和工作原理
软盘
外观(图示) 金属片滑门 驱动磁盘旋转的卡子 写保护 磁道,扇区和柱面 尺寸、容量 5.25:360K/1.2M 3.5:1.44M/2.88M
1.3 外部存储设备的结构特点 和工作原理
软盘的读写
软盘驱动器的读写操作方式与软盘存储结构有紧密关系。 在软盘上存储信息是以区段(扇区)为信息单位成批进行的。一个区段的 位置(地址)由它所在的盘面编号、磁道编号和区段在磁道中的位置(编号) 三者联合确定。 当需要读写某区段的信息时,首先需通过机械动作把磁头移到相应的磁道 位置,然后磁头静止不动在原地等待,直到软盘上要读写的区段旋转到磁头 下的时候,实际的读写操作才开始进行。 由此可见,磁盘读写动作过程分为三个阶段:磁头定位、区段定位和实际 读写。每个阶段花费的时间长短很不相同:完成第一个阶段所需时间依赖于 执行前磁头的位置与被读写区块所在的磁道两者之间的间隔距离;在第二个 阶段,由于等待磁盘旋转,所需时间依赖于磁头移到该磁道时目标区段的实 际位置,平均为软盘旋转一圈时间的一半。与主存访问速度(小于0.1 微秒) 相比,软盘平均读写速度实在是太慢,有100万倍左右的速度差。(同一柱 面的内容读写——磁头无须移动,可加快速度) 20
软盘外观与结构
19
1.3 外部存储设备的结构特点 和工作原理
软盘的使用注意事项
软盘的使用有一些必须注意的事项,如果不注意很可能导致软盘 损坏,造成信息丢失,有后果可能很严重,甚至是
不可弥补的。 首先,不应使手指或其他物体直接接触磁盘的磁性表面。 第二,应当尽量避免灰尘,落在磁盘表面上的灰尘可能导致磁 头将磁性薄膜划伤,导致部分信息丢失,也可能使整个软盘报废。 因此,软盘用完后应及时放入封闭的盒子里。 第三,软盘不宜靠近强磁场。强磁场能够导致磁性材料被磁 化,使原存储的信息消失。 第四,软盘不宜重压或弯折,不宜在过热或过冷的环境里存 放,以免损坏。在软盘使用中还要注意轻拿轻放,插入驱动器时应 轻推。 此外,当一个软盘上已经存储了重要信息时,应该及时贴上防 写入封条或拨好防写入滑块,防止无意中破坏了存储的信息。
21
1.3 外部存储设备的结构特点 和工作原理
硬盘
在硬盘机里有一组(若干片)固定在同一个轴上,同时高速 旋转的硬盘片。盘片是铝合金的薄圆片,每个圆片的两个表 面都涂附了一层很薄的高性能磁性材料,作为存储信息的介 质。象软盘一样,硬盘片表面也分为一个个同心圆磁道,每 个磁道又被分成若干区段,只是硬磁盘的存储密度比软盘高 得多。以普通微机常用的 3.5" 硬盘为例,其每个盘片表面可 能划分为 1000 个甚至更多的磁道,每个磁道又分为几十上百 个区段,因此一个盘片的存储容量就非常可观。靠近每个盘 片的两个表面各有一个读写磁头。这些磁头全部固定在一 起,可同时移到磁盘的某个磁道位置。与软盘一样,硬盘的 所有盘面处于同一半径的所有同心圆磁道构成一个柱面,这 些柱面由外向里顺序编号。 22
1.3 外部存储设备的结构特点 和工作原理
硬盘外观
1.3 外部存储设备的结构特点 和工作原理
硬盘读写
硬盘也采用批量存储信息方式,以区段(扇区)为存储单 位。区段的“地址”可以通过磁道(柱面)号、读写头号(也 就是盘面的编号)、以及磁道内的区段编号三者组合确定。 访问硬盘信息的过程与访问软盘一样,也分为移动磁头到 相应柱面位置(磁头定位)、等待(区段定位)和实际读写 三个阶段。硬盘的磁头动作速度快、盘片转速高,因此它的 信息访问速度大大高于软磁盘。今天常见的高速硬盘,平均 访问时间在几毫秒到十几毫秒之间,是软盘速度的几十到一 百倍。但是也应当看到,即使如此,硬盘访问速度与主存访 问速度之间仍然有一万倍以上的速度差。 24
硬盘结构
23
4
1.3 外部存储设备的结构特点 和工作原理
硬盘的总线连接方式
在计算机系统中,硬磁盘通过电缆与一个叫做磁盘控制器的部件连 接,磁盘控制器直接连在计算机系统总线上。 一般磁盘控制器集成在主板上。目前最常用的磁盘控制器有两个标准
系列。一是微机广泛使用的 IDE(Integrated Drive Electronics)标准及其升 级标准(Extended IDE )等;另一个是网络服务器和工作站上广泛使用的 SCSI(Small Computer System Interface)及其升级标准。 IDE 控制器最多能连接两个硬盘设备,E-IDE 控制器可以连接四个硬 盘设备,而 SCSI 控制器能够连接不超过七个硬盘设备。 IDE 控制器与硬盘之间的信息传输速度最高为每秒 8MB,E-IDE 速度 可以达到16.6MB/秒,而 SCSI 控制器的速度更高得多,最高可以达到 100MB/秒以上。性能比较高的计算机较 多采用SCSI 控制器,但 SCSI 控制 器以及与之相配的硬盘在价格上比 IDE 和 E-IDE 设备高出许多。 25
1.3 外部存储设备的结构特点 和工作原理
硬盘的逻辑分区
在微机上,硬盘的命名符号依次被规定为C盘、D盘、… 等。随着技术的进 步,硬磁盘存储容量越来越大,磁盘信息 管理的难度也随之增大。为此人们开发了一套技术,可以把 一个大的硬盘划分为若干个较小的“逻辑盘”,当作多个盘使 用。这样做实际上是把一个“物理的”、实在的硬盘划分成几 个存储部分,使每个部分用起来就像是一个独立的硬盘一样。 从计算机用户的角度看,这些逻辑盘与真正的硬盘没有任何 差别,它们也各被赋予一个名字(盘符,例如C、D、E、F 等),可以象普通硬盘一样使用。硬盘如何划分完全由计算 机系统管理者根 据系统需要确定。微型机的大硬盘通常也划 分为多个逻辑盘。
26
1.3 外部存储设备的结构特点 和工作原理
磁带的工作原理
数据磁带存储信息的方式与录音机磁带相仿,磁带从固 定的磁头下面滑过,电信号流经磁头时产生的磁场使得磁 带的某些部分被磁化,将信息记录在磁带上,信息读出的 过程正相反。但数据磁带上记录的是数字信息,也就是二 进制形式的信息,不像录音磁带,那里记录的是模拟形式 的信息。磁带作为数据存储介质需要专门和计算机连用的 磁带机。
27
1.3 外部存储设备的结构特点 和工作原理
磁带的外观:盒式与盘式
磁带信息存储方式
28
1.3 外部存储设备的结构特点 和工作原理
磁带的特点
磁带作为存储介质的一个主要缺点是信息查找速度慢。 当计算机要访问磁带时,必须先向前或向后快速卷动磁带, 把要访问信息(块,区段)的开始位置移到磁头下面,这个 过程称为磁带定位,定位完成后才能进行正式的读写。磁带 定位时间依具体情况而定,常常要数秒钟或者更长时间。但 磁带在高速运动起来以后读写速度也相当快,高性能磁带机 可能达到每秒几兆字节。所以磁带是一种适合顺序读写,而 不适合做那种需要反复前后查找后再读写的介质。
29
1.3
外部存储设备的结构特点 和工作原理
光盘
光盘存储器(简称“光盘”)是利用激光原理存储和读取 信息的媒介。光盘片用塑料制成,塑料中间夹入了一层薄而 平整的铝膜,通过铝膜上极细微的凹坑记录信息。 早期光盘里的信息是光盘制作时在盘面上一次性形成 的,只能读出 使用,不能重新写入。工厂通过压制方法生产 光盘时,将信息以凹坑形式生成在铝膜上,成为永久的信息 记录。一片普通5”只读光盘可以存放650MB的信息。只读光 盘是一种非常好的可以长期保存的存储介质,今天许多商品 软件和信息资料都被制成光盘销售。 现在另外一种较常使用的光盘是可刻录光盘,但数据一 旦进入光盘,其所占用的空间是不能释放的。 目前,可读写光盘也已投放市场,但价格非常贵。 30
5
1.2 外部存储设备的结构特点 和工作原理
光 盘 外 观
1.3 外部存储设备的结构特点 和工作原理
优盘和闪存卡
优盘,又称闪存卡,是一种采用闪存(Flash Memory)和 USB(Universal Serial Bus)接口技术相结合的存储设备。 闪存是一种学名为EEPROM (Electrically Erasable Programmable Read Only Memory)的半导体存储设备,微型计 算机主板上的BIOS芯片就是一种电可擦写的闪存芯片。 USB是一种能够保证把计算机内部的IDE硬盘总线与外部 的存储设备互连互通的接口技术。 优盘类似于磁盘存储,具有非易失的存储特点,在无电源 的条件下所存储信息也不会丢失。优盘比软盘和光盘的尺寸 更为小巧,便于随身携带,是一种很好的移动存储设备。
32
光盘表面:0/1
光盘驱动器工作原理 31
1.3 外部存储设备的结构特点 和工作原理
优盘和闪存卡:16M ~ x G
1.3 外部存储设备的结构特点 和工作原理
外部存储设备与计算机的连接方式
软盘:软驱 光盘:光驱 硬盘 ― 固定硬盘:数据总线 ― 移动硬盘:USB接口 磁带:磁带机 优盘:USB接口
33 34
移动硬盘
1.4 文件系统
外存储设备(硬件)构成了信息存储的物质基础,怎样将 物理存储的信息有效地组织和管理起来,便于人们使用,是 计算机系统必须面临的一个重要问题。在计算机系统中,是 通过文件和文件系统(软件)来组织和管理存储在外存储设 备(硬件)上的信息的。
1.4 文件系统
一个文件指的是包装在一起的一组信息,这些信息保存 在外存储器中,存储在一起,作为一个整体被命名,可以独 立地被使用、修改、更新和删除,一个文件通常总是和与它 有关的某些应用工作联系在一起的。 一个文件的内容可以是一个能运行的应用程序、一篇文 章、一个图形、一段数字化的声音信号、或者任何一批相关 的有用数据,如此等等。 文件
的大小用这个文件所包含信息的字节数来计算。
35 36
6
1.4 文件系统
外存储器中总是存储着许多文件,其中很多文件是计算 机系统工作的基础,包括各种程序(各种系统软件和各种 应用程序等),程序工作时所需要使用的各种数据。 文件是计算机系统的重要资源。在存储时,除了文件本 身的信息内容外,系统里还需要存储与文件相关的一些重 要属性信息,包括:
文件名:文件的名字 类型:所存储的信息类别 位置:信息在存储器中存放的位置 大小:文件的长度,用字节数为单位计算 其他:文件创建者、创建时间、修改时间,等等
37
1.4 文件系统
文件的分类
文本文件 二进制文件:应用程序、图形/图像文件、声音文件、…
可执行文件 数据文件
与应用软件匹配的各种类型的数据文件 例如:Word - *.doc
38
1.4 文件系统
文件管理是由“文件系统”软件(它是操作系统的一个子 系统,文件管理也是操作系统的一项基本工作)完成的。 文件系统涉及计算机的文件的结构和文件的组织,以及负 责管理文件的软件系统,一般把这两者的总和称为计算机 的文件系统。文件系统需要解决两个方面的问题: 一方面要能够有效地利用外存储器硬件的存储能力, 适应多种外存储设备的硬件的不同工作方式和特点; 另一方面,要为文件的管理以及在文件上的各种各样 的操作提供有效地支持。
39
1.4 文件系统
文件的组织结构
目前,在各种操作系统里,都采用同样的方式来分类组 织文件:用一种称为目录(Directory)或文件夹(File Folder)的分层树状结构把文件组织起来,使各种文件分散 到目录结构的不同位置,以利于对文件的分类管理和使用。 相关概念 路径/目录/文件夹(path) 父目录 子目录 文件名 当前目录/当前盘
40
1.4 文件系统
管理文件结构的软件系统
文件的创建、命名、更改、删除 文件的类型、属性等的管理 目录(文件夹)的维护管理 文件在磁盘中的存储空间管理:分配、空间整理 在应用程序中对文件的操作支持
1.5 数据库系统
对数据进行有效的组织、管理和维护,可以充分发 挥数据资源的作用,让它为更多的人所使用。 文件内部数据内容的组织: 顺序存储:内容增加,关系复杂→文件更新、维 护困难 更好地表示复杂数据→通用数据管理模式:数据 库及数据库管理系统
41
42
7
1.5 数据库系统
数据库(Database):为了满足一定范围里许多用户的
需要,在计算机内建立的一组相互关联的数据集合。 档案柜 抽屉(放资料卡片) 卡片上的多项栏目资料
1.5 数据库系统
学生管理数据库 系别表 班级表 学生表 系编号 系名 系主任 … 班
级编号 班级名称 专业 年级 … 学号 姓名 籍贯 出生年月 …
卡片(由多项栏目资料组成) 数据库(Database) 数据记录(Data Records)
关系表(Relation Tables) 数据项(Data Items)
43
00508010 张三 江西吉安 1988年12月 …
44
1.5 数据库系统
数据库管理系统(Database Management System,DBMS): 支持建立和管理数据库的系统软件,它负责对数据库做严格 的管理和控制,以保证数据库安全和数据库内容的完整。
统一的结构化查询语言(Structured Query Language,SQL) 多层次数据存取访问接口 运行日志服务 数据库的维护 常见DBMS系统: dBase、FoxBase、FoxPro Oracle/SQL Server/DB2/Infomix/Sybase/Access Excel
二、应用知识
Microsoft Excel 基本概念 对表格数据的操作
45
46
2.1 Microsoft Excel
——基本概念
Excel是Microsoft Office系列办公软件之一,称为“电子表 格处理软件”:提供灵活的表格处理功能,尤其是各种基本 的数据统计和分析功能。 安装与启动 获取帮助并通过帮助学习Excel。
2.1 Microsoft Excel
——基本概念
工作簿:一个Excel文档,由若干个工作表组成 工作表(Sheet):一个电子表格
对工作表的一些操作:
表格数据的填写 插入工作表 删除工作表 移动或复制工作表 重命名工作表 隐藏工作表 工作表背景
姓名 王伟 马宏军 李牧 丁一平 李亚 刘博 张姗 陈霞
性别 男 女 女 男 男 男 女 女
系别 数学 物理 生物 心理 物理 化学 数学 生物
语文 81 77 90 85 68 74 79 88
英语 62 74 69 81 88 76 90 85
计算机 95 88 86 78 74 83 84 92
Excel的很多概念、使用方式与Word、PowerPoint 是一样的。
47
48
8
2.1 Microsoft Excel
——基本概念
Excel中数据的表现(格式)
样式/单元格格式:数值、日期、百分比等(从样式而 来);字体;边框等 行:高度 列:宽度 条件格式:按照一定的条件设置单元格的字体、背景色等。 自动套用格式:对选中的区域套用模板格式
2.1 Microsoft Excel
——对表格数据的操作
利用公式对数据进行处理
公式输入 在公式中引用单元格地址 在公式中使用函数 将一个公式作用于整个行/列
常用函数
ABS INT MOD ROUND SIGN AVERAGE COUNT MAX MIN SUM IF COUNTIF LEN MID
50
49
2.1 Microsoft Excel
——对表格数据的操作
数据分析 排序:针对列(变量、域段) 数据筛选:针对列(样本、记录) 有效性:针对任意单元格,限定取值范围 ……
2.1 Microsoft Excel
——对表格数据的操作
窗口功能 拆分窗口:将屏幕拆分为多个窗口,可同时 对同一工作表的不同部分进行操作。 冻结窗口:将部分内容一直呈现在屏幕中 (即滚动条对选定内容不起作用)
51
52
2.1 Microsoft Excel
——对表格数据的操作
数据转换
文本数据转换为Excel表格:需用
Tab分隔,直 接拷贝 Word中表格转为Excel表格:直接拷贝 将已有Excel表格插入Word/PowerPoint:将 Excel文档作为插入对象
2.1 Microsoft Excel
——对表格数据的操作
图表操作:图表类型的改变等(直方图、饼图、曲线图等) 依据Excel表格,在Word/ PowerPoint中生成图表: 插入对象——Microsoft Excel图表 或 Microsoft Graph 2000图表。 在PowerPoint中插入Excel表格:插入对象—— Microsoft Excel工作表 。
53 54
9
总结
计算机信息的表示与存储 计算机系统的分层存储结构 外存储设备的工作原理 文件系统 数据库系统 Excel
55
课堂测验
结合学习和上机练习,谈谈你对操作 系统的理解,包括其组成、功能以及在 计算机软硬件系统中地位和作用。
56
书面作业
教材第200页1(1) 交作业的方式为将答案写在word文件中, 作为邮件的附件发给本班辅导老师。
上机作业
Excel.rar文件
57
58
10
范文三:论文信息存储与管理
数据的重要性已经得到用户的广泛重视,存储领域也能够逆整个IT的颓势而前行。因此,存储被认为是继PC、服务器之后,带动整个IT向前发展的又一潜力巨大的增长点。什么是网络存储?经历过电脑运算能力和网络联通能力两次快速发展,目前人们对网络的需求不再满足于连通能力,而是更为强大的信息管理能力。随着越来越多的关键信息转化为数字形式并存储在可管理的介质中,网络对于存储和管理信息的能力产生了新的需求。可以这样说:网络是否具有高的效率,取决于其数据存储和管理的能力。在网络存储决定网络架构的今天,IT行业已经从PC、网络步入了以存储为核心的时代。
随着互联网发展进程的加快,信息资源网络化成为一大潮流,与传统的细细资源相比,网络信息资源在数量,结构,分布和传播的范围,载体形态,内涵传递手段,等方面都显示出新的特点。这些新的特点赋予了网络信息资源新的内涵。作为知识经济时代的产物,网络信息资源也称虚拟信息资源,它是以数字化形式记录的,以多媒体形式表达的,存储在网络计算机磁介质,光介质以及各类通讯介质上的。 早期的存储系统是计算机系统的一部分,大多以存储设备形式出现。计算机系统可以通过总线连接到磁盘,或者通过输入/输出系统与磁盘系统相连,或者是计算机基本上是以单机方式工作的。随着网络的发展,数据的存储也逐渐由单机
向多机方式和专用机发展,数据的共享与传递也逐渐从依赖主机系统向依赖网络系统发展。当前,应用业务系统有向多服务器、多数据源演变的趋势。在大型企业应用和Intemet发布系统中,安装数十台服务器已经很常见。但过于分散的数据资源,会给访问和管理带来困难。因此,数据存储问题备受关注。存储系统大致可以分成三种类型:
(一)直接依附存储系统(DAS)。特征为存储设备是通用服务器的一部分,该服务器同时提供应用程序的运行。
(二)网络依附存储系统(NAS)。这种存储方式多采用专用数据服务器。该服务器不再承担应用服务,称之为瘦服务器。数据服务器通过局域网的接口与应用服务器连接。由于采用局域网上通用数据传输协议。
(三)存储区域网络(SAN)。存储区域网络SAN采用高速数据连接通道光纤通道连接服务器和存储系统。从结构上看,服务器和数据存储系统相互独立。将设备连接到FC集线器或交换机上,便于扩展系统规模。FC的传输速率和可靠性极高,能够满足当前视/音频业务的需求。
网络信息资源的特点分别是:存储数字化、表现形式多样化 以网络为传播媒介、数量巨大,增长迅速等网络信息资源就是通过计算机网络可以利用的各种信息资源的总和。目前网络信息资源以因特网信息资源为主,同时也包括其他没有;连入因特网的信息资源。
网络信息资源在我们地社会发展中将日益占据主导地位,网络信息资源的管理水平将直接影响到它的合理利用,只有对网络信息资源进行有效的管理,才能使网络信息环境变为有序的信息空间,实现信息资源效用的最大优化。
范文四:信息存储与管理试题
信息存储与管理试题
1. 某医院使用了一个应用程序,把病人的X射线数据以大二进制对象的方式存储在Oracle数据库中。该应用程序运行在一个UNIX服务器上,并且医院的员工可以通过一个光纤骨干网来访问X射线数据。存储阵列为服务器提供了6TB的可用存储容量。
(1)请阐述该数据中心的核心部件并画出其数据中心的架构图; 五个核心要素包括:
应用程序 — 用于操作通常存储在数据库中的数据的特殊专用软件
? 数据库 — 更常见的是数据库管理系统 (DBMS),它提供一种结构化的数据存储方法,将数据存储在按逻
辑组织的表中,这些表之间存在关联。它们优化了数
据的存储和检索
? 服务器/操作系统 — 提供运行应用程序和数据库所需的计算平台
? 网络 — 在客户端与服务器或服务器与存储之间提供数据通信路径
? 存储阵列 — 存储数据和信息的地方
器 和
Oracle数
据库 X射线数据
(2)阐述一下病人数据的价值如何随着时间变化。
2. 阐述存储系统环境由哪几部分组成?
存储系统环境由主机,连接和存储设备三部分构成。
主机是用户通过应用程序来存储、检索数据运行这些应用程序的的计算机。一台主机包括一组使用逻辑部件(软件、协议)进行相互通信的物理部件(硬件设备)。
连接指的是各个主机之间或者主机同其他外围设备(如打印机、外存设备)之间的互连。连接的部件可分为物理的和逻辑的。物理部件指的是连接主机和外存的硬件;逻辑部件指的是用于主机和外存之间通信的协议。
存储设备常见的有磁带,磁盘,软盘,CD-ROM ,闪存卡 ,磁盘驱动器
3. 阐述只能存储系统的组成并说明每部分的作用。
智能存储系统是具有下列特征的 RAID 阵列:
一,针对 I/O 处理进行了高度优化。
二,有提供以下功能〔缓存的智能管理 ,阵列资源分配,对阵列资源的主机访问,适用于异构主机的连接,基于阵列的本地和远程
高级复制选项〕的操作环境,该操作环境可被视为阵列的―操作系统‖。
智能存储系统由四部分组成:前端、缓存、后端、物理磁盘。
4. 请比较直连存储DAS、网络连接存储NAS、光纤通道存储区域网络SAN、Internet 协议存储区域网络 IP SAN各自的特点。
5. 什么是内容寻址存储?
6. 什么是虚拟化技术?有哪些实现形式?
7. 什么是业务连续性?为什么要保证业务连续性?为保证业务连续性需要用到哪些技术?
⑴ 业务连续性是指做好充分准备,能够轻松应对会对业务运营造成不利影响的应用中断并从中进行恢复。
⑵ 在计算宕机成本时,需要考虑许多因素。计算中断成本的公式应当计算损失的员工生产力和损失的销售收入这两方面的成本。
⑶ ①本地复制,本地复制通常使用复制副本磁盘设备。这极大地加快了恢复过程,因而最大限度地减小了 RTO。频繁的时间点复制副本也有助于最大限度地减小 RPO。
②远程复制,生产设备上的数据被拷贝到相隔一定距离的另一阵列上的目标(复制副本)设备集
为达到几乎为零的 RPO 和非常小的 RTO,生产设备和目标设备始终保持同步。
在生产设备发生故障时,应用程序可以继续从目标设备运行 ③备份/恢复,是一种广泛使用的数据副本保存方法。在因为中断或其他事件而发生数据丢失时,可以将数据恢复为最新的备份。不断发展的技术现在能够实现速度更快的磁盘备份。
8. 什么是本地复制?本地复制的两种主要技术是什么?
⑴本地复制是指在同一个阵列内或同一个数据中心内复制数据。 ⑵两种主要技术包括:① 基于主机的复制镜像的逻辑卷,建立镜像的优点在于,可以在读取时实现高可用性和负载平衡(如果使用并行策略)。建立镜像的成本在于:每次写操作都要执行两次写入,这需要额外的 CPU 周期,因此完成写入所需的周期时间更长;② 基于存储阵列的本地复制。复制由阵列操作系统执行,副本位于同一个阵列上,通常,基于阵列的复制在阵列设备级别执行。
9. 什么是远程复制?远程复制的两种基本模式是什么?
⑴ 远程复制是在远程站点(位置)创建信息资产副本的过程。可以帮助组织减轻由自然或人为因素导致的区域性停机所带来的损失。
⑵ 远程复制的两种基本模式:同步模式和异步模式。
①同步模式:副本与源在任何时候均相同 – 零 RPO。先在源站点和远程站点上提交数据,然后再向主机确认完成写操作。
在向主机发出写操作完成信号前,任何对源的写操作都必须传送到远程站点并经过其确认。直到完成并确认先前的每个写操作之后,才能进行其他写操作。必须首先确定已在远程副本和源上完成写操作,然后才能向主机确认,以确保源和远程副本在任何时候都具有相同的数据,始终保持写操作顺序,副本收到写操作的顺序与源完全相同。同步复制提供最低的 RPO 和 RTO,目标是零 RPO,RTO 与在远程站点上启动应用程序的时间一样短。 ②异步模式:副本比源滞后一定时间 – 低 RPO。源收到写操作后立即向主机确认。数据被缓冲,然后在网络功能允许的情况下转发到远程站点,有些供应商维护写操作顺序,有些供应商不维护写操作顺序,但确保副本始终是可重新启动的一致映像,远程站点的数据以有限 RPO 滞后于源;RPO 通常是可配置的值。异步复制的主要优势是不会延长响应时间。异步复制通常用于跨远距离的部署。响应时间优势与有限 RPO 相抵。
10. 为确保存储基础设施的安全,我们可以采取哪些措施? 要确保底层 IT 基础架构关键业务应用程序正常运行且性能最优统监视是必不可少的。监视运行状况,容量,性能,安全性,服务器,SAN,存储阵列,存储网络,以及将数据中心作为一个整体进行监视。
范文五:EMC信息存储与管理(要点总结)
Summarized by NIRVANA 新浪微博:Win都是XP
EMC 版 信息存储与管理
第一部分 存储系统
Chapter 1 信息存储与管理的介绍 信息存储
数据增长因素
数据处理能力的上升 ? 数字存储成本的低成本 ? 可负担的和更快的通讯技术
?
有价值的数据:地震、生产数据、客户数据、医疗数据
数据类型
结构化数据:按行和列这种严格的格式组织。数据库存储系统存储 ? 非结构化数据:不是按行列存储。如便签、商业名片、数字格式名片
?
信息:从数据中提取出来的知识
存储:目的是在进一步处理时可以进行访问
存储技术特点和架构发展
存储技术突出点:
冗余磁盘阵列(redundant array of independent disk,RAID)在DAS、SAN等存储架构中都有使用
? 直连存储(Direct-attached Storage,DAS)存储设备直接连接到服务器(组)。
? 存储区域网(Storage Area Network,SAN)专用的、高性能的光纤通道网络,用来完成服务器和存储设备之间块级别的通信。存储设备被分区并指定给不同服务器,从而被分别访问。主要为文件服务类应用提供存储服务
?
网络互联存储(Network-attached Storage,NAS)专用于文件服务类应用的存储设备。通过现有的通信网络(LAN)连接,并未不同客户提供文件访问
? IP存储区域网(IPSAN)是SAN和NAS的继承。提供了在局域网和广域网上的块级别传输
?
数据中心基础设施(包括:计算机、存储系统、网络设备、专用备用电源、环境控制设备)
核心部件:
? ? ? ? ?
应用 数据库
服务器和操作系统 网络 存储阵列
数据中心部件的关键需求
? ? ? ? ? ? ?
可用性 安全性 可扩展性 性能
数据完整性 容量 可管理性
管理存储基础设施 监控 ? 报告 ? 供应
?
信息管理中的挑战
数字世界的爆炸 ? 书信息依赖的上升 ? 信息价值的改变
?
信息生命周期:随着时间变化而发生的“信息价值的改变”
信息生命周期管理(Information Lifecycle Management,ILM):一种主动的策略,允许一个IT组织根据预先定义的商业策略来高效地管理数据的整个生命周期,并通过优化存储基础设施来实现最大的投资回报。 其特征:
? ? ? ? ?
以业务为中心 集中式管理 基于策略的 异构的:一个ILM策略应该把所有类型的存储平台和操作系统都考虑进来 优化的
其实现: 分类 ? 实现 ? 管理 ? 组织
?
其优点:
? ? ? ? ?
更高的资源利用率 简化的管理 更广泛的选择 维护约定
更低的总拥有成本(TCO)
Chapter 2 存储系统环境
存储环境的组成(主机、连接、存储设备)
主机(物理部件、逻辑部件)
物理部件: CPU
? 存储设备 ? I/O设备
?
连接(主机与外围设备的互连。物理部件、逻辑部件)
连接的物理部件(总线(分为系统总线和I/O总线)、端口、电缆)
串行:比特位在单个通道中按顺序进行传输 并行:比特位同时在多个通路中进行传输 连接的逻辑部件(协议)
PCI:规定了PCI扩展卡与CPU如何交换信息 ? IDE/ATA:磁盘最常用的借口协议
? SCSI :最初用于并行借口,现在功能更多。
?
磁盘驱动部件
核心部件:盘片、主轴、读写头、驱动臂、控制器
磁盘驱动器的性能(寻道时间、旋转延迟、数据传输速率)
?
寻道时间:读写头在盘面上移动进行定位的时间。(全程时间、平均时间、相邻磁道时间)
旋转延迟:盘片旋转以定位读写头下方的数据所用的时间
? 数据传输速率:每个单位时间磁盘能够传输到HBA(主机总线配置器)的平均数据量
?
影响磁盘性能的基本准则 将磁盘看成两部分:
队列:用于存放等待I/O控制器处理的I/O请求 ? 磁盘I/O控制器:依次处理队列中的I/O请求
?
两定律:
Little定律:N=a×R ? 利用率定律:
U=a×Ns
?
主机的逻辑部件:
? ? ? ? ?
操作系统(OS)
设备驱动(Device Driver)
卷管理器(LVM):运行在物理机器上管理逻辑与物理存储设备的软件。可划分和合成磁盘空间。基本部件:物理卷、卷组、逻辑卷
文件系统(File System):通过使用目录把大量文件的分层组织结构。常见文件系统:FAT32、NTFS、UFS
应用:提供计算机操作逻辑的计算机程序。数据访问:块级别访问、文件级别访问
应用程序的需求和磁盘的性能 入手点:
分析最高负载时产生的I/O数量 ? 记录下应用程序I/O大小或是块大小
?
Chapter 3 数据保护:RAID
RAID是一种将多块磁盘形成一个有机整体,使之能够在硬盘故障时提供数据保护的技术。
RAID的实现
软件实现:性能上占用CPU开销,功能上不支持所有RAID级别,需考虑兼容性
? 硬件实现:硬件RAID(专用硬件控制器实现)、控制卡RAID(控制卡和PCI总线交互)、外部RAID控制器(基于阵列,通过协议)
?
RAID阵列的组成:物理阵列、逻辑阵列、RAID控制器、RAID集
RAID级别
分条(Striping)
条带(Stripe):磁盘上一块由若干地址连续的磁盘块构成的、大小固定的区域
? 条带尺寸:构成条带的磁盘块数目
? 分条尺寸:条带尺寸与RAID集中硬盘数量的乘积。
?
数据镜像(将同一数据存储在两块不同的硬盘上,从而产生两个副本,用于保护数据)
奇偶校验(既能为分条RAID提供数据保护,又能避免镜像所需开销的方法):往分条中增加一个硬盘来储存校验值。通过
数学方法构造的校验值能够重建丢失的数据。计算采用位异或操作
RAID 0 数据是分带存储在RAID集的各个硬盘上的,因此利用了全部的存储空间
RAID 1(通过数据镜像来提升容错性)
嵌套RAID(许多数据中心对RAID阵列的数据冗余和性能都有需求)
RAID 3(通过存储分带提供高性能,并利用奇偶校验提升容错性)RAID 4(与RAID 3 类似,支持独立访问)
RAID 5(磁盘上的存储带是可以单独存取的,校验值分布存储在所有磁盘上)
RAID 6(与RAID 5 类似)
RAID对磁盘性能的影响
写代价:对于急于镜像和校验的RAID系统,每个写操作都会对磁盘产生额外的I/O开销。
热备用(RAID阵列中用于临时替代RAID集中故障硬盘的备用硬盘)
数据恢复方法
如采用校验RAID,则按照RAID集中的校验值和幸存硬盘上的数据重建数据。
? 如采用镜像RAID,则从存活镜像上复制数据 ? 新硬盘代替旧硬盘
?
Chapter 4 智能存储系统
智能存储系统组成部分:前端、缓存、后端和物理磁盘
前端
前端提供了存储系统与主机之间的接口,它由两部分组成:前端端口和前端控制器。前端端口使得主机能够连接到智能存在系统。每一个前端端口都拥有 相应传输协议的处理逻辑,包括SCSI,iSCSI
前端命令队列:对收到的命令的执行顺序进行决策,以减少不必要的驱动器磁头移动,改善磁盘性能 常见算法
先进先出算法(默认) ? 寻道时间优化 ? 访问时间优化
?
高速缓存(半导体存储器,为了减少完成主机I/O请求所需时间,数据被暂存在缓存中)
缓存的最小分配单位是页或槽,缓存页的大小是由I/O的大小决定的。缓存由数据存储(保存数据)和标签RAM(记录数据的磁盘中位置)两部分组成。
带有缓存的读操作:每当主机发出一个读请求,前端控制器会通过标签RAM来查询请求的数据有没有保存在缓存中。如果在缓存中找到请求的数据,称为一次读命中。
读性能可以用命中率来衡量。
带有缓存的写操作:一个I/O被写入缓存并得到响应比直接写入磁盘所用的时间要少得多,还可以合并优化。
回写缓存:数据被存入缓存,主机立即响应。
? 直接写操作:数据被存入缓存并立即写到磁盘中,然后响应主机。
?
缓存实现(专用缓存,全局缓存)
缓存管理(为了能够在系统中总是保留一部分页面以及可以在需要时被释放的页面)
最近最少访问算法(Least Recently Used,LRU):连续地监视数据访问,识别出长时间没有被访问的页面。
? 最近访问算法(Most Recently Used,MRU):最近被使用的页面将被释放或标记为可重用。
?
缓存写入数据时,存储系统必须将脏页面刷清以保证或标记为可重用。刷清模式如下
闲置刷清 ? 高水位刷清 ? 强制刷清
?
缓存数据保护
缓存是易失性存储器,保护方法:
缓存镜像:每次写入缓存的数据都被保存在互相独立的内存条的不同位置上。
? 缓存跳跃:缓存随时面对着因为电源故障而丢失数据的风险。
?
后端(提供了缓存和物理磁盘之间的接口,控制缓存与物理磁盘之间的数据传输。两部分组成:后端端口和后端控制器)
物理磁盘(永久的保存数据),智能存储允许SCSI或光纤通道驱动器和IDE/ATA驱动器混合使用
逻辑设备编号(LUN):物理驱动器或一组RAID保护的驱动器可以被分成若干个逻辑卷,逻辑卷用LUN统一寻址
LUN屏蔽:一种数据访问控制,决定一个主机可以访问哪些LUN。
智能存储阵列(高端存储阵列,中档存储阵列)
高端存储系统:用活动-活动式阵列实现,意味着主机可以利用任何可用的路径去访问他的LUN。为大型企业集中管理数据设计,配备了大量的控制器和缓存内存。
? 中档存储系统:活动-被动式阵列实现,主机要访问一个LUN,只能通过到该LUn的控制器的路径进行访问。(低成本下的最优解决方案)
?
概念实践:EMC CLARiiON(活动-活动式) 和 Symmetrix(活动-被动式)
CLARiiON存储阵列(用模块化的组件构造,不存在单点故障,第一个支持闪存驱动的中档存储系统,闪存驱动器具有30倍的IOPS能力)
CLARiiON CX4 体系结构:关键模块-存储处理器模块(SPE)、磁盘阵列模块(DAE)
该体系结构支持全冗余和热交换组件。 CLARiiON 的组成部分包括:
? ? ? ? ?
智能存储处理器(SP) CLARiiON消息接口(CMI) 备用电源(SPS) 链路控制卡(LCC) RLARE操作环境
管理CLARiiON:命令行界面(Naviseccli)、图形用户界面(Navisphere)
Navisphere套件:
?
Navisphere Manager:配置CLARiiOn,基于Web的界面
Navisphere Analyzer:性能分析工具
? Navisphere Agent:主机端工具,建立到系统管理的连接以进行CLI访问
?
Symmetrix 存储阵列(最受信任的平台,Direct Matrix架构,容错设计)
Direct Matrix 架构,其组成:
? ? ? ? ?
前端:主机通过通道主控器上的前端端口连接Symmetrix。
后端:后端磁盘主控器负责管理到磁盘驱动器的接口,并负责磁盘驱动器与全局内存之间的数据传输。
全局内存:系统中最重要的部分。所有读写操作都要通过全局内存进行 XCM:XCM是服务处理器和系统中其他处理节点进行通信的代理 Symmetrix Enginuity:EMC Symmetrix的操作环境
第二部分 存储网络技术和虚拟化
Chapter 5 直连存储和SCSI
直连存储(DAS)是一种存储器直接连接到服务器的架构。应用程序使用块级的存取协议从DAS访问数据。SCSI-DAS中使用最典型的协议
DAS类型:
内置DAS:存储设备通过串行或并行总线连接主机 ? 外置DAS:服务器直接连接到外部存储设备
?
DAS优缺点:
{1}DAS相对于存储网络需要较低的前期投资。配置简单并且部署容易,需要设置和操作的硬件和软件也更少
{2}DAS不易扩展。有限的端口,有限的带宽。无法优化资源使用。
磁盘驱动器接口
IDE/ATA:集成电路设备/高级技术。IDE部分定义了连接到主板上的控制器的规范,ATA部分规定了连接存储设备到主板的接口
? SATA(Serial ATA):是一个磁盘接口技术,取代并行ATA。采用功效性的7针连接器和线缆来进行连接,可热插拔。
? 并行SCSI:早期最流行的SCSIO的主机存储接口模式。是一套用于连接多种类型的设备,例如扫描仪和打印机。
?
并行SCSI接口
NCR公司开发,与IDE/ATA相比,提供提供更好的性能、可扩展性和兼容性,与设备无关。版本(SCSI-1,2,3)
SCSI-3架构最主要部分:
SCSI-3指令协议 ? 传输层协议 ? 物理层互连
?
SCSI-3客户-服务器模型 SCSI发起方设备 ? SCSI目标放设备
?
SCSI端口
SCSI端口是SCSI的物理连接器,可连接SCSI线缆,用于与SCSI设备通信。一个SCSI设备可以包含目标端口、发起端口和目标/发起端口,或者带多端口的目标端口。
基于端口的不同组合,一个SCSI设备可以分为发起方模型、目标方模型、复合模型或者带多端口的目标方模型。
SCSI通信模型的三个层:
SCSI应用层:包含客户端和服务器端的应用程序,通过SCSI应用程序协议发起和处理SCSI的I/O操作
? SCSI传输协议层:这一层包含发起方和目标方进行通信的服务和协议 ? 互连层:实现了发起方和目标方之间的数据传输功能
?
SCSI指令模型
CDB结构:CDB结构发送指令到目标方。定了了与发起方请求相关的,会被设备服务器执行的操作
操作码(operation code)
控制字段(Control)
状态:在指令执行之后,逻辑单元发送状态和标记给客户应用程序
Chapter 6 信息存储与管理介绍
一个高效的信息管理解决方案必须提供如下功能: 即时提供信息给商业用户 ? 信息基础设施与业务流程集成 ? 灵活易变的存储体系结构
?
光纤通道(Fibre Channel):概览
FC结构式SAN的基本组成元素。光纤通道是一种高速网络技术,运行在高速的光纤线缆和串行铜缆。FC技术主要用于满足
日益增长的数据传输需求,包括主机、服务器、和大规模存储子系统之间的数据传输。
SAN及其演化
存储区域网:通过光纤通道交换机连接服务器和存储器并传输数据。SAN实现了存储整合,允许多个服务器共享存储设备。
它允许用户连接分散在不同地方的服务器和存储器。
SAN组建
SAN由三个组件组成:服务器、网络基础设施和存储设备。这些部件可细分为:节点端口、线缆、互连设备、存储阵列和SAN管理软件
? ? ? ? ?
节点端口:每个节点需要一个或多个端口来提供物理接口,用于与其他节点进行通信。每个端口都是双工传输模式,拥有发送和接送链路
布线:SAN的实现使用光纤进行布线。通栏可以用于短距离的后端连接。光纤线缆用光信号来携带数据。分两种:多模和单模 互连设备:集线器、交换机和控制器 存储阵列 SAN管理软件
FC连接
点对点:两个设备直接相连 ? 光纤通道仲裁环:设备连接到一个共享的环。在环上的设备必须被仲裁才能获得环的控制权。
? 光纤通道交换fabric:提供互连设备、专用带宽以及可扩展性。在一个交换网里增加或移除设备极少引起网络中断,无影响其他节点
?
光纤通道端口
交换机上的端口分为:
? ? ? ? ? ?
N端口:一种fabric上的末端端口
NL端口:一种支持仲裁环拓扑的节点端口
E端口:一种FC端口,可以用于两个FC交换机之间的连接 F端口:一种交换机上的端口,用于连接N端口 FL端口:一种fabric端口,用于FC-AL。
G端口:一个通用端口,可作为E端口或者F端口
光纤通道结构(Fc结构是带标准互连设备的通道/网络集成方案) 光纤通道协议(FCP)是串行SCSI-3在FC网络上的一个实现。 FCP关键优势:
在较长距离上保持较高传输带宽 ? 支持网络上大量的可寻址设备。 ? 显现出通道传输的特性。
?
FCP定义了光纤通道映射层,依照SCSI结构模型定义了光纤通道信息单元
光纤通道协议栈
FC-4高层协议 定义应用程序接口和高层协议
? FC-2传输层 包含有效载荷、源地址和目的地址、链路控制信息
? FC-1传输协议 包括串行编码和解码规则
? FC-0物理接口 定义了物理接口、媒介和原始比特的传输规则
?
光纤通道编址
当一个端口接入到fabric上时,FC地址是动态分配的。Fc地址根据fabric上的不同类型的节点端口,采用不同格式。
FC帧 由5部分组成:帧起始、帧头、数据段、循环冗余校验、帧结尾 帧头定义的字段包括:路由控制、特定类别控制、类型、数据段控制、帧控制
FC数据的结构和组织
交换操作 ? 序列 ? 帧
?
流量控制:定义了数据传输过程中的数据帧流量的速度。两种机制:缓冲区到缓冲区信用数(BB_Credit)和端到端信任(EE_Credit) 服务类
分区(分区是一种FC交换机的功能,它使得节点在一个fabric里可以被逻辑上分为不同的组,并且在组建进行互相通信) 分区类型: 端口分区 ? WWN分区 ? 混合分区
?
光纤通道登陆类型 Fabric登陆 ? 端口登陆 ? 程序注册
?
FC拓扑
Fabric设计是根据标准的拓扑来连接设备的。 核心-边缘Fabric
边缘层包括交换机,核心层包括企业控制器 核心-边缘Fabric的优点 和局限性
提更了更简单的ISL负载计算和流量模式,很容易定位哪些资源更接近他们的处理能力,使其更容易建立一套规则用于增减或分配资源 但,会导致性能相关的问题,核心数增加难以承受
Mesh 拓扑(每个交换机通过ISL直接连接到其他交换机上,是SAN的连接能力变得更强)
实践中的概念:EMC Connectrix Connectrix 交换机 ? Connectrix 导向器 ? Connectrix 管理工具
?
Chapter 7 网络连接存储
网络连接存储(Networi-attached storage,NAS)是一种连接到局域网的基于IP的文件共享设备。其使用网络协议(TCP/IP,CIFS,NFS等),实现文件归档和存储功能。
通用服务器与NAS设备
NAS设备是专为文件服务功能进行优化的设备,例如存储、检索以及为应用程序和客户端提供文件存取功能等。
NAS的优势
? ? ? ? ? ? ?
支持全面信息存取:共享更高效,支持NAS设备和客户端的多对一和一对多的配置方案
提高效率:消除了通用文件服务器在文件存储过程中的性能瓶颈
增强灵活性:使用工业标准协议,NAS同时兼容UNIX和Windows平台的客户端
集中式存储:集中式数据存储将客户工作站上的数据冗余降低到最小,简化了数据管理,确保了更强的数据保护能力
可扩展性:NAS的高性能和低延迟设计,使它能够针对不同的使用特征和商业应用类型进行部署
高可用性:提供高效的备份和恢复选项,使数据具有更高的可用性 安全性:在工业标准安全模式下,确保安全性、用户鉴权和文件锁等。
NAS文件I/O
NAS的所有I/O操作都使用文件及的访问模式,文件I/O请求里面没有包含磁盘卷或磁盘扇区等信息。
文件系统和远程文件共享:文件系统是一个结构化的数据文件存储和组织形式。许多文件系统都会维护一个文件访问表,用于简化查找和存取文件等操作。
文件系统访问
一个文件系统必须被挂载后才能使用。在大多数情况下,操作系统在启动过程中就会挂载本地文件系统。挂载的过程会创建一个文件系统和操作系统之间的链接。当挂载一个文件系统时,操作系统将文件和目录组成一个树状结构,并且授予用户访问权限。
文件共享
文件传输协议、分布式文件系统和使用文件共享协议的客户/服务器模型 ? FTP是一个通过网络来传输数据数据的客户/服务器协议。一个FTP服务器和一个FTP客户端使用TCP作为传输协议来进行互相的通信
? 分布式文件系统是一个分布于不同主机上的文件系统。DFS提供 了主机直接访问整个文件系统的能力,同时保证了管理的高效性和数据的安全性 ? 由文件共享协议实现的传统的客户/服务器模型,是另一种远程文件共享机制。
?
NAS组件(集成式、网关式)
集成式NAS:设备在一个单独的容器或机柜中集中了所有NAS组件,包括NAS头和存储器等 ? 网关式NAS:网关式NAS设备由独立的NAS头和一个或多个存储阵列组成。 ? 集成式NAS连接:集成式解决方案是自包含的,并且可以连接到标准的IP网络上。
? 网关式NAS连接:网关式解决
?
NAS文件共享协议
NFS是UNIX系统中使用最广泛的一种用于文件共享的客户/服务器协议。NFS最初是基于无线连接用户数据包协议(User Datagram Protocol,UDP)的。它使用一种与机器无关的模型来描述用户数据,使用远程过程调用(Remote Procedure Call,RPC)作为两台计算机的进程间通信方法。支持以下几种操作:
查找文件和目录
? 打开、读取、写入和关闭文件 ? 修改文件属性
? 修改文件链接和目录
?
CIFS是一种客户/服务器应用协议,支持客户程序通过TCP/IP对处于远程计算机上的文件和服务发起请求。CIFS提供以下特性来确保数据的完整性: 使用文件锁和记录锁 ? 运行在TCP上
? 支持容错,并且可以自动恢复简介,重新打开中断之前已经打开的文件
?
NAS的I/O操作
过程如下:
1. 请求者将一个I/O请求封装成TCP/IP报文,通过网络协议栈进行转发。NAS设备从网络上接收请求。
2. NAS设备将I/O请求转换为一种对应的物理存储请求,即块级I/O请求,然后对物理存储池执行相应的操作
3. 当数据从物理存储池返回时,NAS设备对其进行处理并封装为相应的文件
协议响应
4. NAS设备将这个响应封装成TCP/IP报文,通过网络转发给用户
影响NAS性能和可用性的因素
NAS环境里,网络拥塞是最明显的延迟来源。其他影响因素包括:
? ? ? ? ? ? ?
跳转次数:大量的网络包跳转会增加延迟,因为每一次跳转都需要进行IP处理,这就会增加路由器的延迟。
目录服务的认证:例如LDAP、活动目录或NIS:认证服务是必须的,必须拥有充足带宽和资源来支持认证过程产生的负载。
重传:链路错误、缓冲区溢出和流量控制机制都会导致重传 过载的路由器和交换机:过载的设备所需要的响应时间总是比优化状态下使用的或低负载使用的设备所需要的响应时间要长
文件/目录查找和元数据请求:NAS客户访问NAS设备上的文件时,在找到响应的文件或目录之间所需的查找过程也会产生延迟 过载的NAS设备:客户访问多个文件可能造成NAS设备上的使用强度较高,这可通过查看利用率统计数据来确定
过载的客户端:客户端访问CIFS或NFS也会产生过载。
性能改进:
配置VLAN、设置合适的最大传输单元(MTU)和TCP窗口大小可以改进NAS的性能
虚拟局域网(VLAN)是一个从逻辑上进行划分的交换网络。其可以控制总的广播流量,也可用于提供安全防火墙功能
? MTU的设定决定了可以不分段传输的最大报文尺寸。”路径最大传输单元探测“用于发现在网络中传输而不需分段的最大报文尺寸
? TCP窗口大小是指在任何时候网络上一个连接能承受的最大数据量。 ? 链路聚合(link aggregation)将两或多个网络接口合并为一个逻辑网络接口来消除冗余,提高可用性
?
NAS实例:EMC Celerra(NAS解决方案)
Celerra同时包括网关式和集成式配置方案。EMC提供了一个支持文件及I/O访问的专用高性能、高速率的基础设施。支持网络数据管理协议(NDMP),用于备份、CIFS、NFS、FTP和iSCSI等。支持以太网信道。
体系结构:有控制站和NSA头(数据移动设备)组成。数据移动设备是一个集网络和存储接口于一体的设备,控制站是一个管理接口设备。 数据移动设备(一个独立的、自治的文件服务器,用于传送请求的文件给客户端)
控制站(主要用于完成控制、管理和配置NAS解决方案,linux下) 存储连接(集成式和网关式
)
Celerra管理软件(命令行或Celerra Manager GUI)
CLI管理:在Control Station上通过SSH接口工具或PUTTY进行访问 ? GUI管理——Celerra Manager:通过Celerra Manager 实现的GUI管理。
?
Chapter 8 IP SAN
SAN以块I/O的形式在光纤通道上进行传输,NAS环境中数据以文件I/O的形式在IP网络上传输。希望融合NAS解决方案的高易用性和更低的总拥有成本。支持在IP网络之上的块I/O操作的IP技术符合这种需求。
iSCSI和FCIP(Fibre Chanel over IP)是现行的两种主要的基于IP网络的传输协议。
iSCSI协议是对主机发送或接受的SCSI数据进行封装,使其成为IP数据包然后由以太网卡或iSCSI HBA设备进行传输。
iSCSI
iSCSI是一种基于IP的协议,它通过IP来建立和管理存储设备、主机和桥接设备之间的连接。
iSCSI组件:发起方、目标方、基于IP的网络
iSCSI物理连接设备:标准NIC、TOE NIC、iSCSI HBA iSCSI的连接拓扑:
iSCSI本机模式:该阵列有一个或多个以太网网卡连接到一个标准的以太网交换机,并配置了一个IP地址和侦听端口(无FC -SAN组件)
? iSCSI桥接模式:用外部设备实现从IP网络到光纤通道SAN之间的协议转换和通信。
? iSCSI与FCP的融合模式:FCP和iSCSI组合使用
?
iSCSI协议栈
iSCSI发现实现方式:发送目标发现、网络存储名称服务
iSCSI名称(全球唯一的SCSI标识符,用来命名iSCSI网络内发起方和目标方) iSCSI认证名称(IQN) ? 扩展的唯一标识符
?
iSCSI会话可为下列中的一项而建立:
发现发起方的可用目标和指定目标方在网络的位置 ? iSCSI正常运行
?
iSCSI PDU
iSCSI发起方和目标方使用iSCSI协议数据单元(PDU)进行通信。所有的iSCSI PDU都包含一个或多个报头部分。
报文的排序和标号
发起方/主机和目标方之间的iSCSI通信是基于请求-应答的命令序列来进行的,可能产生多个PDU,需用命令序列号(CmdSN)对PDU进行编号,状态序列号(StatSN)用于对状态应答进行顺序编号
iSCSI错误处理安全
错误检测和回补可分为3级别: Level 0:会话恢复
? Level 1:消息摘要故障恢复 ? Level 2:连接恢复
?
FCIP
FCIP是一种隧道协议,使分散的FC SAN孤岛通过现有的IP网络可以透明地在局域网、城域网和广域网之间互联。使用TCP/IP作为底层协议。
FCIP 拓扑
Chapter 9 内容寻址存储(CAS)
内容寻址存储:已经对象的存储系统,专用于存储被频繁访问的数据即固定内容。旨在提供一种固定内容的安全在心啊存储于检索解决方案。将用户数据和相关属性作为独立对象来存储。存储对象被分配了一个全局唯一的地址,支持单实例存储,避免了多个副本。
固定内容与归档(具有商业价值)
归档的类型:在线归档、近线归档、离线归档
存储的功能和优势
?
?
?
?
?
?
?
? 内容的真实性:CAS保证为存储对象创建一个全局唯一的内容地址并不管检查内容地址 数据完整性:使用哈希算法,并提供审计跟踪保持固定内容的原始状态 位置无关性:使用全局唯一的标识符来检索数据 单实例存储:全局唯一的签名保证了一个对象只保存一个实例 强制保留期:保护和保留数据对象是一个归档系统的核心任务,CAS创建两个不变的组成部分:数据对象和元对象 记录级保护和处置:所有的固定内容在CAS中只存储一次,但会采用某种数据保护方案 技术开放性:CAS系统接口不受技术变化的影响,只要应用服务器能够映射原始内容地址,那么数据就可以被访问 记录快速检索:保证所有内容的“首字节响应时间”为亚秒级
CAS体系结构
客户端借助运行CAS API(应用程序编程接口)的服务器,通过局域网访问基于CAS的存储系统
CAS体系架构是一个独立节点冗余阵列(RAIN)。它是由内部专用局域网连接的一系列存储节点和访问节点组成的集群
CAS核心功能:
? 完整性校验:它确保文件的内容与数字签名相匹配
?
?
?
?
?
?
? 数据保护和节点恢复:确保了存放在CAS系统里的内容在磁盘或节点出现故障时的高可用性 负载均衡:将数据对象分配到多个不同节点,以提供最大的吞吐量、可用性和存储空间使用率 可扩展性:添加节点到集群时不会中断数据的访问,并使得管理成本最小 自我诊断和恢复:自动检测和恢复损坏的对象并警告系统管理员任何潜在的问题。 报告和事件通知:提供要求的报告和事件通知。 容错性:通过使用冗余组件和数据保护方案 审计跟踪:能够对管理活动以及数据的存取和处理进行记录
CAS中的对象存取
术语包括:
?
?
?
?
? 应用程序编程接口(API):定义了用户如何发出服务请求 访问预配置文件(Access Profile):它可以用于应用服务程序到CAS集群的身份严重或CAS集群间的相互验证以进行数据复制 虚拟池(Virtual Pool):使一个单一的逻辑集群能够分成多个数据逻辑分组 二进制大对象(BLOB):内容的实际裸数据,不包括任何描述性信息。 内容地址(Content Address):对象的地址,是根据对象的二进制表示
执行哈希算法的结果。
数据对象的存储过程:
1. 终端用户通过应用程序将要归档的数据发送给CAS API。
2. CAS API将实际数据(BLOB)和元数据区分开来,并根据对象的二进制表
示计算出CA
3. 内容地址和对象的元数据被整合入相应C-Clip描述文件。
4. CAS系统重新计算对象的CA进行验证后,再存储对象,以确保对象的内
容未被修改过
5. 当CDF(描述符文件)的一个镜像副本和BLOB的一个受保护副本成功存
储后,CAS API会收到一个确认信息
6. 通过C-Clip ID,应用程序能够从CAS系统中回读数据
从CAS里检索数据的过程如下:
1. 终端用户或者应用程序请求某个存储对象
2. 应用程序查询存储在本地的C-Clip ID列表,并找到所请求的对象的
C-Clip ID
3. 检索请求和相应的C-Clip ID一起通过API发送到CAS系统
4. CAS系统将所请求的信息发送给应用程序,然后由它转发给最终用户 CAS实例
1.医疗保健行业解决方案:病历存储
2.金融行业解决方案:财务数据存储
实现方法:EMC Centera
EMC Centera是一种简单、经济且安全的信息在线归档解决方案。EMC Centera是首个专为存储和检索固定内容而设计并优化的存储平台。与传统的归档方法相比,EMC Centera提供更快的检索速度、支持但是离存储、保证内容的真实性、具备自我修复功能并支持众多行业监督标准。
EMC Centera模式
EMC Centera Basic:提供所有Centera的功能,但不能配置数据的保留期
? EMC Centera Governance Edition:除了Basic模式功能外
?
? CE+:提供更为严格的法规遵守能力。满足商业环境中 对电子存储介质的
最严格规范
EMC Centera架构
EMC Centera是基于冗余磁盘阵列的体系结构,具有高度可扩展性和PB级存储能力。每个EMC Centera机柜可容纳32个节点,入门级配置只有4个节点和2个内部网络交换机,节点以4个为一组进行扩展。节点运行Linux操作系统和CentraStar软件来实现CAS的所有功能。
内容保护方式:
内容奇偶保护:数据被划分成段,同时添加奇偶校验段
? 内容镜像保护:每一个数据对象都被镜像,每个镜像被放在不同的节点上。 ? Centera工具:
EMC Centera浏览器:加载到客户端的图形用户界面工具,通过网络访问Centera
? EMC Centera监控器:用来坚持测EMC Centera中的单个Cube,可显示系
统属性
? EMC Centera控制台:基于Web的管理工具,操作员可看到各种详细信息 ? EMC Centera健康报告:每个一段时间,EMC Centera集群自动滴想EMC
客户支持中心或指定人员发送邮件。 ?
Chapter 10 存储虚拟化
虚拟化技术通过映射或抽象的方式屏蔽物理资源的复杂性。
虚拟化的形式:
内存虚拟化:虚拟内存使得应用程序好像拥有自己的、独立于现有物理内存资源的连续逻辑内存。(例如VMM)
? 网络虚拟化:建立虚拟的网络,从而使每个应用程序将其自身的 逻辑网络独立于物理网络。(例如VLAN)。(存储区域网虚拟化:是对传统SAN网络的一种最新的演化,一组主机或存储端口使用在屋里SAN上定义的虚拟拓扑来互相通信。)
? 服务器虚拟化:可以让多个操作系统和应用程序同时运行在不同的虚拟机上,这些虚拟机创建在同意物理服务器。
? 存储虚拟化:为主机创建物理存储资源的逻辑视图的过程。一些存储虚拟化的实例是基于主机的卷管理、LUN的创建。。。 ?
SNIA(存储网络工业协会)的存储虚拟化分类
第一个层次的存储虚拟化分类定义”创建什么“,它指定虚拟化的类型:块级虚拟化、文件虚拟化、磁盘虚拟化、磁带虚拟化或其他。。。
第二个层次描述虚拟化定义”在哪里“进行。刻画虚拟化:服务器、村粗网络、存储
地单个层指定袋内或带外网络及的虚拟化方法。
存储虚拟化配置
带外存储网络虚拟化中,实行虚拟化的设备是配置在数据通道之外的。 袋内存储网络虚拟化中,虚拟化设备会部署在原来数据通道上。
存储虚拟化的挑战
可扩展性:存储阵列不再被视为是独立的个体,因此必须分析整个存储环境。
? 功能性:包括本地复制、远程复制以及多卷和跨阵列环境中的应用一致性能力。
? 可管理性:可提供一个端到端的视图来整合存储环境中所有的资源。 ? 技术支持:虚拟化需融合于现有的存储环境中 ?
存储虚拟化的类型
块级存储虚拟化:为SAN的主机和存储阵列之间提供了一个转换层。主机是直接使用虚拟化LUN,而不是直接连到存储阵列的LUN。
? 文件级虚拟化:文件级虚拟化致力于消除NAS环境中的文件访问和文件级存储位置之间的依存关系,这为优化存储利用率、整合服务器和执行不间断文件歉意提供了实现的可能性 ?
实现方法
1.EMC Invista
是一个带外的SAN块级存储虚拟化解决方案。它采用定制硬件和智能SAN交换机将物理存储用虚拟化逻辑来表现。这些交换机有能力用网络速度来处理业务数据。他们用专用的软件来检查端口、逻辑卷和发送出来的I/O偏移量,同时可以控制存储设备的I/O目标路径
Invista的主要硬件组件包括控制路径集群(CPC)、数据通道控制器(DPC)和以太网交换机
Invista的运作:当一个I/O请求从主机到达DPC时,她处理这个I/O请求并映射到适当的虚拟目标。如果该命令是SCSI询问有关设备的请求或是一个DPC没有映射信息的I/O请求,CPC会处理这个请求。
Invista的优势:提供了在异构存储环境中块级存储的虚拟化。它还支持不同存储层之间应用不间断地动态卷扩展和数据迁移。
2.Rainfinity
Rainfinity是一个专门的文件级虚拟化的硬件/软件解决方案。Rainfinity的全局文件虚拟化设备向用户提供了一个透明度基于文件的存储虚拟化机制,即使用户在读/写一个文件的数据,这个文件也可以从一个文件服务器迁移到另一个
Rainfinity的组建:64位处理器、16GB告诉内存缓存。两个被配置RAID1的热插拔SCSI硬盘作为高速缓冲。软件包括Rainfinity code、Windows Proxy Service
Rainfinity的运作:在NAS环境中,文件服务器和Rainfinity设备通过网络妇联。Rainfinity需要一个单独网络VLAN,这样就不会对缘由的数据通道和用户连接产生影响。当为了存储成本优化或性能优化进行数据迁移时,数据在
Rainfinity和在VLAN中与文件服务器连接的端口之间移动。Rainfinity将数据迁移作为一个事物处理而且有能力进行事物回滚。Rainfinity利用了袋内和带外方法的最佳特性。
全局命名空间管理(GNA):允许存储管理员为用户网络存储环境中的共享文件资源提供一个唯一的逻辑名字,并建立一个统一的名字空间。
Part 3 业务连续性
Chapter 13 业务连续性概述
业务连续性(BC)是一个企业级集成的过程,该过程包括了一个企业为了缓解已知和未知停机时间带来的影响所做的全部内容和外部的活动。BC需要对由于系统中断带来的各种对业务操作的影响进行准备、响应和恢复。BC设计一些主动性的措施以及一些在故障发生时采取的补救措施。
信息可用性(在业务操作特定时间内根据业务期望能提供的从基础架构到业务功能的能力,它确保人们在任何需要的时候都能获取信息)
信息可用性可以借助可靠性、可获性以及合时性
可靠性:指在特定的条件下以及一定的时间内部件无故障运行的能力 ? 可获性:一种状态。在这种状态下所需的信息所需的信息能够在正确的位置提供给正确的用户。
? 合时性:定义信息可用的确切时刻或者时间窗 ?
信息不可用的因素:计划的和未计划的
?
信息可用性度量
MTBF指对一个系统或者部件在两次故障间运行其正常功能的平均时间 ? MTTR指修复一个故障不见的平均时间。当计算MTTR时,需假设引起故障的原因能准确定位,并且用户修复的时间和人力也是可获得的 ?
BC术语
灾难恢复:当灾难发生时为了支持重要的业务操作而进行的对系统、数据和基础架构的恢复等一系列过程。
? 灾难重启动:指利用基于镜像的、一致的数据和应用的备份重新启动业务操作的过程。
? 恢复点目标(RPO):指中断之后系统和数据必须恢复到的时间点。RPO定义了业务能够承受的数据损失量。大的RPO意味着系统对信息损失有着较高的容忍度。组织可计划制定备份和复制最小频率
?
BC计划生命周期
整个BC过程可定义为一个活动生命周期:
1. 确定目标
2. 分析
3. 设计开发
4. 实现
5. 训练、测试、评估和维护
故障分析
单点故障:指那些能够终止真个系统或者IT服务可用性的单个部件的故障
? 容错:为了缓解单点故障,系统设计时采用冗余方式。这样只有在所有冗余组部件都失效时系统才会失效,这样做确保了单点故障不会影响数据的可用性
? 多路径软件:配置多个路径方式通过路径的容错转移增加了数据可用性。 ? 业务影响分析(BIA):识别并评估对重要业务过程中断带来的财务、操作和服务的影响。为了支持信息可用性,对有选择的几个功能区域进行评估以确定基础架构的弹性。BIA过程以报告西瓜是详细说明了各种事件及对业务功能的影响。这种影响有可能以时间和金钱的形式说明。BIA包括下列的任务。
?
?
?
?
? 说明对操作至关重要的关键业务过程 以应用、数据库以及软硬件需求的方式确定业务过程的属性 对每个业务过程评估故障成本 对每个业务过程计算最大可容忍的中断并定义RTO和RPO 确立用于业务过程的最小资源要求
BC技术方案
备份和恢复
? 基于存储阵列的复制(本地)
? 基于存储阵列的复制(远程)
? 基于主机的复制 ?
实例:EMC PowerPath
PowerPath特征
在线路径配置和管理
? 多路径动态负载平衡
? 自动路径失败切换
? 主动路径测试 ?
机群支持
? 互操作性 ?
PowerPath负载平衡,原则:
循环策略:I/O请求以循环的方式分配给每一个可用路径
? 最少I/O政策:I/O请求被路由到具有最少I/O请求队列的路径上,而不管总的I/O块数目
? 最少块策略:I/O请求被路由到具有最少I/O队列的路径上
? 基于优先级策略:基于读写、用户指定设备或者应用优先级 ?
Chapter 12 备份和恢复
备份的目的:灾难恢复、可操作备份、归档
备份考虑:
数据丢失的多少以及用RTO和RPO衡量的业务能容忍的停机时间是选择实现特定备份策略的主要考虑因素
? 文件的位置、大小及其数目引起影响备份的过程
? 备份的性能也依赖与备份所用的介质 ?
备份粒度
备份粒度依赖于业务需求和RTO/RPO时间。根据不同粒度,备份可分为全备份、累积备份和增量备份。