HP推出强有力的群集结构,它把多种计算机集合成企业群集,这种结构能最好地满足数据中心对可靠性、灵活性和可仲缩性的需求。企业群集节点采用一种松散的连接方式。每个节点均有自己的处理器、内存和操作系统。专门的通信协议和系统进程把各节点组成一个整体,它们互相协作提供杰出的可靠性和灵活性,支持关键业务应用.
企业群集严格遵循开放系统原则。由于不需要专用的应用程序接口、APIs,因而不会束缚供应商手脚,也不需要额外的投资。大多数应用程序能不作任何修改就运行在企业群集上。只需要基于标准的硬件如SCSI磁盘和Ethernet局域网LAN就可用来形成群集。企业群集以性能价格比高及灵活的结构满足商用UNIX市场的需要。
MC/ServiceGuard的高可靠性
MC/ServiceGuard(Multi-Computer/ServiceGuard)是专门用来保护关键业务应用免遭软、硬件故障影响的特殊结构。使用MC/ServiceGuard,多个节点(系统)被组织成一个企业群集,为LAN上的客户机提供高可用性的应用服务。MC/ServiceGuard监视程序监视每一个节点状态,并且对出现的故障很快做出反应,使应用程序的停顿成为最小。MC/ServiceGuard可自动对下列部件的故障作出响应:
系统处理器
系统内存
局域网介质和网卡
系统进程
应用程序进程
因为高可靠性是设计的重要目标,这种群集不会因任何“单点故障”(Singlepointoffailure)而停止服务,即对数据磁盘做镜像,并采用多个LAN。
应用程序包
把MC/ServiceGuard和用于支持应用所需的所有应用程序服务和资源集合在一起组成一个应用程序包。应用程序包是企业群集内用于管理和传输的基本单元。应用程序包简化了高可靠性服务的创建和管理工作,而且为平衡工作负荷提供杰出的灵活性。
特性和优点
关键业务应用的高可靠性
快速检测故障,快速恢复应用
在企业群集内,MC/ServiceGuard监视所有硬件和软件,检测故障,故障发生时进行快速响应,并为关键业务应用分配新的资源。检测故障并快速恢复应用的过程完全是自动的一不需操作员作任何干预。MC/ServiceGuard监视系统处理器、内存、LAN介质、LAN网卡、系统进程和应用程序进程,对故障快速响应,从而对基于LAN的客户恢复应用服务。
MC/ServiceGuard对LAN网卡故障的恢复是极快的,一般在几秒种内。而对于需要把应用切换至其它节点的故障来讲,根据应用软件的不同,故障恢复所需的时间也不等。例如,对于使用logging
facility功能的数据库应用而言,它在故障恢复中需要执行交易回退(TransactionRollback)的时间是整个恢复过程所需时间的一部分。MC/ServiceGuard检测节点故障,重新配置群集,而且在45秒种内在另一个节点上开始执行应用程序包启动程序。
硬件、软件维护中保证应用的可用性
在企业群集中可方便地移动应用软件包,使在系统维护时(如软件或硬件升级)能保证整个系统的可用性。通过简单的命令,便可将应用软件包从一个节点移到另一个节点这样可定期对节点进行维护,而另一些节点仍然工作,支持关键业务的运行。当维护完成后,节点重新加入群集,担负应用软件包的正常工作负荷。这种方法也可用于对整个群集中节点依次进行操作系统升级。
功能强大的群集结构
在企业群集里MC/ServiceGuard提供保护功能,不会因单个节点的故障而影响整个群集继续提供服务,由于使用动态资源分配功能,MC/ServiceGuard在多个节点出故障时仍能继续工作,为关键任务提供支持。应用软件包能得到一个群集的全部节点的支持,并允许应用软件包移到另外的节点上。MC/ServiceGuard使软件包能得到比其它基于UNIX高可用性的解决方案更高档次的保护。
灵活配置
系统能力与应用需求相匹配
在企业群集里,MC/ServiceGuard设计成具有最大的灵活配置功能。群集可以由多达8个节点的任何HP9000服务器组成。节点可以全部是SMP节点,也可以全部是单处理器节点,或是任意的SMP与单处器节点的混合形式。系统所具有的这种非常灵活的群集配置方式极大地保护了客户在安装系统时的投资,并且允许每个节点的处理能力与每一种应用服务的特殊需求相匹配。
群集恢复选件
MC/ServiceGuard可以按二种不同的恢复策略进行配置:活动一活动和活动一备用。在活动一活动配置中,每个节点至少运行一个应用软件包,并为运行在其他节点上的一个或多个应用程序提供备份服务。在活动一活动配置方式下,没有空闲的系统,这充分利用群集内每个节点的能力。
MC/ServiceGuard也允许节点按活动一备用方式配置,这样配置可在主系统发生故障时,将所有备用节点的处理能力重新分配给应用软件包。备用节点可供非关键性业务使用,一旦关键性应用程序包从主系统转达来,就立即中止原来的工作。活动-备用方式配置保证在故障恢复后,关键业务应用的响应时间不会变差。
平衡工作负荷
MC/ServiceGuard的应用程序包提供一种强有力的、灵活的机制用来在群第内部一个节点发生故障时,平衡各节点的工作负荷。在一个节点内的各个应用程序可移到不同的节点上,这样在群集的各个节点上分散工作负荷。例如,一个群集有4个节点,每一个节点运行三个软件包。如果某个节点发生故障,该节点上正运行的三个软件包会被分散到不同的节点上,把发生故障节点的工作负荷分配到剩下的三个好节点上,这样可使群集中其余的应用性能所受的影响降至最十氏。迁移软件包的能力甚至在未发生故障时也能进行工作负荷调整。例如,在某个应用软件的峰值处理期间内,对该应用的需求会变得过高,那么使用简单的操作员命令就可以把同一节点别的应用包转移到别的节点从而减轻该节点的工作负荷,来满足已增加的需求。企业群集内各节点的工作负荷还可用HP可选产品一进程资源管理程序(Process
ResourceManager)来进一步调整。
容易实施
采用MC/ServiceGuard所有检测故障和作出反应的主要功能对企业群集中运行的所有应用程序均是透明的。为达到高可用性,不需要应用软件开发人员学习新的API或改变应用程序代码以达到更高的可用性。MC/ServiceGuard提供的模板文件可很容易地生成应用软件包及其相关的控制程序。
保护数据完整性
在企业群集中,MC/ServiceGuard不仅使应用程序有效可靠,而且采取特别方法保护数据完整性。当应用程序包从故障节点移出时。群集中其他节点互相协调确保失效节点不会危及应用数据的完整性。每个节点都知道群集中的其他成员及分配给它们的应用软件包。如果一个节点发生故障,剩下的节点会把其从群集中隔离出来以防止其访问磁盘。这一重要功能可以防止一个节点发生故障挂起或重启动后,不会再对现在己由别的节点负责的数据进行改写(称这种情况为“Splitbrainsyndrome”)。如果没这种防护,数据完整性就会由于有多个节点同时访问一个磁盘而遭到破坏。
企业处埋环境中日益增加的可靠性
带有MC/Serviceguard的企业群集为支持关键业务应用提供了一个强有力的基础。为获得最优性能,企业群集及其支持的处理环境必须进行彻底地设计而具有高可靠性,群集应该构造如下:消除任何单点故障,来用系统管理工具,并且还应考虑电源故障环境因素等。
为进一步加强整体可靠性、灵活性,并且容易管理关键任务环境,HP力荐使用以下产品和服务:
磁盘镜像(MirrorDisk/UX)
含在HP-UX中的日志文件系统(JFS)
HPOnLineJFS
RAID磁盘子系统
高可靠性存储系统
PowerTrust不间断电源(UPS)
HP进程资源管理
HPOpenView
OperationCenter
HPOpenViewadmincenter
连续事务支持(ASO)
可靠性管理月服务(PSO)
灾难恢复计划服务(PSO)
集成MC/ServiceGuard群集和网络节点管理程序
ClusterView是一个具有业界领先功能的新产品,用于本地或远程群集的集中式网络管理。与HPOpenView的网络节点管理程序(NNM)一起,ClusterView可以让网络管理人员观察MC/ServiceGuard群集的状态。利用一种“drill
down”的功能,网络管理员可以观察整个群集、群集中的每个节点以及每个节点上应用程序的状态。这些能力大大加强了网络群集管理,当与其他产品如进程资源管理程序(PRM)一起使用时,能大大提高网络管理员下列方面的能力:问题预测、检测和分析;性能调整以及工作负荷平衡。
ClusterView的功能是UNIX市场上其他产品无法相比的。ClusterView要单独订购。
最佳解决方案(VerticalSolutions)
目前已开发的几个极好的解决方案可充分利用MC/ServiceGuard的能力。这些解决方案包括:
HPSAP
HAINTERNET
HANFS
HAEncina/DCE
HAOSI/OTS
HATelepace
工具包
为帮助加快实现MC/ServiceGuard群集,已有专用的工具包来解决用户生成应用程序包(支持NFS或关系数据库)。每个工具包都有模板文件,只要对模板文件作相应修改以满足用户环境即可。可用的工具包包括网络文件服务器(NFS)工具包和数据库工具包,可在ORACLE、Sybase、Progress或Informix一起使用。
产品要求
MC/ServiceGuard
支持以下HP9000服务器
T520/T500/890型
D/E/F/GH/I/K型
8X7型
8X2型
要求至少带4个槽的服务器(推荐带6个槽)
支持快速宽域SCSI、单SCSI,HP-FL
要求HP-UX10.0或以上版本操作系统
支持Ethernet、FDDI和TokenRing局域网。
要求至少二个LAN用于连接群集节点
订购信息
MC/ServiceGuard
企业群集的每个节点(系统)都必须有一份MC/ServiceGuard的授权拷贝,产品号B3935AA。
MC/ServiceGuard用的介质和手册与使用授权分开订购,订购时使用产品号B3936AA。
工具包
MC/ServiceGuard数据库工具包(用于ORACLE、Sybase、Progress或Informix)的使用授权用产品号B5139AA订购。每个群集只需一个授权即可。介质使用产品号,用B5121AA订购。
MC/ServiceGuardNFS工具包的使用授权用产品号B5140AA订购。每个群集只需一个授权即可。介质使用产品号,用B5125AA订购。