简介 在任何情况下仅仅交付一个具有丰富功能集的高质量应用程序是不够的在越来越多的时候它还必须满足高可用性标准您是否因为群集技术看起来过于高深难于理解和使用而没有使应用程序再提高一个层次? 随着 Microsoft 的群集服务在 Windows NT? 中引入以及在 Windows Server 系列中正式提供开发人员可使用一些简单工具在群集环境中部署应用程序这些工具能够将群集中的应用程序登记为一般应用程序并且能够通过编写 Windows 脚本的方式来控制应用程序的配置 群集将两个或多个服务器连接在一起使其对客户端呈现为单个计算机在一个群集中连接服务器可以分担工作负载实现单点操作/管理并为满足增长的需求进行相应的调整提供了一种途径因此通过群集可以产生具有高可用性的应用程序 本文着重介绍三种支持群集的 Microsoft 服务器技术之一群集服务我们将说明如何在群集环境中对应用程序轻松执行性能检查而无需更改应用程序代码 三种群集技术 Microsoft 服务器提供了三种支持群集的技术 网络负载平衡 (NLB)组件负载平衡 (CLB) 和 Microsoft 群集服务 (MSCS) 网络负载平衡 网络负载平衡充当前端群集用于在整个服务器群集中分配传入的 IP 流量是为电子商务 Web 站点实现增量可伸缩性和出色可用性的理想选择 最多可以将 个运行 Windows Server 系列产品的计算机连接在一起共享一个虚拟 IP 地址NLB 通过在群集内的多个服务器之间分配其客户端请求来增强可伸缩性随着流量的增加可以向群集添加更多的服务器任何一个群集最多可容纳 个服务器NLB 在为用户提供连续服务的同时还提供了高可用性即自动检测服务器故障并在 秒内在其余服务器中重新分配客户端流量 组件负载平衡 组件负载平衡可以在多个运行站点业务逻辑的服务器之间分配负载它在最多包含八个等同服务器的服务器群集中实现了 COM+ 组件的动态平衡在 CLB 中COM+ 组件位于单独的 COM+ 群集中的服务器上激活 COM+ 组件的调用是平衡到 COM+ 群集中的不同服务器的负载CLB 通过作用于多层群集网络的中间层与 NLB 和群集服务配合工作 CLB 是作为 Application Center 的特性提供的可与 Microsoft 群集服务在同一组计算机上运行 群集服务 群集服务充当后端群集可为数据库消息传递以及文件和打印服务等应用程序提供高可用性当任一节点(群集中的服务器)发生故障或脱机时MSCS 将尝试最大程度地减少故障对系统的影响 图 三种支持群集的 Microsoft 服务器技术通过 Microsoft 群集服务实现故障转移 MSCS 故障转移功能是通过群集中连接的多个计算机中的冗余实现的每台计算机都具有独立的故障状态为了实现冗余需要在群集中的多个服务器上安装应用程序但在任一时刻应用程序只在一个节点上处于联机状态当该应用程序出现故障或该服务器停机时此应用程序将在另一个节点上重新启动 Windows Server 数据中心版支持在一个群集中最多包含 个节点 每个节点都具有自己的内存系统磁盘操作系统和群集资源的子集如果某一节点出现故障另一个节点将接管故障节点的资源(此过程称为故障转移)然后Microsoft 群集服务将在新节点上注册资源的网络地址以便将客户端流量路由至当前拥有该资源的可用系统当故障资源恢复联机状态时MSCS 可配置为适当地重新分配资源和客户端请求(此过程称为故障恢复)要使应用程序恢复到发生故障转移时的那一点节点必须能够访问保持应用程序状态的共享存储区 请注意Microsoft 群集服务旨在提供高可用性而不是真正的容错功能容错一词通常用于描述提供更高级别恢复功能的技术容错服务器通常使用结合了特定软件的高级硬件或数据冗余提供从单个硬件或软件故障近乎瞬时的恢复这类解决方案的成本远远高于群集解决方案因为您必须购买冗余硬件而冗余硬件只不过闲置在那里用于故障恢复Microsoft 群集服务使用价格适宜的标准硬件提供出色的高可用性解决方案同时最大程度地利用计算资源 Microsoft 群集服务基于无共享的群集模型无共享模型规定虽然群集中有多个节点可以访问设备或资源但该资源在一个时刻只能由一个系统占有和管理(在 MSCS 群集中资源是指任何可以联机或脱机可在群集中进行管理一个时刻只能以一个节点作为宿主并可以在节点之间移动的物理组件或逻辑组件) 图 Microsoft 群集服务群集服务结构 Microsoft 群集服务由三个主要组件构成群集服务资源监视器和资源 DLL此外还可以利用群集管理器创建提供管理功能的扩展 DLL 群集服务 群集服务是核心组件并作为高优先级的系统服务运行群集服务控制群集活动并执行如下任务协调事件通知加速群集组件之间的通信处理故障转移操作和管理配置 每个群集节点都运行自己的群集服务 资源监视器 资源监视器是群集服务和群集资源之间的接口并作为独立进程运行群集服务使用资源监视器与资源 DLL 进行通信DLL 处理所有与资源的通信因此 DLL 以资源监视器为宿主可以保护群集服务免受运行不正常或停止工作的资源造成的影响资源监视器的多个副本可以在单个节点上运行从而可以将无法预测的资源与其他资源隔离开 群集服务在需要对资源执行操作时向分配给该资源的资源监视器发送请求如果资源监视器的进程中没有可以处理该类型资源的 DLL则使用注册信息加载与该资源类型相关联的 DLL然后将群集服务的请求传递至其中一个 DLL 的入口点函数资源 DLL 将处理操作的细节以满足资源的特定需要 资源 DLL 第三个关键的 Microsoft 群集服务组件是资源 DLL资源监视器和资源 DLL 使用资源 API 进行通信资源 API 是用于管理资源的入口点回调函数和相关结构及宏的集合 对于群集服务而言资源是任何可进行管理的物理组件或逻辑组件例如磁盘网络名IP 地址数据库Web 站点应用程序以及任何其他可以联机和脱机的实体资源可按类型进行组织资源类型包括物理硬件(例如磁盘驱动器)和逻辑项(例如 IP 地址文件共享和一般应用程序) 每个资源都使用资源 DLL它主要是资源监视器和资源之间的被动转换层资源监视器调用资源 DLL 的入口点函数来查看资源的状态使资源联机和脱机资源 DLL 负责通过任何方便的 IPC 机制与其资源进行通信以实现这些方法 实现其自身资源 DLL 与群集服务通信的应用程序以及使用群集 API 请求和更新群集信息的应用程序都被定义为识别群集的应用程序不使用群集或资源 API 以及群集控制代码函数的应用程序和服务都不识别群集也不知道群集服务在运行这些不识别群集的应用程序通常作为一般应用程序或服务进行管理 识别群集的应用程序和不识别群集的应用程序都可以在群集节点上运行并且都可以作为群集资源进行管理但是只有识别群集的应用程序可以利用群集服务通过群集 API 提供的功能开发识别群集的应用程序需要建立自定义资源类型通过自定义资源类型开发人员可以使其应用程序在群集内发生各种事件(例如节点即将脱机因此会关闭数据库连接)时作出响应并采取必要的措施 对于大多数需要在群集中运行的应用程序最好投入一些时间和资源开发自定义资源类型不过可以先在群集环境中对应用程序进行测试而不必修改应用程序的代码或创建新的资源类型在 Windows Server 系列中未经修改的应用程序可以作为不识别群集的应用程序以基本级别运行群集服务专为此用途提供了一般应用程序资源类型 群集管理器扩展 DLL 群集管理器扩展 DLL 在群集管理器内提供特定于应用程序的管理功能允许用户以同样的方式管理他们的应用程序无论该应用程序是在群集内部运行还是在群集外部运行开发人员可以在群集管理器的框架内提供应用程序管理功能或只是将这些功能链接到现有的管理工具 开发人员可以通过编写扩展 DLL 来扩展群集管理器的功能群集管理器应用程序通过一组已定义的 COM 接口与扩展 DLL 进行通信扩展 DLL 必须实现一组特定的接口并且在群集的每个节点上都进行注册 图 关键组件 群集服务资源监视器和资源 DLL不识别群集的应用程序 不提供其自身资源 DLL 的应用程序或服务仍可以在群集环境中进行配置Windows Server 系列中的群集服务包括仅用于此目的的一般资源 DLL一般应用程序资源 DLL 和一般服务资源 DLL群集服务将这些应用程序或服务看作是不识别群集的一般应用程序或服务 一般资源 DLL 只提供最基本的控制例如一般应用程序资源 DLL 通过确定应用程序的进程是否仍然存在来检查应用程序是否发生故障并通过终止进程使应用程序脱机但它并不依赖于其他资源而是提供一个在群集环境中测试应用程序的简单方法 高可用性记事本 并非所有应用程序都能在群集中高效地工作最有效的评估方式就是在群集中实际部署应 |