本文的实例,则是由于cluster软件的故障造成了无法对共享磁盘柜进行访问,也就从事实上导致了服务的不可用性,这是用冗余手段也难以解决的问题。笔者希望通过对此实例的分析,能带给大家一些解决集群故障的启示。
错误现象 【相关文章:路由器网络服务安全配置】
应用硬件环境为两台服务器与一台ra4100磁盘柜通过光纤hub组成了一个集群环境。运行软件环境为microsoft windows 2000 advanced server,使用windows 2000自带的cluster软件。 【扩展阅读:路由器基础配置及传输协议】
event type: warning 【扩展信息:路由器访问控制的安全配置】
系统启动后,发现集群服务无法正常启动,集群管理器也无法正常打开,在任一节点,打开资源管理器,都无法看到共享磁盘柜,相应安装在共享磁盘柜上的软件也就无法正常启动与使用。打开事件日志,可以发现以下错误:
event id: 1019
event source: clussvc
event category: log mgr
description: the log file q:mscsquolog.log was found to be corrupt. an attempt will be made to reset it, or you should use the cluster administrator utility to adjust the maximum size.
除以上比较明显描述的错误外,事件日志中还可以发现以下记录:
event id:1067;event id: 1148
解决方法
从事件日志分析,quorum.log 文件出现了错误,导致了系统集群服务不能正常启动,解决问题的关键在于能够把quorum.log文件恢复到一个初始化状态,从而可以使系统集群服务正常启动。
解决步骤
1.通过-resetquorumlog参数来启动cluster,以达到初始化quorum.log的目的。
1)打开控制面板,双击“服务”(service)图标;
2)在服务管理器中找到cluster service,右键点击“属性”(properties);
... 下一页