- 积分
- 13
- 最后登录
- 2024-4-25
- 精华
- 0
- 阅读权限
- 10
- 主题
- 9
- UID
- 412658
- 帖子
- 32
- PB币
- 399
- 威望
- 0
- 贡献
- 0
- 技术
- 0
- 活跃
- 165
- UID
- 412658
- 帖子
- 32
- PB币
- 399
- 贡献
- 0
- 技术
- 0
- 活跃
- 165
|
客户生产环境是用的windows server 2016 hyperv群集,共有7个节点,安装版本是1607的,上周一,客户在白天的生产过程中,突然所有的虚拟机都离线了,我们公司工程师第一时间赶到现场,通过连接到群集管理器发现,磁盘共享卷处于脱机状态(事件ID:5120和5142),手工将磁盘共享卷联机,但是提示失败,最后采用重启大法,将所有的节点都重新启动,在启动过程中,磁盘共享卷有过短暂的联机,当所有的节点都重启完成后,共享卷又处于脱机状态了,通过观察,发现磁盘共享卷不停的在节点1、2、3、4上来回的切换联机,但这几个节点都提示联机失败,手工将共享卷切换到节点5、6、7,提示连接成功,但不到几分钟,群集又自动将共享卷往节点1、2、3、4上迁移,最后只好把节点1、2、3、4关机,共享卷在节点5上联机成功,群集才开始正常工作,但当我打开节点1、2、3、4后,群集又无法正常工作,最后只好临时将节点1、2、3、4的网络禁用,保证客户白天能正常生产。晚上维护工程师将节点1、2、3、4重新联网接入群集,白天的故障又重新出现,但我们把其中一个节点退域后重新加域,系统居然提示网络错误,按照网上的资料,查看系统的server、TCP/IP netbios、netlogin几个服务,发现都被禁用了,重新将这几个服务设置成自动,并且手工启动后,加域正常了,节点加入群集后居然也能正常工作了……。
现在我有几个问题,不知道大家能不能帮我回答下(因为要提供给客户故障分析报告)
1、server、TCP/IP netbios、netlogin服务理论上都是自动启用的,为什么会莫明被禁用?客户机器平时都有病毒防护,而且故障恢复后我们也对机器进行了杀毒扫描,但没有发现病毒
2、为什么会出现其中部分节点被禁用,而其他节点正常?
3、server 2016是否有相关的BUG,微软有没有发布相关的补丁,补丁号是多少?(server 2012群集好像有相关的BUG,微软发布过相关补丁,但2016的我没有找到相关资料)
|
|