Oracle19c集群节点故障恢复：从主机重装到重新加入集群的完整指南

张开发

• 2026/4/13 9:38:36 • 15 分钟阅读

分享文章

1. 故障场景与恢复思路遇到Oracle RAC集群节点故障时很多DBA会感到手足无措。我去年就处理过一个真实案例某金融系统在凌晨突然报警检查发现orcl01节点因磁盘阵列故障完全宕机。这种情况需要先重装主机系统再重新加入集群。整个过程就像给病人做器官移植手术既要确保新器官重装后的节点健康又要保证移植后能与其他器官协同工作。关键恢复原则有三点保持集群配置一致性新节点必须与其他节点保持相同的系统配置彻底清理故障节点残留信息避免旧配置与新节点产生冲突分阶段验证每完成一个步骤都要立即验证不要等全部做完才发现问题常见误区是直接在新主机上安装软件就尝试加入集群这往往会导致各种报错。正确的做法应该像搭积木一样先打好基础系统配置再搭建主体结构集群软件最后完善细节数据库实例。2. 重装后的系统配置2.1 基础环境搭建重装系统后第一件事就是克隆健康节点的环境配置。我习惯用scp把orcl02的配置文件直接拷贝过来# 拷贝多路径配置 scp /etc/multipath.conf rootorcl01:/etc/ # 检查磁盘一致性 fdisk -l | grep -i sd /usr/lib/udev/scsi_id -g -u -d /dev/sd{}网络配置要特别注意VIP和私网IP的设置。有次我漏配了私网IP导致节点间通信异常。hosts文件应该包含这些关键信息10.10.4.26 orcl01 10.10.4.27 orcl02 10.10.4.34 orcl01-vip 192.168.25.1 orcl01-priv2.2 系统参数优化内核参数直接影响数据库性能。我建议直接复制健康节点的配置# 拷贝内核参数 scp /etc/sysctl.conf rootorcl01:/etc/ sysctl -p # 关闭透明大页 echo never /sys/kernel/mm/transparent_hugepage/enabled时间同步是集群稳定运行的关键。有次节点时间不同步导致OCR损坏整个集群瘫痪。配置chrony时要确保所有节点指向相同的时间源systemctl enable chronyd chronyc sources -v3. 清理故障节点信息3.1 删除数据库实例当原节点无法正常运行时需要手动清理其集群信息。先用DBCA删除实例dbca -silent -deleteInstance \ -nodeName orcl01 \ -gdbName orcl \ -instanceName orcl1 \ -sysDBAUserName sys \ -sysDBAPassword 密码特别注意如果实例有活跃服务需要先迁移服务到其他节点srvctl modify service -d orcl -s orclsrv \ -preferred orcl2 \ -available 3.2 彻底清除集群信息删除节点信息就像给集群做减脂手术必须干净彻底# 取消节点pin状态 crsctl unpin css -n orcl01 # 删除节点 crsctl delete node -n orcl01 # 更新GI清单 ./runInstaller -updateNodeList \ ORACLE_HOME$ORACLE_HOME \ CLUSTER_NODES{orcl02} \ CRSTRUE -silent我曾遇到因残留信息导致新节点无法加入的情况后来发现是OCR中还有旧节点的注册信息。这时可以用crsctl query css votedisk检查投票盘状态。4. 重新加入集群4.1 加入前的全面检查就像飞机起飞前要做安全检查加入节点前必须运行CVU验证cluvfy comp peer -refnode orcl02 -n orcl01 cluvfy stage -pre nodeadd -n orcl01常见问题处理如果报SSH互信错误重新执行sshUserSetup.sh如果报时间不同步检查chrony服务状态如果报存储不一致确认multipath配置和磁盘权限4.2 分步加入集群先加入Grid Infrastructureexport IGNORE_PREADDNODE_CHECKSY ./addnode.sh -silent \ CLUSTER_NEW_NODES{orcl01} \ CLUSTER_NEW_VIRTUAL_HOSTNAMES{orcl01-vip}再加入数据库软件# 在oracle用户下执行 ./addnode.sh -silent \ CLUSTER_NEW_NODES{orcl01} \ CLUSTER_NEW_VIRTUAL_HOSTNAMES{orcl01-vip}最后添加数据库实例dbca -silent -addInstance \ -nodeName orcl01 \ -gdbName orcl \ -instanceName orcl1 \ -sysDBAUserName sys \ -sysDBAPassword 密码5. 加入后验证5.1 集群状态检查加入完成后要像医生查房一样全面检查-- 检查实例状态 SELECT inst_id, instance_name, status FROM gv$instance; -- 检查资源状态 crsctl stat res -t重点观察指标所有资源是否都是ONLINE状态实例是否正常注册到集群ASM磁盘组是否正常挂载5.2 服务恢复验证最后一步是恢复原有服务配置srvctl modify service -d orcl -s orclsrv \ -preferred orcl1,orcl2 \ -available 建议进行真实业务测试验证连接池能否正常分配到新节点。我曾经遇到过一个诡异情况虽然集群显示正常但应用连接新节点总会超时。后来发现是防火墙规则没同步导致1521端口被拦截。整个恢复过程就像指挥交响乐团每个乐器节点都要在正确的时间进入。掌握这套方法后处理RAC节点故障就会变得游刃有余。记住关键点配置要一致、清理要彻底、验证要及时。做好这三点就能确保集群恢复万无一失。

更多文章

前端开发 2026/4/13 9:37:59

成都奥迪Q7升级原厂ACC自适应巡航｜技术拆解+本地施工全攻略

作为德系车改装从业者，接触过大量成都奥迪Q7车主的升级需求，其中奥迪ACC自适应巡航升级成都是高频需求，尤其对于经常跑高速、通勤堵在成都绕城/三环的车主来说，ACC升级堪称“解放双脚”的刚需改装。本文从技术层面拆解奥迪Q7原厂A…

张开发

前端开发 2026/4/13 9:36:28

WPS表格小技巧：一键填充空白单元格，告别手动复制粘贴（附详细步骤）

WPS表格高效填充术：3分钟解决空白单元格难题每次拿到同事发来的表格数据，最头疼的就是那些断断续续的空白单元格。上周处理销售报表时，我发现区域列有40%的空白，手动复制粘贴花了半小时，还差点把数据搞混。其实WPS表格…

张开发

前端开发 2026/4/13 9:33:32

【计算机专业必读科幻小说】均衡纪元

《均衡纪元》第一章系统边界“警告：第七区劳资熵值0.89，逼近临界阈值。”中央调度员凯在控制台前睁开眼睛。她的神经网络与整个“均衡者”系统直连，能够感受到那些细微的数据波动——就像皮肤感受到气压变化。第七区。档案显示，那…

张开发

前端开发 2026/4/13 9:33:26

DS4Windows技术深度解析：如何实现跨平台手柄兼容的创新方案

DS4Windows技术深度解析：如何实现跨平台手柄兼容的创新方案【免费下载链接】DS4Windows Like those other ds4tools, but sexier 项目地址: https://gitcode.com/gh_mirrors/ds/DS4Windows 在Windows平台上使用PlayStation控制器进行游戏，曾是无…

张开发

前端开发 2026/4/13 9:29:54

当珍贵视频突然“罢工“：如何用开源神器让损坏的MP4文件起死回生？

当珍贵视频突然"罢工"：如何用开源神器让损坏的MP4文件起死回生？ 【免费下载链接】untrunc Restore a damaged (truncated) mp4, m4v, mov, 3gp video. Provided you have a similar not broken video. 项目地址: https://gitcode.com/gh_mir…

张开发

前端开发 2026/4/13 9:28:05

Pixel Couplet Gen 惊艳作品集：AI灵蛇贺岁创意春联效果展示

Pixel Couplet Gen 惊艳作品集：AI灵蛇贺岁创意春联效果展示 1. 开场：当AI遇见传统年味春节贴春联是中国人延续千年的文化传统。今年，Pixel Couplet Gen模型为这项传统注入了全新的科技活力。这款基于人工智能的春联生成工具，不…

张开发

前端开发 2026/4/13 9:25:40

像素史诗·智识终端STM32最小系统板开发入门：从硬件认识到第一个程序

像素史诗智识终端STM32最小系统板开发入门：从硬件认识到第一个程序 1. 开篇：为什么选择STM32最小系统板如果你刚接触嵌入式开发，可能会被各种开发板搞得眼花缭乱。STM32F103C8T6最小系统板是个不错的起点——它价格亲民、功能完整&#xf…

张开发

前端开发 2026/4/13 9:24:45

轻量级AI模型DeepSeek-R1-Distill-Qwen-1.5B部署指南：内存占用低，运行速度快

轻量级AI模型DeepSeek-R1-Distill-Qwen-1.5B部署指南：内存占用低，运行速度快 1. 模型概述与核心优势 DeepSeek-R1-Distill-Qwen-1.5B是DeepSeek团队基于Qwen2.5-Math-1.5B基础模型，通过知识蒸馏技术融合R1架构优势打造的轻量化版本。这款模…

张开发

前端开发 2026/4/13 9:24:39

Mermaid Live Editor：从代码到图表的实时转换终极指南

Mermaid Live Editor：从代码到图表的实时转换终极指南【免费下载链接】mermaid-live-editor Edit, preview and share mermaid charts/diagrams. New implementation of the live editor. 项目地址: https://gitcode.com/GitHub_Trending/me/mermaid-live-editor…

张开发

前端开发 2026/4/13 9:24:39

Qwen3-ASR-1.7B开源镜像部署指南：免配置GPU环境，纯本地无网络依赖

Qwen3-ASR-1.7B开源镜像部署指南：免配置GPU环境，纯本地无网络依赖 1. 项目简介 Qwen3-ASR-1.7B是基于阿里云通义千问团队开源的中量级语音识别模型开发的本地智能语音转文字工具。这个版本相比之前的0.6B版本有了显著提升，特别是在处理复杂…

张开发

前端开发 2026/4/13 9:20:39

2026年4月 TIOBE 全球编程语言热度排行榜火热出炉

根据2026年4月的编程语言榜单数据，我们可以看到一些有趣的变化和趋势。以下是对榜单的分析： 榜单概述 Python 依然位居榜首，尽管其评分相比去年下降了2.11%。这表明虽然Python的受欢迎程度可能略有下降，但仍然是最受欢迎的编程语言…

张开发

前端开发 2026/4/13 9:18:14

Qwen3.5-9B-AWQ-4bit保姆级部署：无需Python环境，纯Docker镜像开箱即用

Qwen3.5-9B-AWQ-4bit保姆级部署：无需Python环境，纯Docker镜像开箱即用 1. 模型介绍 Qwen3.5-9B-AWQ-4bit是一个支持图像理解的多模态模型，能够结合上传图片与文字提示词，输出中文分析结果。这个模型特别适合处理以下任务&#x…

张开发

Oracle19c集群节点故障恢复：从主机重装到重新加入集群的完整指南

最新文章

mqtt-plus 架构解析（二）：一条 MQTT 消息如何到达你的 @MqttListener

gte-base-zh实战：用Python代码调用API实现智能文本相似度计算

Qwen3辅助软件测试：自动生成测试用例与可视化报告

Qwen3.5-2B多模态实战：博物馆文物图识别+历史背景+艺术风格分析

Qwen3-8B开箱即用：Ollama镜像实测，看它如何解答复杂问题

终极Windows 11精简优化工具：Win11Debloat完全指南

推荐文章

PyCharm社区版+Anaconda环境配置全攻略（避坑指南+清华镜像加速）

企业架构实战：从BA到TA的4A架构全解析（附华为架构图参考）

ESP-Bootstrap：面向ESP32/ESP8266的嵌入式Web固件基础架构

实战 | 从模仿学习到强化学习：自动驾驶轨迹规划的范式演进与代码实现

基于计算机视觉的路口交通密度估计

一文搞懂 Python 的 GIL（全局解释器锁）

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

成都奥迪Q7升级原厂ACC自适应巡航｜技术拆解+本地施工全攻略

WPS表格小技巧：一键填充空白单元格，告别手动复制粘贴（附详细步骤）

【计算机专业必读科幻小说】均衡纪元

DS4Windows技术深度解析：如何实现跨平台手柄兼容的创新方案

当珍贵视频突然“罢工“：如何用开源神器让损坏的MP4文件起死回生？

Pixel Couplet Gen 惊艳作品集：AI灵蛇贺岁创意春联效果展示

像素史诗·智识终端STM32最小系统板开发入门：从硬件认识到第一个程序

轻量级AI模型DeepSeek-R1-Distill-Qwen-1.5B部署指南：内存占用低，运行速度快

Mermaid Live Editor：从代码到图表的实时转换终极指南

Qwen3-ASR-1.7B开源镜像部署指南：免配置GPU环境，纯本地无网络依赖

2026年4月 TIOBE 全球编程语言热度排行榜火热出炉

Qwen3.5-9B-AWQ-4bit保姆级部署：无需Python环境，纯Docker镜像开箱即用

Oracle19c集群节点故障恢复：从主机重装到重新加入集群的完整指南

最新文章

mqtt-plus 架构解析（二）：一条 MQTT 消息如何到达你的 @MqttListener

gte-base-zh实战：用Python代码调用API实现智能文本相似度计算

Qwen3辅助软件测试：自动生成测试用例与可视化报告

Qwen3.5-2B多模态实战：博物馆文物图识别+历史背景+艺术风格分析

Qwen3-8B开箱即用：Ollama镜像实测，看它如何解答复杂问题

终极Windows 11精简优化工具：Win11Debloat完全指南

推荐文章

PyCharm社区版+Anaconda环境配置全攻略（避坑指南+清华镜像加速）

企业架构实战：从BA到TA的4A架构全解析（附华为架构图参考）

ESP-Bootstrap：面向ESP32/ESP8266的嵌入式Web固件基础架构

实战 | 从模仿学习到强化学习：自动驾驶轨迹规划的范式演进与代码实现

基于计算机视觉的路口交通密度估计

一文搞懂 Python 的 GIL（全局解释器锁）

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作 实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

DotNetPy：现代.NET 与 Python 互操作实战指南