首页 > 技术 > 技术文摘 > 云南联通容灾实施案例 李卫民

云南联通容灾实施案例 李卫民

2004-05-24 00:00:00   作者:   来源:   评论:0 点击:




  本期工程采用了HP高端磁盘阵列XP512进行远程数据容灾,在云南联通业务中心本地新增一台HP XP512。同时,在异地备份中心新增一台XP512存储服务器,作为主生产中心XP512的异地容灾备份。本次容灾的建设目标是对综合营帐系统、专业计费、短消息计费系统进行同城异地数据级容灾的综合数据容灾系统,业务系统的数据将可以通过基于XP磁盘阵列的Continuous Access XP软件实时同步复制到备份数据中心的XP512中,从而实现数据的远程保护
下图是方案规划的容灾系统示意图(见图1)。

  硬件环境的搭建在此就不赘述,下面主要从整个工程的重点和难点:系统迁移进行着重介绍。
系统迁移需求分析
在本次案例实施中,选取营业系统的迁移做简要说明。
一、系统现状
  综合营账系统应用目前运行在两台主机superdome组成的群集上,其中一台运行营业的应用,另一台运行账务的应用。数据存储在一台MA8000磁盘阵列中,由于系统数据量较大,营业和账务的数据迁移工作必须分开进行,所以在一个系统数据迁移完毕后,MA8000磁盘阵列仍然需要在线,以保证其他系统迁移前的正常工作。
二、系统数据迁移要求
  由于需迁移系统均为在线运行,因此,要尽量减少业务的影响。为此,整个迁移过程必须按以下步骤进行:
  1.营业系统负责全省所有业务受理及客服系统的查询,如发生长时间中断,会对业务及公司形象带来非常不利影响。因此,业务中断必须在夜间或业务量较少时进行。
三、风险分析
实施原则
实施重点
  实施的重点在于系统迁移的前期准备、迁移后数据一致性检查及应用的测试验证工作。
实施难点
  实施的难点在于系统迁移过程中应急情况下系统和数据的可恢复性。
存在风险
  项目中的风险贯穿于整个实施过程,在项目实施前应充分考虑到所有可能存在的风险,考虑出现风险时的应急措施,采取相应的手段规避风险。可能存在的风险有:
  1.系统迁移的数据量较大,需要计划足够的时间;
营业系统迁移计划
  根据以上分析,总体计划分为前期准备阶段、系统迁移实施阶段和迁移后系统试运行阶段三个阶段。
一、 前期准备阶段
  前期准备阶段是整个系统迁移成功的关键,该阶段需要完成的工作有:
  1.掌握系统的现状、分布、IP地址、用途等,制定详细迁移任务清单;
二、 系统迁移实施阶段
  为了系统的可靠性、数据的完整性和可恢复性,应对现有系统进行软硬件方面的检测,并对系统和数据进行备份,一旦在迁移过程中发生问题,可以马上恢复原有系统,保证系统运行。在此阶段需要完成的工作有:
  1.迁移前的设备检测,系统、数据备份(如数据库未打开归档,需在实施迁移前打开);
  其中系统备份前最好对设备硬件和软件分别进行检查,确认迁移前系统处于正常状态。迁移的每个步骤都要按事先的规划进行,并确保操作的可逆性,一旦出现问题系统可以回退到迁移前状态。
营业系统迁移应急措施
一、系统迁移前的异常
二、系统迁移过程中的异常
三、 系统迁移后的异常
数据库迁移
一、数据库信息调查
  数据库的迁移主要是所有数据文件、重做日志、控制文件的迁移,在准备阶段需调查清楚所有在用的数据文件、重做日志、控制文件所在裸盘的详细情况。同时建议数据库管理员在迁移前尽量不要添加新的数据文件,如遇特殊情况需增加新的数据文件,则必须通知工程项目组对已调查的数据进行更新。
二、在XP512上创建物理卷组和对应的逻辑卷
三、数据库备份与迁移
1. Oracle数据库物理备份准备。
  A 使用dd拷贝和在sqlplus下用"alter database backup controlfile to trace"分别备份数据库控制文件;
  3.修改inityy.ora文件,指定新的controlfile name(在XP512上),确保数据库可以启动,确保归档备份目录有足够空间。
  4.停主机上所有应用程序,正常宕数据库,完后重启数据库(不启监听),根据业务情况编写SQL提取一致性数据,将结果用spool输出至一文本文件中保存。此外建议使用"alter system switch logfile"将所有日志组均做一次切换。
  5.再次检查数据库数据文件是否与调查结果一致。
  6.正常宕数据库,用dd物理移植数据文件、控制文件、日志文件到XP512上,实际可生成多个shell并行执行。
  7.在XP512上启动数据库到mount状态,将数据文件指向XP512。
  10.在测试环境中进行应用程序的验证。
四、 异常情况处理
  原存储设备MA8000的逻辑卷不会立即删除, 这样原来数据库数文件,日志文件不会丢失,即便有控制文件更改,也可用控制文件恢复, 如迁移有问题或时间过长,要留出恢复时间,用原来数据文件、日志文件、控制文件启动原数据库。要求在测试阶段,只能对数据库的内容进行可控的增加、删除、修改。只有多方确认无问题情况下,才能启动应用。同时做好归档的保存,如联机重做日志少,可考虑增加几组联机重做日志。
工程试运行及演习
  系统迁移工作成功后,工程即进入试运行阶段,在此期间相关人员需定时观察主机运行状态、主备两个中心XP512的同步状态及数据库运行状态并记录。系统稳定运行后,应制定定期进行主备中心切换的容灾演习制度,发现问题立即解决,确保在发生灾难时系统的可恢复性。

中国计费网(www.billingchina.com)

相关阅读:

分享到: 收藏

专题