服务创造价值、存在造就未来
重庆石谷严格遵循以下流程进行数据库系统安装配置工作。

图二 数据库系统安装流程图
流程说明:
(1)数据库协维人员根据数据库要求,协助需求方评审,制定初步规划。落实相关资源,并按需求方要求执行。
(2)数据库协维人员进行安装调试,安装完毕之后测试。在此过程中,系统协维人员给与必要的协助(创建帐号、赋予权限等)。
(3)系统协维人员在安装的服务器上修改服务器档案,确保该服务器档案反映了该服务器的最新状态。
(4)数据库协维人员制定数据库档案,记录新安装的数据库的状态。
(5)测试没有问题之后,该数据库系统安装完毕,汇报相关人员及交付需求方使用。
重庆石谷对数据库日志和对应主机日志的巡检工作制定了每日巡检计划,规定了巡检工作的细粒度和频率,数据库协维工程师依照巡检计划每天定时开展日志检查、告警日志分析、数据库性能指标检查、相关日志清理等巡检工作。
每日巡检计划模板示例:
数据库 | 数据库日志 | 主机日志 | 性能指标 | 日志清理 | 结果分析 | 执行人 |
核心库 | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16点/天 | |
务工易 | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16点/天 | |
中央信息 | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16点/天 | |
IVR座席 | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16点/天 | |
二线客服 | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16点/天 | |
经分 | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16点/天 | |
百事易 | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16点/天 | |
病虫害 | 3次/天 | 3次/天 | 5次/天 | 1次/1月 | 16点/天 |
巡检内容及报告模板示例:
数据库 | 数据库日志 | 主机日志 | 监听日志 | 空间检查 | 结果分析 |
核心库 | alert_db.log | messages | listener.log | df -h | 16点/天 |
务工易 | alert_db.log | messages | listener.log | df -h | 16点/天 |
中央信息 | alert_db.log | messages | listener.log | df -h | 16点/天 |
IVR座席 | alert_db.log | messages | listener.log | df -h | 16点/天 |
二线客服 | alert_db.log | messages | listener.log | df -h | 16点/天 |
经分 | alert_db.log | messages | listener.log | df -h | 16点/天 |
百事易 | alert_db.log | messages | listener.log | df -h | 16点/天 |
病虫害 | alert_db.log | messages | listener.log | df -h | 16点/天 |
指标内容及报告模板示例:
数据库 | 表空间检查 | TOPSQL | 当前会话 | 失效索引 | 无效对象检查 |
核心库 | 脚本 | awr报告 | 脚本 | 脚本 | 脚本 |
务工易 | 脚本 | awr报告 | 脚本 | 脚本 | 脚本 |
中央信息 | 脚本 | awr报告 | 脚本 | 脚本 | 脚本 |
IVR座席 | 脚本 | awr报告 | 脚本 | 脚本 | 脚本 |
二线客服 | 脚本 | awr报告 | 脚本 | 脚本 | 脚本 |
经分 | 脚本 | awr报告 | 脚本 | 脚本 | 脚本 |
百事易 | 脚本 | awr报告 | 脚本 | 脚本 | 脚本 |
病虫害 | 脚本 | awr报告 | 脚本 | 脚本 | 脚本 |
巡检操作方式示例:
ftp 192.168.180.62 oracle 用户登录
在如下目录 获取当日目录所有信息,然后发给相关负责人。
/home/oracle/rpt_pday/
drwxr-xr-x 2 oracle oinstall 4096 Mar 22 09:26 20120322
在检查日志时,查看有无“ORA-”,Error”,“Failed”等出错信息,发现错误提示信息,根据错误进行分析,判断、处理,事后对相关信息做备案,反馈相关人员。
要保持数据库安全稳定运行,需要全面的巡检和维护计划,重庆石谷制定了长期及特殊时期维护作业计划。
数据库周期维护计划表:
维护数据库 | 维护日期 | ||||
维护记录 | |||||
频率 | 维护内容 | 备注 | |||
月度 |
| ||||
季度 |
| ||||
半年 | 1、数据库安全补丁升级 2、对数据库运行参数值检查,性能评估、调整 | ||||
一年 | 1、对数据库做一次全面健康检查工作 2、根据本年度运行维护总结,提出下一年相关资源需求计划 | ||||
数据库日常运行过程中,因某种原因导致重大事件,为了保证12582基地的可用性,定制数据库重大事件处理作业计划。
数据库重大事件处理计划表:
数据库 | 维护日期 | |||
维护记录 | ||||
事件 | 处理过程 | 备注 | ||
参数不对 | 检查初始化参数文件是否正常 | |||
控制文件损坏 | 1.确保数据库已经关闭,如果没有用下面的命令来关闭数据库: racdbl>shutdown immediate; 2.查看初始化文件$ORACLE_BASE/admin/pfile/initORCL.ora,确定所有控制文件的路径。 3.用操作系统命令将其它正确的控制文件覆盖错误的控制文件。 4.用下面的命令重新启动数据库: racdbl >startup; 5.用适当的方法进行数据库全备份。 损坏所有的控制文件: 1.确保数据库已经关闭,如果没有用下面的命令来关闭数据库: racdbl >shutdown immediate; 2.从相应的备份结果集中恢复最近的控制文件。对于没有采用带库备份的点可以直接从磁带上将最近的控制文件备份恢复到相应目录;对于采用带库备份的点用相应的rman脚本来恢复最近的控制文件。 3.用下面的命令来创建产生数据库控制文件的脚本: racdbl >startup mount; racdbl >alter database backup controlfile to trace noresetlogs; 4.修改第三步产生的trace文件,将其中关于创建控制文件的一部分语句拷贝出来并做些修改,使得它能够体现最新的数据库结构。假设产生的sql文件名字为createcontrol.sql. 注意: Trace文件的具体路径可以在执行完第3步操作后查$ORACLE_ BASE/admin/bdump/alert_ORCL.ora文件来确定。 5.用下面命令重新创建控制文件: racdbl >shutdown abort; racdbl >startup nomount; racdbl >@createcontrol.sql; 6.用适当的方法进行数据库全备份。 | |||
重做日志文件损坏: | 数据库的所有增、删、改都会记录入重做日志。如果当前激活的重做日志文件损坏,会导致数据库异常关闭。非激活的重做日志最终也会因为日志切换变为激活的重做日志,所以损坏的非激活的重做日志最终也会导致数据库的异常终止。在ipas/mSwitch中每组重做日志只有一个成员,所以在下面的分析中只考虑重做日志组损坏的情况,而不考虑单个重做日志成员损坏的情况。 确定损坏的重做日志的位置及其状态: 1.如果数据库处于可用状态: select * from v$logfile; racdbl >select * from v$log; 2.如果数据库处于已经异常终止: racdbl >startup mount; racdbl >select * from v$logfile; svrmgrl>select * from v$log; 其中,logfile的状态为INVALID表示这组日志文件出现已经损坏;log状态为Inactive:表示重做日志文件处于非激活状态;Active: 表示重做日志文件处于激活状态;Current:表示是重做日志为当前正在使用的日志文件。 损坏的日志文件处于非激活状态: 1.删除相应的日志组: racdbl >alter database drop logfile group group_number; 2.重新创建相应的日志组: racdbl >alter database add log file group group_number (’log_file_descritpion’,…) size log_file_size; 损坏的日志文件处于激活状态且为非当前日志: 1.清除相应的日志组: racdbl>alter database clear unarchived logfile group group_number; 损坏的日志文件为当前活动日志文件: 用命令清除相应的日志组: racdbl>alter database clear unarchived logfile group group_number; 如果清除失败,则只能做基于时间点的不完全恢复。 打开数据库并且用适当的方法进行数据库全备份: racdbl >alter database open; 部分数据文件损坏: 若损坏的数据文件属于非system表空间,则数据库仍然可以处于打开状态可以进行操作,只是损坏的数据文件不能访问。这时在数据库打开状态下可以单独对损坏的数据文件进行恢复。若是system表空间的数据文件损坏则数据库系统会异常终止。这时数据库只能以Mount方式打开,然后再对数据文件进行恢复。可以通过查看数据库日志文件来判断当前损坏的数据文件到底是否属于system表空间。 | |||
上一篇:网络设备运维技术方案
下一篇:IT外包服务技术方案