三种 Failover 之 Client-Side Connect time Failover、Client-Side TAF、Service-Side TAF
理论背景Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用,连接到故障节点的用户会被自动转移到健康节点,从用户感受而言, 是感觉不到这种切换。正是因为这样,才能根据业务的不同实行分机分业务分负载。一:Failover介绍Oracle RAC 的Failover 可以分为3种:1. Client-Side Connect time Failover2. Client-Side TAF3. Service-Side TAF一.1 Client-Side Connect Time Failovertnsnames.ora文件配置示例:RAC = (DESCRIPTION = (ADDRESS = (PROTOCOL = TCP)(HOST = rac1-vip)(PORT = 1521)) (ADDRESS = (PROTOCOL = TCP)(HOST = rac2-vip)(PORT = 1521)) (LOAD_BALANCE=YES) ( CONNECT_DATA= (SERVER=DEDICATED) (SERVICE_NAME=RAC) ) )一.2 Client-Side TAF(Transparent Application Failover) TAF 的配置也很简单,只需要在客户端的tnsnames.ora中添加FAILOVER_MODE配置项。这个条目有4个子项目需要定义。1. METHOD: 用户定义何时创建到其实例的连接,有BASIC 和 PRECONNECT 两种可选值。 BASIC: 是指在感知到节点故障时才创建到其他实例的连接。PRECONNECT: 是在最初建立连接时就同时建立到所有实例的连接,当发生故障时,立刻就可以切换到其他链路上。两种方法比较: BASIC方式在Failover时会有时间延迟,PRECONNECT方式虽然没有时间延迟,但是建立多个冗余连接会消耗更多资源,两者就是是用时间换资源和用资源换时间的区别。2. TYPE: 用于定义发生故障时对完成的SQL 语句如何处理,其中有2种类型:session 和select.这2种方式对于未提交的事务都会自动回滚,区别在于对select 语句的处理,对于select,用户正在执行的select语句会被转移到新的实例上,在新的节点上继续返回后续结果集,而已经返回的记录集则抛弃。显然为了实现select 方式,Oracle 必须为每个session保存更多的内容,包括游标,用户上下文等,需要更多的资源也是用资源换时间的方案。3. DELAY : 这个参数分别代表重试间隔时间。4. RETRIES: 这个参数分别代表重试次数。示例:RAC = (DESCRIPTION = (ADDRESS = (PROTOCOL = TCP)(HOST = rac1-vip)(PORT = 1521)) (ADDRESS = (PROTOCOL = TCP)(HOST = rac2-vip)(PORT = 1521)) (LOAD_BALANCE=YES) ( CONNECT_DATA= (SERVER=DEDICATED) (SERVICE_NAME=RAC) ( FAILOVER_MODE=(TYPE=session)(METHOD=basic)(RETRIES=180)(DELAY=5) ) ) )一.3 Service-Side TAFService-Side TAF 可以看作是TAF的一种变种,首先Service-SideTAF也是TAF,所有TAF的特点它都有,其次这种TAF是在服务器上配置的,而不像TAF是在客户端配置的。PREFERRED: 首选实例,会优先选择拥有这个角色的实例提供服务。AVAILABLE: 后备实例,用户连接会优先连接PREFFERRED的Instance,当PREFERRED的Instance不可用时,才会被转到AVAILBALE的Instance上。要使用Server-Side TAF必须配置Service。 Service 可以在创建数据库时创建,也可以在创建数据库之后修改,既可以使用dbca 配置向导,也可以用命令行的 方式配置。 操作流程10g:用DBCA 配置Service1). 运行DBCA,选择ORACLE RAC Application Clusters database2). 在第二个界面选择:Services Management3). 第三个界面会出现RAC 数据库列表,用户可以在这个列表中选择要配置Service 的数据库4). 在Serice配置界面中,单击Add 创建新的Service,输入service名字。在Instance列表框定义实例角色,选择那个service1 作为 Preferred(首选实例),Service2 作为availiable(后备实例)。 TAF Policy有三个选项: None, Basic,Pre-connect。 我们选Basic。 最后点击Finish,完成Service 配置。5)在结束Service配置后,服务会自动启动。11g:用srvctl 命令配置Service1 创建service#Srvctl add service -d <database-name> -s <service-name> -r "preferred-instance-list" -a "available-instance-list" -P <TAF-policy> 例如:srvctl add service -d RAC -s Service2 -r "RAC1,RAC2" -a "RAC3,RAC4" -P basic注意:srvctl add service中,只有perferred才会创建服务。 即在OCR中注册一个ora.raw.dmm.rac1.Srv的服务。 2 查看配置信息#srvctl config service -d database-name [-s service-name] [-a]如果这里不指定"-s service-name",就会显示所有Service的配置,这些配置包括preferred 和available instance. 使用-a 选项,还会显示TAF 相关信息。3 是否自动运行service数据库启动时,会自动启动所有的Service。有时为了为了维护需要,需要禁用这个特性,在维护完成后再启动这个特性。#srvctl enable/disable service -d database-name -s service-name -i instance-name4 启动service#srvctl start service -d <database-name> -s <service-name> -i instance-name -o start-option -c connect-string -q如果不指定service-name, 则所有的service 都会被启动,可以使用逗号分隔方式,同时启动多个service。 -i 指定在那个实例上启动service。5 停止service#srvctl stop service -d <database-name> -s <service-name> -i instance-name -c connect-string -q -f其中-f 选项可以强制关闭service,并中断了其所有用户的连接。6 查看service 状态#srvctl status service -d <database-name> -s service-name -i instance-name -f -v其中-f 可以显示被disable的instance 信息,而-v 可以显示详细输出7 删除service#srvctl remove service -d database-name -s service-name -i instance-name [-f] 注意:在使用srvctl 创建service时,需要注意TAF策略选项必须通过dbms_service包来配置。示例:BeginDbms_service.modify_service(Service_name='>Service1',Failover_method=>dbms_service.failover_method_basic,Failover_type=>dbms_service.failover_type_select,Failover_retries=>180,Failover_delay=>5);End;