惊喜与局限并存,12c Sharding内测报告抢先看!

简介:

2017年3月,我们终于迎来了Oracle 12cR2,作为国内首批Beta测试用户,我们在2016年1月应邀进行Oracle 12c Sharding 技术测试,并于去年10月完成了12cR2 Sharding 预研报告。由于受Oracle新技术发布限制,直至今日才发布与各位分享。

 

   

一、Oracle 12c Sharding简介

  

 

在Oracle 12cR2之前的版本中, Oracle分区表的所有分区都是在一套数据库中,而Sharding技术,则是使用新的分片技术可以将不同的分区部署到不同的数据库(后面称之为分片节点),而这些数据库都是相互独立且没有地理位置的限制。Oracle宣称这种分片架构具有以下特性:

 

  • 支持数据水平分片,支持数据海量扩展

  • 支持按地理分布、内网部署、公有云或混合云部署方案

  • 支持全面故障隔离

  • 每个分片节点具有独立的硬件资源(CPU、内存、硬盘等)

  • 支持弹性扩展和自动重分布(Auto Rebalancing)

  • 自动部署(Auto deployment)

 

 

   

二、Oracle 12c Sharding体系结构

  

20170306113005892.jpg

 

Oracle sharding技术下的sdb架构(shared database architecture),包括:shard Directors(分片路由器GSM)、shard catalog(分片目录库)、shardgroup(分片组)。

 

1. shard catalog目录库主要作用

  • 存储sdb的元数据

  • 协调数据库

  • 分片表的元数据定义和复制表存储

 

2. Shard director分片导向器主要作用

  • 提供从应用层到分片连接请求的路由导向

  • 跨数据库服务故障切换和管理

  • 连接时负载均衡

 

3. Oracle Routing(两种模式)

  • session-based Routing

所有的事务都只连接到一个单一的shard进行操作。

  • Cross-shard 模式

适用于报表类的查询

事务需要跨多个shard执行操作

 

4. Sdb模式下oracle的连接请求方式分为两种

  • ucp:带shard key的连接请求,sdb数据库是依据shard key来划分shard的,当我们使用shard key进行操作的时候,连接池会将该链接请求发送到正确的shard库中并建立链接。

  • 如果没有sharding key,sdb会将连接请求交给catalog库,它会将目标sql解析并路由请求到正确的shard库。

 

   

三、Oracle 12c Sharding测试环境搭建部署步骤

  

 

环境准备:测试环境使用三台虚拟机进行测试,分别为:shard0(GSM和shardcate),shard1(sh1),shard2(sh2)。

 

软件要求:12.2.0.0.3及以上版本。

 

1. GSM软件部署

 

第一步修改环境变量如下:

 

[oracle@shard0   ~]$ env |grep ORA

ORACLE_BASE=/u01/app/oracle

ORACLE_HOME=/u01/app/oracle/product/12.2.0/gsmhome_1

 

第二步解压缩GSM.zip包并且执行runInstaller脚本(这里使用了图形化界面)

 

20170306113014901.jpg

 

直接点下一步(检查操作系统是否符合安装条件):

 

20170306113021878.jpg

 

点next下一步:

 

20170306113028818.jpg

 

点击install,这样GSM包就安装完成了。

 

后续的数据库软件安装就不展开介绍了,选择NO-CDB选项即可。其他均与之前版本没有任何区别。

 

2. shardcate库上用户及相关权限操作

 

ssh   shard0

su   – oracle

sqlplus   / as sysdba

alter   user gsmcatuser account unlock; --解锁gsm用户

alter   user gsmcatuser identified by passwd_gsmcatuser; --修改gsm用户密码

create   user mygdsadmin identified by passwd_mygdsadmin; --创建管理用户mygdsadmin

grant   connect, create session to mygdsadmin;--赋权限给mygdsadmin

grant   gsmadmin_role to mygdsadmin;--把gsm管理员角色赋予mygdsadmin

grant   inherit privileges on user SYS to GSMADMIN_INTERNAL;

 

3. shardcate上配置remote scheduler

 

ssh   shard0

su   - oralce

sqlplus   / as sysdba

set   echo on

set   termout on

set   time on

spool   /u01/stage/labs/config_remote_scheduler.lst  --设置配置输出的日志

execute   dbms_xdb.sethttpport(8080);--指定scheduler所使用的端口号

Commit;

@?/rdbms/admin/prvtrsch.plb

exec   DBMS_SCHEDULER.SET_AGENT_REGISTRATION_PASS('welcome');  --设置远程shard节点注册到shardcate库所需的密码               

spool   off

 

4. 分片库信息注册

 

ssh   shard1

su   – oracle

schagent   –stop --停止shard库上的守护进程

schagent   –start --停止shard库上的守护进程

schagent   –status –查看shard库上的守护进程的状态

echo   welcome |schagent -registerdatabase shard0 8080 –注册到远程shardcate库分别是密码、主机名、端口号

cd   /data/oracle

mkdir   oradata –创建shard库的数据文件存放位置

mkdir   fast_recovery_area --创建shard库的快速恢复区的位置

ssh   shard2

su   – oracle

schagent   -stop

schagent   -start

schagent   -status

echo   welcome |schagent -registerdatabase shard0 8080

cd   /data/oracle

mkdir   oradata

mkdir   fast_recovery_area

 

5. 配置GSM

 

ssh   shard0

su   – oracle    --oracle用户

gdsctl    --进入gsm交互界面

create   shardcatalog -database shard0:1521:orcl -chunks 12 -user   mygdsadmin/passwd_mygdsadmin -sdb cust_sdb -region region1

--创建shardcatalog库 –database ip(主机名):监听端口号:实例名 –chunks chunk的数量

-user   用户/密码 –sdb sdb名   –region  主端,备端

add   gsm -gsm sharddirector1 -listener 1571 -pwd passwd_gsmcatuser -catalog   shard0:1521:orcl –region -trace_level 16

--添加gsm –gsm gsm名 –listener 监听端口号 –pwd gsmcatuser用户密码 –catalog catalog库基本信息 ip(主机名):监听端口号:实例名   –region 指定是哪个region –trace_level 指定trace的级别位置LOG_DESTINATION参数控制

start   gsm -gsm sharddirector1 –启动gsm

set   _event 17

modify   catalog -agent_password welcome –修改 catalog库守护进程密码为welcome

add   credential -credential oracle_cred -osaccount oracle -ospassword oracle --   specify the operating system user that the extproc agent impersonates when   running a subprogram stored in the library

ssh   shard0

su   – oracle

gdsctl   –进入gsm命令交互模式

set   gsm -gsm sharddirector1 –设置当前分片目录为sharddirector1

connect   mygdsadmin/passwd_mygdsadmin –建立连接

add   shardgroup -shardgroup shgrp1 -deploy_as primary -region region1 –添加主分片组

add   invitednode shard1

create   shard -shardgroup shgrp1  -destination  shard1 -credential   oracle_cred –-不同的shard库添加到不同的分片组里

add   invitednode shard2

create   shard -shardgroup shgrp2  -destination shard2 -credential   oracle_cred –-不同的shard库添加到不同的分片组里

deploy   一键部署。

 

此时一套测试的sdb搭建成功,由于环境有限这里没有做容灾,Oracle提供了OGG和ADG两种方式对shard节点做容灾并且也支持一键部署。

 

   

四、Sharding适用场景限制

  

 

根据Oracle官方对sharding的应用场景介绍描述,Oracle分片技术主要适用以下场景:

  • 面向 OLTP 应用场景

  • 为了优化性能应用程序应该使用分片键

  • 业务场景中 80% 的事务都基于单个分片操作

  • 跨分片操作目前版本支持并不完善

 

对于已知的分片技术使用场景限制,结合浙江移动的业务特点,最后选择客户中心做为本次的测试模型,由于存储资源有限我们选择了数据量相对较小的湖州地市作为测试地市。

 

   

五、Sharding测试模型和测试结果

  

 

客户中心业务简介:

 

1. 客户中心储存的数据来源于原CRM系统中的三户信息和用户订购信息,承载的是客户管理业务;

 

2. 三户信息的核心是用户信息表,其中用户信息表的业务入口是bbb_id,在获取bbb_id和uuu_id的对应关系后,后续都是以uuu_id为主,查询到相应的uuu_id对应的ccc_id/aaa_id的信息,再根据ccc_id和aaa_id的值去查询对应的客户和帐户信息,而用户的订购信息都是根据uuu_id来查询的;

 

3. 对所有前台或用户发起的针对单用户的业务中,基本能保证这些业务都是在同一个分片内操作;

 

4. 用户信息会随着系统承载的用户量的增加有所增长,但这种增长的速度不是海量的扩展速度。

 

测试结果:所有的业务操作大致可以分为以下这三类:

  • 单分片查询

  • duplicate表查询

  • 跨分片查询

 

针对基于单分片的分片表查询,相比于传统的数据库查询速度提升不明显,因为uuu_id列本身加了索引查询速度已经够快了。但是当时数据库的压力提升以后,多个分片节点的sdb带来的优势预计会有一定的体现,因为所有的数据库操作被均匀地负载到多台物理主机上面,由于硬件限制我们没有做性能测试,对于duplicate表的查询本身设计就是从catalog库上通过物化视图到各个shard库里,所以对查询的速度提升没有实质的提升作用。

 

最后的跨分片查询我们在测试过程中发现Oracle不支持where条件用in或者or,我们大部分的应用都会用到这种条件的查询,所以跨分片的查询目前版本支持并不完善。

 

   

六、Sharding测试过程中的问题解决

  

 

1. 环境部署

  • 软件的版本需要12.2.0.0.3及以上的版本

  • 在配置GSM的时候报错信息不会很直观的展示出来,这对于安装部署有很大阻碍。

 

2. 数据导入

  • Duplicate表的数据导入是从catalog库导入,分片表的导入可以从各个shard库导入进去(由于环境有限暂时12.2.0.0.3从catalog库导入还未来得及测试)。

  • 12.2.0.0.3版本以前分片表直接从catalog库导入会报ora-600错误,而且这些错误也没有相应的psu修复。

  • 通过dblink用create table as select的方式创建会报不支持的操作类型的错误。

 

3. 业务测试

跨分片查询在 12.2.0.0.3版本支持并不完善,例如用in或者or 的查询Oracle会直接报错。我们已将改进建议提给Oracle,可能会在正式发布版本中得到解决。

 

所有的连接都经过catalog库,当连接请求并发上去后catalog将成为瓶颈,需创建多个catalog库分担压力。

 

同一schema下的各个分片表必须要有主外键关系。

 原文发布时间为:2017-03-06

本文来自云栖社区合作伙伴DBAplus

相关文章
|
7月前
|
算法 物联网 开发者
分享一个近期开源火爆全网的额温枪方案(硬件+源码)
分享一个近期开源火爆全网的额温枪方案(硬件+源码)
121 1
|
7月前
|
Java 开发者
Alibaba刚上线的JDK源码整合手册,瞬间遭受百万源码开发者追捧
随着JDK的不断迭代更新,国内的一些一线互联网大厂都安耐不住了,都开始了自己内部的JDK源码内卷,其中最受大家关注的阿里最先发布了一份号称21年最新的JDK源码整合手册,瞬间受到大批的源码开发者追捧一时风头无两!!!!
|
9月前
|
存储 算法 安全
哈希竞猜游戏系统开发正式版/成熟案例/方案项目/源码平台
 Hash,一般翻译做散列,或音译为哈希,是把任意长度的输入通过散列算法变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来确定唯一的输入值
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
最早2026?全球优质语言数据「存量」告急!网友:杞人忧天
最早2026?全球优质语言数据「存量」告急!网友:杞人忧天
|
11月前
|
机器学习/深度学习 缓存 SpringCloudAlibaba
假期做了一项调研:大厂为啥都自研RPC?结果合乎情理!
五一假期过的可真快,今天开始,又要搬砖了。在五一假期当中,冰河做了一项调研,感觉结果还是挺合乎情理的。
307 0
假期做了一项调研:大厂为啥都自研RPC?结果合乎情理!
淘宝预售“买崩”程序员20分钟修复,全靠这份亿级流量并发手册
朋友们,今年双11电商大促即将到达,感受到四面八方激动的心情没有? 去年天猫淘宝在双十一中订单可是破了58.3万笔/秒,预测一波今年成交额又会打破去年记录。作为一名互联网民工,我关心的不是订单有多少,而是系统竟然没崩!以及这背后为了抗住这巨大的并发量的程序员同胞们……
|
监控 程序员 开发工具
巧用友盟+U-APM 找出Unity开发游戏启动慢问题解决方案
随着游戏用户的增加,得到越来越多的用户反馈:“游戏打开慢”。使用友盟+U-APM应用性能监控平台找出问题的信息统计,及时快速定位解决问题,以免带来更大的损失。
巧用友盟+U-APM 找出Unity开发游戏启动慢问题解决方案
直播系统源码,迎接新年的却是这些“旧”功能
直播系统源码,迎接新年的却是这些“旧”功能
140 0
|
安全
丝丝顺滑的升级体验--关于成员成长之二
成员的升级,能否提供如游戏中打怪升级一般丝丝顺滑的升级体验
907 0
丝丝顺滑的升级体验--关于成员成长之二
|
Java API C++
项目与产品: 现象,问题及解决方案
现象,问题和解决方案--写于2009年
405 0