分库分表常见中间件介绍和ShardingSphere极速认知

小滴老师 1.4K 0

一、大话业界常见分库分表中间件介绍

  • 业界常见分库分表中间件
    • Cobar(已经被淘汰没使用了)
    • TDDL
      • 淘宝根据自己的业务特点开发了 TDDL (Taobao Distributed Data Layer)
      • 基于JDBC规范,没有server,以client-jar的形式存在,引入项目即可使用
      • 开源功能比较少,阿里内部使用为主
    • Mycat
      • 地址 http://www.mycat.org.cn/
      • Java语言编写的MySQL数据库网络协议的开源中间件,前身 Cobar
      • 遵守Mysql原生协议,跨语言,跨平台,跨数据库的通用中间件代理
      • 是基于 Proxy,它复写了 MySQL 协议,将 Mycat Server 伪装成一个 MySQL 数据库
      • 和ShardingShere下的Sharding-Proxy作用类似,需要单独部署

      分库分表常见中间件介绍和ShardingSphere极速认知插图

     

    • ShardingSphere 下的Sharding-JDBC
      • 地址:https://shardingsphere.apache.org/
      • Apache ShardingSphere 是一套开源的分布式数据库中间件解决方案组成的生态圈
        • 它由 Sharding-JDBC、Sharding-Proxy 和 Sharding-Sidecar 3个独立产品组合
      • Sharding-JDBC
        • 基于jdbc驱动,不用额外的proxy,支持任意实现 JDBC 规范的数据库
        • 它使用客户端直连数据库,以 jar 包形式提供服务,无需额外部署和依赖
        • 可理解为加强版的 JDBC 驱动,兼容 JDBC 和各类 ORM 框架

      分库分表常见中间件介绍和ShardingSphere极速认知插图2

       

 

  • 最感兴趣的是Mycat和ShardingJdbc区别,也是被面试官问比较多的
    • 两者设计理念相同,主流程都是SQL解析-->SQL路由-->SQL改写-->结果归并
    • sharding-jdbc
      • 基于jdbc驱动,不用额外的proxy,在本地应用层重写Jdbc原生的方法,实现数据库分片形式
      • 是基于 JDBC 接口的扩展,是以 jar 包的形式提供轻量级服务的,性能高
      • 代码有侵入性
    • Mycat
      • 是基于 Proxy,它复写了 MySQL 协议,将 Mycat Server 伪装成一个 MySQL 数据库
      • 客户端所有的jdbc请求都必须要先交给MyCat,再有MyCat转发到具体的真实服务器
      • 缺点是效率偏低,中间包装了一层
      • 代码无侵入性

二、分库分表中间件Apache ShardingSphere急速认知

  • 什么是ShardingSphere
    • 已于2020年4月16日成为 Apache 软件基金会的顶级项目,懂的都懂
    • 是一套开源的分布式数据库解决方案组成的生态圈,定位为 Database Plus
    • 它由 JDBC、Proxy 和 Sidecar这 3 款既能够独立部署,又支持混合部署配合使用的产品组成

 

  • 三大构成(下面图片素材来源 sharding-sphere官网)
    • ShardingSphere-Sidecar(规划中,简单知道就行)
      • 定位为 Kubernetes 的云原生数据库代理,以 Sidecar 的形式代理所有对数据库的访问
      • 通过无中心、零侵入的方案提供与数据库交互的啮合层,即 Database Mesh,又可称数据库网格

     

    • ShardingSphere-JDBC
      • 它使用客户端直连数据库,以 jar 包形式提供服务
      • 无需额外部署和依赖,可理解为增强版的 JDBC 驱动,完全兼容 JDBC 和各种 ORM 框架
      • 适用于任何基于 JDBC 的 ORM 框架,如:JPA, Hibernate, Mybatis,或直接使用 JDBC
      • 支持任何第三方的数据库连接池,如:DBCP, C3P0, BoneCP, HikariCP 等;
      • 支持任意实现 JDBC 规范的数据库,目前支持 MySQL,PostgreSQL,Oracle,SQLServer 以及任何可使用 JDBC 访问的数据库
      • 采用无中心化架构,与应用程序共享资源,适用于 Java 开发的高性能的轻量级 OLTP 应用

      分库分表常见中间件介绍和ShardingSphere极速认知插图4

    • ShardingSphere-Proxy
      • 数据库代理端,提供封装了数据库二进制协议的服务端版本,用于完成对异构语言的支持
      • 向应用程序完全透明,可直接当做 MySQL/PostgreSQL
      • 它可以使用任何兼容 MySQL/PostgreSQL 协议的访问客户端(如:MySQL Command Client, MySQL Workbench, Navicat 等)操作数据

分库分表常见中间件介绍和ShardingSphere极速认知插图6

  • 三大组件对比

分库分表常见中间件介绍和ShardingSphere极速认知插图8

三、分库分表和Sharding-Jdbc常见概念术语讲解

  • 数据节点Node
    • 数据分片的最小单元,由数据源名称和数据表组成
    • 比如:ds_0.product_order_0
  • 真实表
    • 在分片的数据库中真实存在的物理表
    • 比如订单表 product_order_0、product_order_1、product_order_2
  • 逻辑表
    • 水平拆分的数据库(表)的相同逻辑和数据结构表的总称
    • 比如订单表 product_order_0、product_order_1、product_order_2,逻辑表就是product_order
  • 绑定表
    • 指分片规则一致的主表和子表
    • 比如product_order表和product_order_item表,均按照order_id分片,则此两张表互为绑定表关系
    • 绑定表之间的多表关联查询不会出现笛卡尔积关联,关联查询效率将大大提升

    分库分表常见中间件介绍和ShardingSphere极速认知插图10

  • 广播表
    • 指所有的分片数据源中都存在的表,表结构和表中的数据在每个数据库中均完全一致
    • 适用于数据量不大且需要与海量数据的表进行关联查询的场景
    • 例如:字典表、配置表

四、分库分表和Sharding-Jdbc常见分片算法讲解

  • 数据库表分片(水平库、表)
    • 包含分片键和分片策略

     

  • 分片键 (PartitionKey)
    • 用于分片的数据库字段,是将数据库(表)水平拆分的关键字段
    • 比如prouduct_order订单表,根据订单号 out_trade_no做哈希取模,则out_trade_no是分片键
    • 除了对单分片字段的支持,ShardingSphere也支持根据多个字段进行分片

 

  • 分片策略(先了解,后面有案例实战)

    分库分表常见中间件介绍和ShardingSphere极速认知插图12

    • 行表达式分片策略 InlineShardingStrategy(必备
      • 只支持【单分片键】使用Groovy的表达式,提供对SQL语句中的 =和IN 的分片操作支持
      • 可以通过简单的配置使用,无需自定义分片算法,从而避免繁琐的Java代码开发
      • prouduct_order_$->{user_id % 8}` 表示订单表根据user_id模8,而分成8张表,表名称为`prouduct_order_0`到`prouduct_order_7

     

    • 标准分片策略StandardShardingStrategy(需了解)
      • 只支持【单分片键】,提供PreciseShardingAlgorithm和RangeShardingAlgorithm两个分片算法
      • PreciseShardingAlgorithm 精准分片 是必选的,用于处理=和IN的分片
      • RangeShardingAlgorithm 范围分配 是可选的,用于处理BETWEEN AND分片
      • 如果不配置RangeShardingAlgorithm,如果SQL中用了BETWEEN AND语法,则将按照全库路由处理,性能下降

     

    • 复合分片策略ComplexShardingStrategy(需了解)
      • 支持【多分片键】,多分片键之间的关系复杂,由开发者自己实现,提供最大的灵活度
      • 提供对SQL语句中的=, IN和BETWEEN AND的分片操作支持

     

    • Hint分片策略HintShardingStrategy(需了解)
      • 这种分片策略无需配置分片健,分片健值也不再从 SQL中解析,外部手动指定分片健或分片库,让 SQL在指定的分库、分表中执行
      • 用于处理使用Hint行分片的场景,通过Hint而非SQL解析的方式分片的策略
      • Hint策略会绕过SQL解析的,对于这些比较复杂的需要分片的查询,Hint分片策略性能可能会更好

         

    • 不分片策略 NoneShardingStrategy(需了解)
      • 不分片的策略。

发表评论 取消回复
表情 图片 链接 代码

分享