分库分表常见中间件介绍和ShardingSphere极速认知 - 超级大汇总——DBC的博客超级大汇总—

一、大话业界常见分库分表中间件介绍

业界常见分库分表中间件
- Cobar（已经被淘汰没使用了）
- TDDL
  - 淘宝根据自己的业务特点开发了 TDDL （Taobao Distributed Data Layer）
  - 基于JDBC规范，没有server，以client-jar的形式存在，引入项目即可使用
  - 开源功能比较少，阿里内部使用为主
- Mycat
  - 地址 http://www.mycat.org.cn/
  - Java语言编写的MySQL数据库网络协议的开源中间件，前身 Cobar
  - 遵守Mysql原生协议，跨语言，跨平台，跨数据库的通用中间件代理
  - 是基于 Proxy，它复写了 MySQL 协议，将 Mycat Server 伪装成一个 MySQL 数据库
  - 和ShardingShere下的Sharding-Proxy作用类似，需要单独部署
- ShardingSphere 下的Sharding-JDBC
  - 地址：https://shardingsphere.apache.org/
  - Apache ShardingSphere 是一套开源的分布式数据库中间件解决方案组成的生态圈
    - 它由 Sharding-JDBC、Sharding-Proxy 和 Sharding-Sidecar 3个独立产品组合
  - Sharding-JDBC
    - 基于jdbc驱动，不用额外的proxy，支持任意实现 JDBC 规范的数据库
    - 它使用客户端直连数据库，以 jar 包形式提供服务，无需额外部署和依赖
    - 可理解为加强版的 JDBC 驱动，兼容 JDBC 和各类 ORM 框架

最感兴趣的是Mycat和ShardingJdbc区别，也是被面试官问比较多的
- 两者设计理念相同，主流程都是SQL解析-->SQL路由-->SQL改写-->结果归并
- sharding-jdbc
  - 基于jdbc驱动，不用额外的proxy，在本地应用层重写Jdbc原生的方法，实现数据库分片形式
  - 是基于 JDBC 接口的扩展，是以 jar 包的形式提供轻量级服务的，性能高
  - 代码有侵入性
- Mycat
  - 是基于 Proxy，它复写了 MySQL 协议，将 Mycat Server 伪装成一个 MySQL 数据库
  - 客户端所有的jdbc请求都必须要先交给MyCat，再有MyCat转发到具体的真实服务器
  - 缺点是效率偏低，中间包装了一层
  - 代码无侵入性

二、分库分表中间件Apache ShardingSphere急速认知

什么是ShardingSphere
- 已于2020年4月16日成为 Apache 软件基金会的顶级项目，懂的都懂
- 是一套开源的分布式数据库解决方案组成的生态圈，定位为 Database Plus
- 它由 JDBC、Proxy 和 Sidecar这 3 款既能够独立部署，又支持混合部署配合使用的产品组成

三大构成（下面图片素材来源 sharding-sphere官网）
- ShardingSphere-Sidecar(规划中，简单知道就行)
  - 定位为 Kubernetes 的云原生数据库代理，以 Sidecar 的形式代理所有对数据库的访问
  - 通过无中心、零侵入的方案提供与数据库交互的啮合层，即 Database Mesh，又可称数据库网格
- ShardingSphere-JDBC
  - 它使用客户端直连数据库，以 jar 包形式提供服务
  - 无需额外部署和依赖，可理解为增强版的 JDBC 驱动，完全兼容 JDBC 和各种 ORM 框架
  - 适用于任何基于 JDBC 的 ORM 框架，如：JPA, Hibernate, Mybatis,或直接使用 JDBC
  - 支持任何第三方的数据库连接池，如：DBCP, C3P0, BoneCP, HikariCP 等；
  - 支持任意实现 JDBC 规范的数据库，目前支持 MySQL，PostgreSQL，Oracle，SQLServer 以及任何可使用 JDBC 访问的数据库
  - 采用无中心化架构，与应用程序共享资源，适用于 Java 开发的高性能的轻量级 OLTP 应用
- ShardingSphere-Proxy
  - 数据库代理端，提供封装了数据库二进制协议的服务端版本，用于完成对异构语言的支持
  - 向应用程序完全透明，可直接当做 MySQL/PostgreSQL
  - 它可以使用任何兼容 MySQL/PostgreSQL 协议的访问客户端（如：MySQL Command Client, MySQL Workbench, Navicat 等）操作数据

三大组件对比

三、分库分表和Sharding-Jdbc常见概念术语讲解

数据节点Node
- 数据分片的最小单元，由数据源名称和数据表组成
- 比如：ds_0.product_order_0
真实表
- 在分片的数据库中真实存在的物理表
- 比如订单表 product_order_0、product_order_1、product_order_2
逻辑表
- 水平拆分的数据库（表）的相同逻辑和数据结构表的总称
- 比如订单表 product_order_0、product_order_1、product_order_2，逻辑表就是product_order
绑定表
- 指分片规则一致的主表和子表
- 比如product_order表和product_order_item表，均按照order_id分片，则此两张表互为绑定表关系
- 绑定表之间的多表关联查询不会出现笛卡尔积关联，关联查询效率将大大提升
广播表
- 指所有的分片数据源中都存在的表，表结构和表中的数据在每个数据库中均完全一致
- 适用于数据量不大且需要与海量数据的表进行关联查询的场景
- 例如：字典表、配置表

四、分库分表和Sharding-Jdbc常见分片算法讲解

数据库表分片（水平库、表）
- 包含分片键和分片策略
分片键 (PartitionKey)
- 用于分片的数据库字段，是将数据库(表)水平拆分的关键字段
- 比如prouduct_order订单表，根据订单号 out_trade_no做哈希取模，则out_trade_no是分片键
- 除了对单分片字段的支持，ShardingSphere也支持根据多个字段进行分片

分片策略（先了解，后面有案例实战）
- 行表达式分片策略 InlineShardingStrategy（必备）
  - 只支持【单分片键】使用Groovy的表达式，提供对SQL语句中的 =和IN 的分片操作支持
  - 可以通过简单的配置使用，无需自定义分片算法，从而避免繁琐的Java代码开发
  - prouduct_order_$->{user_id % 8}` 表示订单表根据user_id模8，而分成8张表，表名称为`prouduct_order_0`到`prouduct_order_7
- 标准分片策略StandardShardingStrategy（需了解）
  - 只支持【单分片键】，提供PreciseShardingAlgorithm和RangeShardingAlgorithm两个分片算法
  - PreciseShardingAlgorithm 精准分片是必选的，用于处理=和IN的分片
  - RangeShardingAlgorithm 范围分配是可选的，用于处理BETWEEN AND分片
  - 如果不配置RangeShardingAlgorithm，如果SQL中用了BETWEEN AND语法，则将按照全库路由处理，性能下降
- 复合分片策略ComplexShardingStrategy（需了解）
  - 支持【多分片键】，多分片键之间的关系复杂，由开发者自己实现，提供最大的灵活度
  - 提供对SQL语句中的=, IN和BETWEEN AND的分片操作支持
- Hint分片策略HintShardingStrategy（需了解）
  - 这种分片策略无需配置分片健，分片健值也不再从 SQL中解析，外部手动指定分片健或分片库，让 SQL在指定的分库、分表中执行
  - 用于处理使用Hint行分片的场景，通过Hint而非SQL解析的方式分片的策略
  - Hint策略会绕过SQL解析的，对于这些比较复杂的需要分片的查询，Hint分片策略性能可能会更好
- 不分片策略 NoneShardingStrategy（需了解）
  - 不分片的策略。

本文作者为小滴老师，转载请注明。

Sharding-Jdbc