欢迎来到榆林市某某通信设备专卖店

全国咨询热线：020-123456789

产品中心

推荐产品

创意汽车贴纸速度与激情贴车门引擎盖改装贴个性车身划痕车贴拉花

NFA纽福克斯12A汽车电瓶充电器12V数显车载蓄电池充电器电瓶修复

6.5寸迷宫型低音炮木质空箱体功放汽车音响喇叭音箱外壳孔可改

联系我们

地址：联系地址联系地址联系地址

电话：020-123456789

传真：020-123456789

邮箱：admin@aa.com

新闻中心

首页 >汽车电瓶

分库分表索引设计：二级索引、全局索引的最佳设计实践

来源：榆林市某某通信设备专卖店更新时间：2024-05-01 21:42:21

分库分表索引设计：二级索引、全局索引的最佳设计实践

主键选择

对主键来说，分库分表要保证在所有分片中都唯一，索引设计设计实践它本质上就是索局索一个全局唯一的索引。如果用大部分同学喜欢的引全引自增作为主键，就会发现存在很大的最佳问题。

因为自增并不能在插入前就获得值，分库分表而是索引设计设计实践要通过填 NULL 值，然后再通过函数 last_insert_id()获得自增的索局索值。所以，引全引如果在每个分片上通过自增去实现主键，最佳可能会出现同样的分库分表自增值存在于不同的分片上。

比如，索引设计设计实践对于电商的索局索订单表 orders，其表结构如下（分片键是引全引o_custkey，表的最佳主键是o_orderkey）：

CREATE TABLE `orders` (n `O_ORDERKEY` int NOT NULL auto_increment,n `O_CUSTKEY` int NOT NULL,n `O_ORDERSTATUS` char(1) NOT NULL,n `O_TOTALPRICE` decimal(15,2) NOT NULL,n `O_ORDERDATE` date NOT NULL,n `O_ORDERPRIORITY` char(15) NOT NULL,n `O_CLERK` char(15) NOT NULL,n `O_SHIPPRIORITY` int NOT NULL,n `O_COMMENT` varchar(79) NOT NULL,n PRIMARY KEY (`O_ORDERKEY`),n KEY (`O_CUSTKEY`)n ......n) ENGINE=InnoDBn

如果把 o_orderkey 设计成上图所示的自增，那么很可能 o_orderkey 同为 1 的记录在不同的分片出现，如下图所示：

所以，在分布式数据库架构下，尽量不要用自增作为表的主键：自增性能很差、安全性不高、不适用于分布式架构。

讲到这儿，我们已经说明白了“自增主键”的所有问题，那么该如何设计主键呢？依然还是用全局唯一的键作为主键，比如 MySQL 自动生成的有序 UUID；业务生成的全局唯一键（比如发号器）；或者是开源的 UUID 生成算法，比如雪花算法（但是存在时间回溯的问题）。

总之，用有序的全局唯一替代自增，是这个时代数据库主键的主流设计标准，如果你还停留在用自增做主键，或许代表你已经落后于时代发展了。

索引设计

通过分片键可以把 SQL 查询路由到指定的分片，但是在现实的生产环境中，业务还要通过其他的索引访问表。

还是以前面的表 orders 为例，如果业务还要根据 o_orderkey 字段进行查询，比如查询订单 ID 为 1 的订单详情：

SELECT * FROM orders WHERE o_orderkey = 1n

我们可以看到，由于分片规则不是分片键，所以需要查询 4 个分片才能得到最终的结果，如果下面有 1000 个分片，那么就需要执行 1000 次这样的 SQL ，这时性能就比较差了。

但是，我们知道 o_orderkey 是主键，应该只有一条返回记录，也就是说，o_orderkey 只存在于一个分片中。这时，可以有以下两种设计：

同一份数据，表 orders 根据 o_orderkey 为分片键，再做一个分库分表的实现；
在索引中额外添加分片键的信息。

这两种设计的本质都是通过冗余实现空间换时间的效果，否则就需要扫描所有的分片，当分片数据非常多，效率就会变得极差。

而第一种做法通过对表进行冗余，对于 o_orderkey 的查询，只需要在 o_orderkey = 1的分片中直接查询就行，效率最高，但是设计的缺点又在于冗余数据量太大。

所以，改进的做法之一是实现一个索引表 ，表中只包含 o_orderkey 和分片键 o_custkey，如：

CREATE TABLE idx_orderkey_custkey （n o_orderkey INTn o_custkey INT,n PRIMARY KEY (o_orderkey)n)n

如果这张索引表很大，也可以将其分库分表，但是它的分片键是 o_orderkey ，如果这时再根据字段 o_orderkey 进行查询，可以进行类似二级索引的回表实现：先通过查询索引表得到记录 o_orderkey = 1 对应的分片键 o_custkey 的值，接着再根据 o_custkey 进行查询，最终定位到想要的数据，如：

SELECT * FROM orders WHERE o_orderkey = 1nn=>nn# step 1nSELECT o_custkey FROM idx_orderkey_custkey nWHERE o_orderkey = 1nn# step 2nSELECT * FROM orders nWHERE o_custkey = ? AND o_orderkey = 1n

这个例子是将一条 SQL 语句拆分成 2 条 SQL 语句，但是拆分后的 2 条 SQL 都可以通过分片键进行查询，这样能保证只需要在单个分片中完成查询操作。不论有多少个分片，也只需要查询 2个分片的信息，这样 SQL 的查询性能可以得到极大的提升。

通过索引表的方式，虽然存储上较冗余全表容量小了很多，但是要根据另一个分片键进行数据的存储，依然显得不够优雅。

因此，最优的设计，不是创建一个索引表，而是将分片键的信息保存在想要查询的列中，这样通过查询的列就能直接知道所在的分片信息。

如果我们将订单表 orders 的主键设计为一个字符串，这个字符串中最后一部分包含分片键的信息，如：

o_orderkey = string（o_orderkey + o_custkey）n

那么这时如果根据 o_orderkey 进行查询：

SELECT * FROM OrdersnWHERE o_orderkey = '1000-1';n

由于字段 o_orderkey 的设计中直接包含了分片键信息，所以我们可以直接知道这个订单在分片1 中，直接查询分片 1 就行。

同样地，在插入时，由于可以知道插入时 o_custkey 对应的值，所以只要在业务层做一次字符的拼接，然后再插入数据库就行了。

这样的实现方式较冗余表和索引表的设计来说，效率更高，查询可以提前知道数据对应的分片信息，只需 1 次查询就能获取想要的结果。

这样实现的缺点是，主键值会变大一些，存储也会相应变大。但只要主键值是有序的，插入的性能就不会变差。而通过在主键值中保存分片信息，却可以大大提升后续的查询效率，这样空间换时间的设计，总体上看是非常值得的。

当然，这里我们谈的设计都是针对于唯一索引的设计，如果是非唯一的二级索引查询，那么非常可惜，依然需要扫描所有的分片才能得到最终的结果，如：

SELECT * FROM OrdersnWHERE o_orderate >= ? o_orderdate < ?n

因此，再次提醒你，分布式数据库架构设计的要求是业务的绝大部分请求能够根据分片键定位到 1 个分片上。

如果业务大部分请求都需要扫描所有分片信息才能获得最终结果，那么就不适合进行分布式架构的改造或设计。

最后，我们再来回顾下淘宝用户订单表的设计：

上图是我的淘宝订单信息，可以看到，订单号的最后 6 位都是 308113，所以可以大概率推测出：

淘宝订单表的分片键是用户 ID；
淘宝订单表，订单表的主键包含用户 ID，也就是分片信息。这样通过订单号进行查询，可以获得分片信息，从而查询 1 个分片就能得到最终的结果。

全局表

在分布式数据库中，有时会有一些无法提供分片键的表，但这些表又非常小，一般用于保存一些全局信息，平时更新也较少，绝大多数场景仅用于查询操作。

例如 tpch 库中的表 nation，用于存储国家信息，但是在我们前面的 SQL 关联查询中，又经常会使用到这张表，对于这种全局表，可以在每个分片中存储，这样就不用跨分片地进行查询了。如下面的设计：

唯一索引

最后我们来谈谈唯一索引的设计，与主键一样，如果只是通过数据库表本身唯一约束创建的索引，则无法保证在所有分片中都是唯一的。

所以，在分布式数据库中，唯一索引一样要通过类似主键的 UUID 的机制实现，用全局唯一去替代局部唯一，但实际上，即便是单机的 MySQL 数据库架构，我们也推荐使用全局唯一的设计。因为你不知道，什么时候，你的业务就会升级到全局唯一的要求了。

总结

今天介绍了非常重要的分布式数据库索引设计，内容非常干货，是分布式架构设计的重中之重，建议反复阅读，抓住本文的重点，总结来说：

分布式数据库主键设计使用有序 UUID，全局唯一；
分布式数据库唯一索引设计使用 UUID 的全局唯一设计，避免局部索引导致的唯一问题；
分布式数据库唯一索引若不是分片键，则可以在设计时保存分片信息，这样查询直接路由到一个分片即可；
对于分布式数据库中的全局表，可以采用冗余机制，在每个分片上进行保存。这样能避免查询时跨分片的查询。

转自：拉钩教育

城市分站张家口襄樊呼伦贝尔商洛呼和浩特

友情链接潘达利亚裁缝在哪学潘达利亚绷带怎么学我的摩尔庄园小学生作文烦！宝宝湿疹总复发，可能是这 3 点没做对《DNF手游》铁匠铺效果介绍 DNF：最廉价的至尊装扮？不，这将成为最昂贵的绝版时装战地2解锁武器补丁迷你世界2021橘子最新皮肤激活码王者荣耀王者出征日之塔装备系统详解烦！宝宝湿疹总复发，可能是这 3 点没做对权途红颜秦天明林婉小说阅读（秦天明白薇）最新章节免费在线阅读_秦天明白薇权途红颜秦天明林婉小说阅读免费阅读全文_笔趣阁（秦天明白薇）《英雄联盟》推出合金装备主题莫非小岛秀夫操刀？原神钓鱼对应的鱼饵有哪些原神钓鱼对应的鱼饵图鉴大全《dnf》9月10日数字解密答案是多少 9.10数字解密活动答案一览 dnf男气功最新加点(dnf男气功加点刷图)战地风云2042呆猫云游戏走起，游戏测评来了羊了个羊7月23日通关攻略通关攻略第二关7.23 魔兽世界怀旧服史诗双手剑怎么获得双手剑全属性效果介绍鞭笞者苏萨斯琴瑟仙女出装攻略英雄联盟琴瑟仙女怎么玩辅助装备附魔宝珠有哪些，DNF加移速的宝珠有那些可以附那几个部位《人族无敌》v2.6.62正式版[war3地图]动态焦点：中国冰岛在哪个省？冰岛之名的起源是什么？男性衰老的“加速器”揭晓，烟酒排名垫底，第一名多数人戒不掉英雄联盟S10女枪天赋符文怎么点-赏金猎人S10玩法攻略 gm权限游戏平台哪个好免费权限gm游戏平台排名魔兽世界其他种族坐骑声望为尤尤和梅森弹奏一首生日快乐歌吧~自己武林但是侠客东方宇轩背景故事魔兽世界北风苔原怎么去北风苔原前往方法魔兽世界15周年坐骑怎么获得攻略教你如何应对新副本及便利性优化！带你看韩服春季更新计划 DNF2015国庆礼包国庆套猜想宠物称号光环属性一览暗黑破坏神2-1.09硬盘版下载光遇霞谷冥想任务完成方法穿越火线：枪战王者-钻石抽奖好吗钻石抽奖技巧简要分析 AD妖姬解析上分新选择梦幻西游天罡星最新最全攻略详解怪物特性和打法 TBC怀旧服奥格瑞拉日常一览崇拜声望速刷攻略 DNF80版本时空之门红眼技能各等级数据一览横版格斗网游排行榜羊了个羊第二关攻略，第二关羊了个羊怎么过

联系我们

地址：联系地址联系地址联系地址

电话：020-123456789

传真：020-123456789

邮箱：admin@aa.com

0.2274