add:记一次数据库扩容处理方案

Floweryu · Feb 21, 2024 · ee31a41 · ee31a41
1 parent c9787fd
commit ee31a41
Show file tree

Hide file tree

Showing 4 changed files with 74 additions and 0 deletions.
diff --git a/src/distributed/assets/202207241454438.png b/src/distributed/assets/202207241454438.png
diff --git a/src/distributed/assets/202207241456533.png b/src/distributed/assets/202207241456533.png
diff --git a/src/distributed/assets/202207241512712.png b/src/distributed/assets/202207241512712.png
diff --git a/src/distributed/记一次数据库扩容处理过程.md b/src/distributed/记一次数据库扩容处理过程.md
@@ -0,0 +1,74 @@
+---
+title: 记一次数据库扩容处理方案
+category: [分布式]
+tag: [随笔]
+date: 2024-02-21 11:25:00
+---
+
+## 背景
+
+> 业务中有一张表user_like，该表记录的是短视频中用户互相关注的数据，比如A关注B，则插一条记录，B关注A，则插一条记录。所以在1500w日活的大背景下，该表所在的库已经扛不住了（也有历史原因），目前是128张表。
+
+## 目标
+
+将该表所在库扩展为两个库，每个库还是128张表，但是每个表的数据会减半。
+
+## 迁移方案
+
+1. 新建两个新数据库集群，每个新库都是128张表(0~127)，同时同步老数据库数据到两个新集群。两个新集群的数据要做到实时同步，老库添加修改哪条数据，两个新库也要跟着变化。
+
+![image-20220724145422950](./assets/202207241454438.png)
+
+2. 上线代码，分库分表映射方案在后面。使用两个新集群的数据库地址，进行查询和插入。这时两个新数据库的proxy还是指向旧数据库。同时验证数据是否写到旧数据库。如果直接将proxy链接到新库A和B，会造成主键冲突。
+
+![image-20220724145612990](./assets/202207241456533.png)
+
+3. DBA将两个新数据库的proxyA和proxyB同时指向两个新集群（30s内）
+
+这一步会有一个问题，当Aproxy切换完成后，Bproxy还没来得及切换时，Bproxy还是指向的旧数据库。此时Aproxy切换成功了，Aproxy已经开始向新数据库A中写入数据了，后面旧数据库在向新数据库中同步数据时，会造成主键冲突的异常。所以会丢失一小段时间数据（大概是Aproxy切换完成到Bproxy切换完成这段时间），参考下图：
+
+![image-20220724151207419](./assets/202207241512712.png)
+
+丢失的这段时间的数据，后续可以让DBA修复。
+
+最后按照分库分表方案删除AB数据库中无用的数据，因为之前两个库数据一致，冗余了。
+
+## 分库分表方案
+
+有两个常量：数据库数量，每个库的表数量，总表数=数据库数x每个库表数目
+
+虚拟表id = 用户id % 总表数
+
+库号 = 虚拟表id / 每个库表数目
+
+表号 = 用户id % 每个库表数目
+
+举例：假设是1个库，4个表。打算把库扩展为2个库，每个库还是4张表（每张表数据量减半）
+
+| 表号   | 0    | 1    | 2    | 3    |
+| ------ | ---- | ---- | ---- | ---- |
+| 用户id | 0    | 1    | 2    | 3    |
+|        | 4    | 5    | 6    | 7    |
+|        | 8    | 9    | 10   | 11   |
+|        | 12   | 13   | 14   | 15   |
+|        | 16   | 17   | 18   | 19   |
+|        | 20   | 21   | 22   | 23   |
+
+将上面数据，拆分成两个数据库，数据如下：
+
+**0号库**：
+
+| 表号   | 0    | 1    | 2    | 3    |
+| ------ | ---- | ---- | ---- | ---- |
+| 用户id | 0    | 1    | 2    | 3    |
+|        | 8    | 9    | 10   | 11   |
+|        | 16   | 17   | 18   | 19   |
+
+**1号库**：
+
+| 表号   | 0    | 1    | 2    | 3    |
+| ------ | ---- | ---- | ---- | ---- |
+| 用户id | 4    | 5    | 6    | 7    |
+|        | 12   | 13   | 14   | 15   |
+|        | 20   | 21   | 22   | 23   |
+