三十六、MySQL基础系列笔记之MySQL分区(一)LIST/RANGE/COLUMNS
什么是MySQL分区与分表
**分区:**分区是指根据一定的规则把一个表分解成多个更小的、更容易管理的区块。
**分表:**把一个冗余在单库中的单个表拆分为多个与之相关的逻辑业务子表,如用户表与用户信息表,每一个表都有.myd
数据文件、.myi
索引文件、.frm
表结构文件。
**分库:**将存储在单个物理存储区域的数据库分布到多个物理存储区域。
为什么使用分区
分区有利于管理非常大的表,采用'分而治之'的逻辑。
分区采用了分区键(PartitionKey)的概念,分区键用于根据某个区间值、特定值列表或HASH函数值执行数据的聚集,让数据根据规则分布在不同的分区中,让一个大对象变成一些小对象。
MySQL分区的优点:存储更多数据、优化查询、删除数据、查询
- (存储更多数据)与单个磁盘文件或文件系统分区相比,分区可以存储更多数据;
- (优化查询)分区利于优化查询。如where子句查询中包含分区条件时,可只扫描必要的一个或多个分区表来提高查询效率;
- (删除数据)对于已经过期或不需要保存数据,可通过删除与这些数据有关的分区来快速删除数据;
- (查询)跨多个磁盘来分散数据查询,以获得更到的查询吞吐量。
分区类型
- RANGE分区:基于一个给定连续区间范围,把数据分配到不同的分区;
- LIST分区:基于枚举出的值列表分区;
- COLUMNS分区:既可以多列以可以是非整数;
- HASH分区:基于给定的分区个数,把数据取模分配到不同的分区;
- KEY分区:类似于HASH分区,但使用MySQL提供的哈希函数;
- 子分区:也叫复合分区或组合分区,即在主分区下再做一层分区,将数据再次分割。
查看是否开启分区
select * from information_schema.plugins \G;
PLUGIN_NAME: mysqlx
PLUGIN_VERSION: 1.0
PLUGIN_STATUS: ACTIVE
PLUGIN_TYPE: DAEMON
PLUGIN_TYPE_VERSION: 80020.0
PLUGIN_LIBRARY: NULL
PLUGIN_LIBRARY_VERSION: NULL
PLUGIN_AUTHOR: Oracle Corporation
PLUGIN_DESCRIPTION: X Plugin for MySQL
PLUGIN_LICENSE: GPL
LOAD_OPTION: ON
若PLUGIN_STATUS
为ACTIVE
则说明开启了分区。
MySQL中MERGE、CSV、FEDERATED
这三种引擎不支持创建分区表。同一个分区表的所有分区必须使用同一个存储引擎且分区数量不超过8192个。
使用分区
RAGGE分区
RANGE分区的表是利用取值范围将数据分成分区且是不可重叠的连续区间。
使用VALUES LESS THAN
操作符进行分区定义。
案例:创建员工表并按照商店ID(store_id)进行range分区。
create table `emp`(
id int not null,
name varchar(30),
store_id int not null
) partition by range (store_id) (
partition p0 values less than (15),
partition p1 values less than (35),
partition p2 values less than(55)
);
释义:
1-14的员工将插入到p0;
15-34的员工将插入到p1;
35-54的员工将插入到p2;
若>=55则报错。
insert into emp (id,name,store_id) values (1,'lisi',2);
# store_id>=55,则报错
mysql> insert into emp (id,name,store_id) values (2,'lisi',55);
ERROR 1526 (HY000): Table has no partition for value 55
VALUES LESS THAN MAXVALUE解决插入大于分区_storeid报错问题
可以看到,插入store_id=55的员工,报错了。使用VALUES LESS THAN MAXVALUE
设置大于指定的最高值,下面为表添加新的分区:
alter table emp add partition (partition p3 values less than maxvalue);
# 重新插入
mysql> insert into emp (id,name,store_id) values (2,'lisi',55);
Query OK, 1 row affected (0.00 sec)
RANGE分区适用的情况
- 删除过期数据。使用
alter table emp drop partition 分区
来删除对应分区的数据。如对于有百万记录的表来说,删除分区远比delete
有效; - 经常运行包含分区键的查询。如查询sore_id=2的数据,mysql不会全表扫描,而是直接到p0分区中去扫描查询。
List分区
List分区是建立在离散的值列表告诉数据库特定的值属于哪个分区。
**RANGE与List的区别:**List分区属于一个枚举列表的值的集合;RANGE分区是从属于一个连续区间的值的集合。
使用
List分区使用PARTITION BY LIST(EXPR)
子句来实现;使用PARTITION BY LIST COLUMUNS
创建非整数分区。
EXPR条件:EXPR是某列值或一个基于某列值返回一个整数的表达式,然后通过VALUES IN(value_list)
的方式来定义分区;
value_list
是一个使用逗号分隔的整数列表。
如下案例:
create table demo_art(
id int not null,
arttime date not null,
cate_id int
) partition by list(cate_id) (
partition p0 values in (1,10),
partition p1 values in (5,9),
partition p2 values in (2)
);
注意其格式为
create table 表名 () partition by list(条件)(分区值1,...);
案例结果
# 插入cate_id为1的值,在分区的范围中,插入成功
mysql> insert into demo_art values(1,now(),1);
Query OK, 1 row affected, 1 warning (0.01 sec)
# 插入cate_id为3的值没有在分区中列表,因此插入失败
mysql> insert into demo_art values(1,now(),3);
ERROR 1526 (HY000): Table has no partition for value 3
注意:values in (1,10)指的并不是区间范围,而是这两个值。
COLUMNS分区
COLUMNS是为了解决RANGE与LIST分区只支持整数的分区而引入的分区类型。COLUMNS可以细分为RANGE COLUMNS
和LIST COLUMNS
分区,两者都支持整数、日期时间、字符串三大类型数据。
COLUMNS支持的类型如下 :
整数类型:tinyint、smallint、mediumint、int、bigint
日期日间类型:date、datetime
字符串类型:char、varchar、binary、varbinary
2020-01-15