必看的数据库使用规范
导读:
关于MySQL数据库规范,相信大家多少看过一些文档。本篇文章给大家详细分类总结了数据库相关规范,从库表命名设计规范讲起,到索引设计规范,后面又给出SQL编写方面的建议。相信这些规范适用于大多数公司,也希望大家都能按照规范来使用我们的数据库,这样我们的数据库才能发挥出更高的性能。
关于库:
- 【强制】库的名称必须控制在32个字符以内,英文一律小写。
- 【强制】库的名称格式:业务系统名称_子系统名。
- 【强制】库名只能使用英文字母,数字,下划线,并以英文字母开头。
- 【强制】创建数据库时必须显式指定字符集,并且字符集只能是utf8或者utf8mb4。创建数据库SQL举例:Create database db1 default character set utf8;
- 【建议】临时库、表名以
tmp_
为前缀,并以日期为后缀,备份库、表以bak_
为前缀,并以日期为后缀。
关于表
- 【强制】表和列的名称必须控制在32个字符以内,表名只能使用字母、数字和下划线,一律小写。
- 【强制】表名要求模块名强相关,同一模块使用的表名尽量使用统一前缀。
- 【强制】创建表时必须显式指定字符集为utf8或utf8mb4。
- 【强制】列名尽量不用关键字(如type,order等)。
- 【强制】创建表时必须显式指定表存储引擎类型,如无特殊需求,一律为InnoDB。
- 【强制】建表必须有comment。
- 【强制】对于超过100W行的大表进行alter table,必须经过DBA审核,并在业务低峰期执行,多个alter需整合在一起。
因为alter table会产生表锁,期间阻塞对于该表的所有写入,对于业务可能会产生极大影响。 -
【建议】建表时关于主键:表必须有主键
(1)强制要求主键为id,类型为int或bigint,且为auto_increment 建议使用unsigned无符号型。(2)标识表里每一行主体的字段不要设为主键,建议设为其他字段如user_id,order_id等,并建立unique key索引。
因为如果设为主键且主键值为随机插入,则会导致innodb内部page分裂和大量随机I/O,性能下降。 - 【建议】核心表(如用户表)必须有行数据的创建时间字段create_time和最后更新时间字段update_time,便于查问题。
- 【建议】表中所有字段尽量都是NOT NULL属性,业务可以根据需要定义DEFAULT值。
因为使用NULL值会存在每一行都会占用额外存储空间、数据迁移容易出错、聚合函数计算结果偏差等问题。 - 【建议】中间表用于保留中间结果集,名称必须以
tmp_
开头。备份表用于备份或抓取源表快照,名称必须以bak_
开头。中间表和备份表定期清理。 -
【示范】一个较为规范的建表语句:
CREATE TABLE user_info ( `id` int unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键', `user_id` bigint(11) NOT NULL COMMENT '用户id', `username` varchar(45) NOT NULL COMMENT '真实姓名', `email` varchar(30) NOT NULL COMMENT '用户邮箱', `nickname` varchar(45) NOT NULL COMMENT '昵称', `birthday` date NOT NULL COMMENT '生日', `sex` tinyint(4) DEFAULT '0' COMMENT '性别', `short_introduce` varchar(150) DEFAULT NULL COMMENT '一句话介绍自己,最多50个汉字', `user_resume` varchar(300) NOT NULL COMMENT '用户提交的简历存放地址', `user_register_ip` int NOT NULL COMMENT '用户注册时的源ip', `create_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间', `update_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '修改时间', `user_review_status` tinyint NOT NULL COMMENT '用户资料审核状态,1为通过,2为审核中,3为未通过,4为还未提交审核', PRIMARY KEY (`id`), UNIQUE KEY `uniq_user_id` (`user_id`), KEY `idx_username`(`username`), KEY `idx_create_time_status`(`create_time`,`user_review_status`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='网站用户基本信息'
关于索引
- 【强制】InnoDB表必须主键为id int/bigint auto_increment,且主键值禁止被更新。
- 【强制】InnoDB和MyISAM存储引擎表,索引类型必须为BTREE。
- 【建议】主键的名称以
pk_
开头,唯一键以uniq_
或uk_
开头,普通索引以idx_
开头,一律使用小写格式,以字段的名称或缩写作为后缀。 - 【建议】单个表上的索引个数不能超过8个。
- 【建议】在建立索引时,多考虑建立联合索引,并把区分度最高的字段放在最前面。如列userid的区分度可由select count(distinct userid)计算出来。
- 【建议】在多表join的SQL里,保证被驱动表的连接列上有索引,这样join执行效率最高。
- 【建议】建表或加索引时,保证表里互相不存在冗余索引。
对于MySQL来说,如果表里已经存在key(a,b),则key(a)为冗余索引,需要删除。
SQL编写
- 【强制】程序端SELECT语句必须指定具体字段名称,禁止写成 *。
- 【强制】程序端insert语句指定具体字段名称,不要写成insert into t1 values(…)。
- 【强制】除静态表或小表(100行以内),DML语句必须有where条件,且使用索引查找。
- 【强制】where条件里等号左右字段类型必须一致,否则无法利用索引。
- 【强制】WHERE 子句中禁止只使用全模糊的LIKE条件进行查找,必须有其他等值或范围查询条件,否则无法利用索引。
- 【强制】索引列不要使用函数或表达式,否则无法利用索引。如where length(name)=’Admin’或where user_id+2=10023。
- 【建议】insert into…values(XX),(XX),(XX).. 这里XX的值不要超过5000个。
值过多虽然上线很很快,但会引起主从同步延迟。 - 【建议】SELECT语句不要使用UNION,推荐使用UNION ALL,并且UNION子句个数限制在5个以内。
因为union all不需要去重,节省数据库资源,提高性能。 - 【强制】禁止跨db的join语句。
- 【建议】不建议使用子查询,建议将子查询SQL拆开结合程序多次查询,或使用join来代替子查询。
- 【建议】线上环境,多表join不要超过5个表。
- 【建议】在多表join中,尽量选取结果集较小的表作为驱动表,来join其他表。
- 【建议】批量操作数据时,需要控制事务处理间隔时间,进行必要的sleep。
- 建议】事务里包含SQL不超过5个
因为过长的事务会导致锁数据较久,MySQL内部缓存、连接消耗过多等问题。 - 【建议】事务里更新语句尽量基于主键或unique key,如update … where id=XX;
否则会产生间隙锁,内部扩大锁定范围,导致系统性能下降,产生死锁。 - 【建议】减少使用order by,和业务沟通能不排序就不排序,或将排序放到程序端去做。Order by、group by、distinct这些语句较为耗费CPU,数据库的CPU资源是极其宝贵的。
- 【建议】order by、group by、distinct这些SQL尽量利用索引直接检索出排序好的数据。如where a=1 order by b可以利用key(a,b)。
- 【建议】包含了order by、group by、distinct这些查询的语句,where条件过滤出来的结果集请保持在1000行以内,否则SQL会很慢。