欢迎您访问365答案网，请分享给你的朋友!

生活常识学习资料

365答案网 > IT知识 > 正文

MySQL数据库规范

时间：2023-06-07

一.字符集和排序规则
同一个数据库实例内，应使用相同的字符集和排序规则。

字符集应使用utf8mb4,排序规则应使用utf8mb4_bin。utf8mb4_bin大小写敏感（utf8字符集没有包含完整的Unicode字符）

不同的字符集和排序规则，容易导致性能问题和大小写判断问题。

二.总体命名规则
（1）不应使用MySQL关键字进行对象命名。（例：add，alter，drop等）

（2）名字不应使用无意义字符，做到见名知义，应使用关键词的英文单词缩写，含义明确，关键词之间用下划线分割。

三.存储引擎
对于MySQL5.0以上版本，应使用InnoDB存储引擎。

相对于Myisam，Innodb存储引擎支持事务、行级锁、更好的数据恢复能力，更好的并发性能，同时对多核、大内存等硬件有更好的支持，支持数据热备份。

四.建表语句
（1）无需指定ENGINE参数，默认使用Innodb。

（2）必须有字段注释和表注释，方便后续维护。

（3）必须设置自增列作为主键。

自增列主键有利于插入性能的提高。（每次插入都是插入到最后，可减少数据页分裂和移动的频率）

可以降低二级索引的空间，提升二级索引的内存命中率。

可以减小page的碎片，提升空间和内存的使用。

（4）字段

一张表的每行记录的字段长度和不应超过8000个字节

基于B+树，Innodb的data page默认是16KB。一个data page中需要至少存储2条记录，当实际存储长度超过8KB时会引起page-overflow

（5）单表的字段个数不宜超过50个。

（6）数据类型

a.满足需求的前提下，应使用占用空间较小的数据类型，使用较简单的数据类型。能用int就不用char、varchar，（mysql处理int类型更简单）能用tinyint就不用int。

b.timestamp类型存储数据的范围是‘1970-01-01 00:00:01’ UTC to ‘2038-01-19 03:14:07’

c.datetime类型存储数据的范围是‘1000-01-01 00:00:00’ to ‘9999-12-31 23:59:59’

d.不应使用float和double存放涉及金额的数据，应使用decimal（浮点类型容易出现精度问题，运算问题）。

e.定长字段使用char类型，如果存储的值长度几乎相同也应使用char类型。

f.不定长字段使用varchar类型，设置适当长度，而不是随意设置较大长度作为最大长度。

g.如果没有包含负数，宜使用UNSIGNED（存储的数据范围会更大）。

（7）外键

不宜使用外键。外键与级联更新适用于单机低并发，不适合分布式高并发集群，级联更新影响速度。

（8）约束

适当建立约束。例如主键约束，非空约束，唯一约束。

为表的字段加上默认值：日期字段加当前时间为默认值，状态字段加默认值。

不宜使用check约束，MySQL对check约束支持不完善。

（9）建议拥有以下字段（先后顺序代表优先级排序）

创建日期 create_date，更新日期 update_date，创建者 create_by，更新者 update_by，删除标记 del_flag，备注信息 remarks。

（10）需建立索引，创建索引应考虑索引原则及使用场景，且索引字段宜设置为not null。

五.查询语句
（1）不宜使用select （应尽量减少查询字段，尽可能使用到覆盖索引查询，减少IO，提升性能）

（2）select count(字段名)统计记录数，该字段为null的记录不会统计到

（3）多表连接时，每个字段需显示指定表名或表的别名作为前缀

（4）多表连接时，应将过滤性比较大的表作为驱动表。关联字段需要有索引。表连接个数不宜超过3个，语句的嵌套层数不宜超过3层。（MySQL优化器较弱，降低复杂度，可降低出现性能问题的可能性）

（5）进行数据比较时，如果两边类型不一致，应在一方加上类型转换的函数

（6）sql中in包含的值应少于1000个

（7）sql语句可用in代替or（in是范围查找，内部会对in的值进行排序查找，比or的效率高）

（8）如果排序字段没有索引，应创建索引，或尽量减少排序。

（9）如果两个结果集中没有重复数据无需去重，可以用union all代替union。union将结果集合并后进行唯一性过滤，会涉及到排序，大量的CPU运算，加大资源消耗及延迟。

（10）使用合理的分页，提高效率。（先快速定位需获取记录的主键范围）

select from table_name limit 100000,10;可改写为

select * from table_name where id >100000 limit 10;

  select * from table_name where user = 'x' limit 100000,10;改为

  select * from table_name where id in (select id from table_name where user = 'x' limit 100000,10);

数据量大还可用join

（11）in和exists的比较。

in适合内表比外表查询结果集小的情况，反之使用exists。内外表数据量接近时，效率接近。

not in内外表都不走索引。not exists内表走索引，效率远高于not in。

in把内表和外表做hash连接，先查询内表，把内表的结果存到缓存，然后去遍历查询外表。

exists先查询内表，然后将主查询放到子查询中做验证。

（12）group by和order by中的表达式只涉及到一个表中的列，这样MySQL才有可能使用索引来进行优化。

（13）不宜使用order by rand(),该操作会严重消耗CPU，使数据库性能呈指数级下降。

（14）MySQL hint（查询优化器提示）

   1、强制在主库执行

解决主从延迟问题。示例如下：SELECt * FROM table_name;

   2、关闭查询缓冲

目的是为了冷热数据分离，防止导入大量数据时污染MySQL的buffer pool。

例如每天一次的批量任务查询大量数据，如果不是用此语法，会把buffer pool中的业务数据挤出去，把当前数据缓存起来，缓存中的其它业务数据被挤出导致业务系统性能下降。

例： select count() from t1

类似的还有SQL_NO_CACHE(关闭查询缓冲)，SQL_CACHE(强制查询缓冲)。

3、强制索引FORCE INDEX/忽略索引IGNORE INDEX

select from t1 force index (col1) where ...

select * from t1 ignore index (col1) where ...

4、强制将结果集放进临时表SQL_BUFFER_RESULT

当查询的结果集较大时，强制将结果集放进临时表，可快速释放表锁，并且可长时间为客户端提供较大的结果集。

select sql_buffer_result * from t1 where...

六.DML语句
（1）insert语句应显示指定列名，防止在增加或删除字段后程序报错。

（2）对于需要删除全表数据的操作，应使用truncate而不是delete

delete耗时较长，大量delete语句可能造成主从延时较大。delete操作会在数据文件中留下碎片，频繁delete会导致表数据文件占用空间不断膨胀。

（3）对于操作大批量数据的情景，例如delete数据，需加limit。防止执行时间过长，锁表时间过长，主从同步延迟过高等一系列问题。

七.注意事项
（1）宜将大字段，访问频率低的字段拆分到单独的表中存储。（分离冷热数据，有效利用缓存，防止读入无用冷数据，减少磁盘IO，同时保证热数据常驻内存，提高缓存命中率）

（2）单表数据超过500w，或者数据量超过2G，需进行分库分表。

（3）生产环境所有数据库相关操作（DDL,DML），必须由DBA进行操作。数据量大的表的表结构修改和数据修改，需上线前一天执行。（数据修改在不影响业务的前提下，时间可适当调整）

（4）RDS支持防止个别SQL使IOPS过载，通过修改rds_sql_max_iops参数实现。例如在BI数仓库、DTS库上涉及大量数据读写的库有较好优化，使数据库处于平稳良好的运行状态，减少IOPS使用率的报警。

上一篇：Android13首个开发者预览版到来

下一篇：SpringBoot整合MyBatis

相关推荐

相关文章

Copyright © 2016-2020 www.365daan.com All Rights Reserved. 365答案网版权所有备案号：

部分内容来自互联网，版权归原作者所有，如有冒犯请联系我们，我们将在三个工作时内妥善处理。