1.1 手写顺序:
1.2 机读顺序:
1.3 总结:
4.1 A、B两表共有
4.2 A、B两表共有+A的独有
4.3 A、B两表共有+B的独有
4.4 A的独有
4.5 B的独有
4.6 AB全有
4.7 A的独有+B的独有
1.1 索引的定义
MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构。
可以得到索引的本质:索引是数据结构。
1.2 深入了解索引
你可以简单理解为“排好序的快速查找数据结构”。
详情:
在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法。这种数据结构,就是索引。下图就是一种可能的索引方式示例:
左边是数据表,一共有两列七条记录,最左边的是数据记录的物理地址
为了加快Col2的查找,可以维护一个右边所示的二叉查找树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针,这样就可以运用二叉查找在一定的复杂度内获取到相应数据,从而快速的检索出符合条件的记录。
结论:
数据本身之外,数据库还维护着一个满足特定查找算法的数据结构,这些数据结构以某种方式指向数据,
这样就可以在这些数据结构的基础上实现高级查找算法,这种数据结构就是索引。
一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储的磁盘上。
我们平常所说的索引,如果没有特别指明,都是指B树(多路搜索树,并不一定是二叉的)结构组织的索引
BTREE:B树(Balance Tree多路平衡查找树)
其他结构的索引:Hash索引、full-text全文索引、R-Tree索引
3.1 共有三种:单值索引、唯一索引、符合索引、
3.2 索引的使用语法:
① 创建:
② 删除:
③ 查看:
④ 有四种方式(使用ALTER命令)来添加数据表的索引:
ALTER TABLE tbl_name ADD PRIMARY KEY (column_list): 该语句添加一个主键,这意味着索引值必须是唯一的,且不能为NULL。
ALTER TABLE tbl_name ADD UNIQUE index_name (column_list): 这条语句创建索引的值必须是唯一的(除了NULL外,NULL可能会出现多次)。
ALTER TABLE tbl_name ADD INDEX index_name (column_list): 添加普通索引,索引值可出现多次。
使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈
执行计划包含的信息:
4.1 id 字段
含义:select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序
三种使用状态:
① id相同,执行顺序由上至下
id相同,执行顺序由上至下
② id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
③ id相同不同,同时存在
4.2 select_type 字段
该字段常用定义有:
作用: 查询的类型,主要是用于区别 普通查询、联合查询、子查询等的复杂查询
4.3 table 字段
作用: 显示这一行的数据是关于哪张表的
4.4 type 字段
(1)访问类型排列
type显示的是访问类型,是较为重要的一个指标,结果值从最好到最坏依次是:
system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL
一般来说,得保证查询至少达到range级别,最好能达到ref。
(2)从最好到最差依次是:system>const>eq_ref>ref>range>index>ALL
备注:一般来说,得保证查询至少达到range级别,最好能达到ref。
4.5 possible_keys 字段
作用:显示可能应用在这张表中的索引,一个或多个。
查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用
4.6 key 字段
含义:实际使用的索引。如果为NULL,则没有使用索引
查询中若使用了覆盖索引,则该索引和查询的select字段重叠
4.7 key_len 字段
(1)含义:表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下,长度越短越好
(2)key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的
(3)难点:它是如何计算的?
变长字段需要额外的2个字节(VARCHAR值保存时只保存需要的字符数,另加一个字节来记录长度(如果列声明的长度超过255,则使用两个字节),所以VARCAHR索引长度计算时候要加2),固定长度字段不需要额外的字节。
而NULL都需要1个字节的额外空间,所以索引字段最好不要为NULL,因为NULL让统计更加复杂并且需要额外的存储空间。
所以,复合索引有最左前缀的特性,如果复合索引能全部使用上,则是复合索引字段的索引长度之和,这也可以用来判定复合索引是否部分使用,还是全部使用。
4.8 ref 字段
含义:显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值
由key_len可知t1表的idx_col1_col2被充分使用,col1匹配t2表的col1,col2匹配了一个常量,即 ‘ac‘
查询中与其它表关联的字段,外键关系建立索引
4.9 rows 字段
含义:根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数
4.10 Extra 字段
含义:包含不适合在其他列中显示但十分重要的额外信息
第一行(执行顺序4):id列为1,表示是union里的第一个select,select_type列的primary表 示该查询为外层查询,table列被标记为<derived3>,表示查询结果来自一个衍生表,其中derived3中3代表该查询衍生自第三个select查询,即id为3的select。【select d1.name......】
第二行(执行顺序2):id为3,是整个查询中第三个select的一部分。因查询包含在from中,所以为derived。
【select id,name from t1 where other_column=‘‘】
第三行(执行顺序3):select列表中的子查询select_type为subquery,为整个查询中的第二个select。
【select id from t3】
第四行(执行顺序1):select_type为union,说明第四个select是union里的第二个select,最先执行
【select name,id from t2】
第五行(执行顺序5):代表从union的临时表中读取行的阶段,table列的<union1,4>表示用第一个和第四个select的结果进行union操作。
【两个结果union操作】
建议新建一个库,试试测试脚本
like以通配符开头(‘%abc...‘)mysql索引失效会变成全表扫描的操作
字符串不加单引号索引失效
少用or,用它来连接时会索引失效
【优化口诀】
全职匹配我最爱,最左前缀要遵守;
带头大哥不能死,中间兄弟不能断;
索引列上少计算,范围之后全失效;
LIKE百分写最右,覆盖索引不写*;
不等空值还有OR,索引影响要注意;
VAR引号不可丢, SQL优化有诀窍。
原文:https://www.cnblogs.com/wushaopei/p/12288582.html