索引(1)

索引是对数据库表中的一列或多列的值进行排序的一种数据结构，mysql索引的建立对mysql的高效运行说很重要的，索引可以大大提高mysql的检索速度。

简单类比，数据库如同书籍，索引如同书籍目录，假如我们需要从书籍查找与XX相关的内容，我们可以直接从目录中查找，定位到XX内容所在的页面，如果目录中没有xx相关字符或者没有设置目录（索引），那么就只能逐字逐页阅读文本查找，效率很低

2.1 优点

2.2缺点

3.1应该创建索引的列

3.2不应该创建索引的列

常用的有hash,b-tree,b+tree

哈希索引就是采用一定的哈希算法，把键值换成新的哈希值，检索时不需要类似B+树那样从根结点到叶子结点逐级查找，只需要一次哈希算法即可以立刻定位到相应的位置，速度非常快。
由于存储的索引不是有序的，不能使用范围查询。
innodb里面当某些索引值用得特别频繁的时候，会使用**“自适应哈希索引”**来提高查找效率。

特征：

特征：

补充：索引存储在文件系统中

索引是占据物理空间的，在不同的存储引擎中，索引存在的文件也不同。存储引擎是基于表的，以下分别使用MyISAM和InnoDB存储引擎建立两张表。

存储引擎为MyISAM：

*.frm：与表相关的元数据信息都存放在frm文件，包括表结构的定义信息等
*.MYD：MyISAM DATA，用于存储MyISAM表的数据
*.MYI：MyISAM INDEX，用于存储MyISAM表的索引相关信息
存储引擎为InnoDB：

*.frm：与表相关的元数据信息都存放在frm文件，包括表结构的定义信息等
*.ibd：InnoDB DATA，表数据和索引的文件。该表的索引(B+树)的每个非叶子节点存储索引，叶子节点存储索引和索引对应的数据

有多种逻辑划分的方式，比如按功能划分，按组成索引的列数划分等

**5.1.1.按功能划分

alter table tablename add primary key(column_list);

5.1.2 按列数划分

单例索引：一个索引只包含一个列，一个表可以有多个单例索引。
组合索引：一个组合索引包含两个或两个以上的列。查询的时候遵循 mysql 组合索引的 “最左前缀”原则，即使用 where 时条件要按照建立索引的时候字段的排列方式放置索引才会生效。

分为聚簇索引和非聚簇索引（有时也称辅助索引或二级索引）

 聚簇是为了提高某个属性(或属性组)的查询速度，把这个或这些属性(称为聚簇码)上具有相同值的元组集中存放在连续的物理块。

聚簇索引（clustered index）不是单独的一种索引类型，而是一种数据存储方式。这种存储方式是依靠B+树来实现的，根据表的主键构造一棵B+树且B+树叶子节点存放的都是表的行记录数据时，方可称该主键索引为聚簇索引。聚簇索引也可理解为将数据存储与索引放到了一块，找到索引也就找到了数据。
-非聚簇索引：数据和索引是分开的，B+树叶子节点存放的不是数据表的行记录。

虽然InnoDB和MyISAM存储引擎都默认使用B+树结构存储索引，但是只有InnoDB的主键索引才是聚簇索引，InnoDB中的辅助索引以及MyISAM使用的都是非聚簇索引。每张表最多只能拥有一个聚簇索引。

优点：

缺点：

插入速度严重依赖于插入顺序，按照主键的顺序插入是最快的方式，否则将会出现页分裂，严重影响性能。因此，对于InnoDB表，我们一般都会定义一个自增的ID列为主键（主键列不要选没有意义的自增列，选经常查询的条件列才好，不然无法体现其主键索引性能）
更新主键的代价很高，因为将会导致被更新的行移动**。因此，对于InnoDB表，我们一般定义主键为不可更新。
二级索引访问需要两次索引查找，第一次找到主键值，第二次根据主键值找到行数据。