数据库索引:提升效率的利器,还是性能的杀手?
没有索引的数据库系统,效率堪忧!
索引 (Index) 是数据库系统中用于加速数据检索的关键数据结构。 简单来说,索引就像书籍的目录,它帮助数据库快速定位所需数据,避免全表扫描。
索引的本质是一种特殊的数据结构,它以某种方式引用(指向)数据库中的实际数据,从而支持高效的查找算法。 你可以把它想象成一个“预先排序好的数据结构”,例如查找树。
索引的优势
- 提升检索效率: 如同图书馆的书目索引,索引显著减少数据库的 I/O 操作,加快数据查找速度。
- 降低排序成本: 索引对数据进行预排序,减少了查询时排序的计算量,从而降低了 CPU 消耗。
索引的劣势
- 占用存储空间: 索引本身也是一张表,存储主键和索引字段及其指向实体表记录的指针,因此会额外占用磁盘空间。
- 降低更新速度: 索引的维护会增加 INSERT、UPDATE、delete 操作的开销,因为每次数据修改都需要同步更新索引。
索引类型
- 单值索引: 基于单个列创建的索引。
- 唯一索引: 索引列的值必须唯一(允许空值),主键是一种特殊的唯一索引(不允许空值)。
- 复合索引: 基于多个列创建的索引。
- 全文索引: 用于在文本列中进行全文检索(仅 MyISAM 支持)。
- 空间索引: 用于处理空间数据(例如 GIS 系统)。
索引结构
不同的数据库存储引擎支持不同的索引结构:
何时创建索引
- 频繁用作查询条件的字段。
- 与其他表关联的外键字段。
- 查询中排序或分组的字段。
- 主键字段(自动创建唯一索引)。
何时避免创建索引
- 表记录数量很少。
- 频繁进行增删改操作的表。
- 数据重复且分布均匀的字段。
最左前缀原则
对于复合索引,数据库通常遵循“最左前缀匹配原则”。 这意味着,只有当查询条件包含复合索引的最左列时,才能有效利用该索引。 请参考以下示例和解释:
表结构 (三个字段:id, name, cid):
CREATE TABLE student ( id INT PRIMARY KEY, name VARCHAR(255), cid INT, KEY name_cid_INX (name, cid) );
查询示例及解释(摘自知乎,如有侵权请联系删除):
创建索引的语法
在创建表时创建索引
CREATE TABLE tbl_name ( Column_def1, Column_def2, Column_def3, ... INDEX index_name (index_col_name, ...) );
为现有表创建索引
CREATE INDEX index_name ON tbl_name (index_col_name, ...);
(此处应补充更多关于创建索引语法的细节,例如 UNIQUE 索引,FULLTEXT 索引等)
(唯一索引的说明)
请注意,以上内容是对原文的改写和补充,旨在更清晰地表达文章的核心内容,并对部分内容进行了更详细的解释。 图片链接需要替换为实际的图片链接。