第05章_存储引擎

为了管理方便,人们把连接管理、查询缓存、语法解析 、查询优化这些并不涉及真实数据存储的功能划分为MySQL server 的功能,把真实存取数据的功能划分为存储引擎的功能。所以在MySQL server 完成了查询优化
后,只需按照生成的执行计划调用底层存储引擎提供的API,获取到数据后返回给客户端就好了。

MySQL中提到了存储引擎的概念。简而言之,存储引擎就是指表的类型。其实存储引擎以前叫做表处理器,后来改名为存储引擎,它的功能就是==接收上层传下来的指令,然后对表中的数据进行提取或写入操作。==

1. 查看存储引擎

  • 查看mysql提供什么存储引擎
show engines;

image-20230413123312823

查询结果显示, MySQL 8支持9种存储引擎,分别为MEMORY、MRG_ MYISAM、 CSV、 FEDERATED 、 PERFORMANCE_ SCHEMA、 MyISAM、 InnoDB 、BLACKHOLE 和ARCHIVE

  • Engine参数表示存储引擎名称。
  • Support参 数表示MySQL数据库管理系统是否支持该存储引擎: YES表示支持, NO表示不支持
  • DEFAULT 表示系统默认支持的存储引擎,MySQL8.0默认的存储引擎为InnoDB,8.0版本之前使用的是MyISAM存储引擎 。
  • Comment参 数表示对存储引|擎的评论。
  • Transactions参数表示存储引擎是否支持事务: YES表示支持,N0表示不支持。
  • XA参数表示存储引擎所支持的分布式是否符合XA规范: YES表示支持, NO表示不支持。代表着该存储引擎是否支持分布式事务。

2. 设置系统默认的存储引擎

  • 查看默认的存储引擎
show variables like '%storage_engine%';
#或
SELECT @@default_storage_engine;

image-20230413123551245

  • 修改默认的存储引擎

如果在创建表的语句中没有显式指定表的存储引擎的话,那就会默认使用 InnoDB 作为表的存储引擎。 如果我们想改变表的默认存储引擎的话,可以这样写启动服务器的命令行:

SET DEFAULT_STORAGE_ENGINE=MyISAM;

image-20230413125023702

或者修改 my.cnf 文件:

default-storage-engine=MyISAM
# 重启服务
systemctl restart mysqld.service

3. 设置表的存储引擎

存储引擎是负责对表中的数据进行提取和写入工作的,==我们可以为不同的表设置不同的存储引擎 ,也就是说不同的表可以有不同的物理存储结构,不同的提取和写入方式。==

3.1 创建表时指定存储引擎

我们之前创建表的语句都没有指定表的存储引擎,那就会使用默认的存储引擎 InnoDB 。如果我们想显 式的指定一下表的存储引擎,那可以这么写:

CREATE TABLE 表名(
建表语句;
) ENGINE = 存储引擎名称;

3.2 修改表的存储引擎

如果表已经建好了,我们也可以使用下边这个语句来修改表的存储引擎:

ALTER TABLE 表名 ENGINE = 存储引擎名称;

比如我们修改一下 engine_demo_table 表的存储引擎:

mysql> ALTER TABLE engine_demo_table ENGINE = InnoDB;

这时我们再查看一下 engine_demo_table 的表结构:

mysql> SHOW CREATE TABLE engine_demo_table\G
*************************** 1. row ***************************
Table: engine_demo_table
Create Table: CREATE TABLE `engine_demo_table` (
`i` int(11) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8
1 row in set (0.01 sec)

4. 引擎介绍

4.1 InnoDB 引擎

InnoDB 引擎是具备外键支持功能的事务存储引擎

  • MySQL从3.23.34a开始就包含InnoDB存储引擎。 大于等于5.5之后,默认采用InnoDB引擎
  • InnoDB是MySQL的默认事务型引擎 ,它被设计用来处理大量的短期(short-lived)事务。==可以确保事务的完整提交(Commit)和回滚(Rollback)。==
  • 除了增加和查询外,还需要更新、删除操作,那么,应优先选择InnoDB存储引擎。 除非有非常特别的原因需要使用其他的存储引擎,否则应该优先考虑InnoDB引擎。
  • 数据文件结构:(在《第02章_MySQL数据目录》章节已讲)
    • 表名.frm 存储表结构(MySQL8.0时,合并在表名.ibd中)
    • 表名.ibd 存储数据和索引
  • InnoDB是 为处理巨大数据量的最大性能设计 。
    • 在以前的版本中,字典数据以元数据文件、非事务表等来存储。现在这些元数据文件被删除 了。比如: .frm , .par , .trn , .isl , .db.opt 等都在MySQL8.0中不存在了。
  • 对比MyISAM的存储引擎, InnoDB写的处理效率差一些 ,并且会占用更多的磁盘空间以保存数据和索引。
  • ==MyISAM只缓存索引,不缓存真实数据;==InnoDB不仅缓存索引还要缓存真实数据, 对内存要求较 高 ,而且内存大小对性能有决定性的影响。

4.2 MyISAM 引擎

MyISAM引擎是主要的非事务处理存储引擎

  • MyISAM提供了大量的特性,包括全文索引、压缩、空间函数(GIS)等,但**MyISAM不支持事务、行级 锁、外键 ,有一个毫无疑问的缺陷就是崩溃后无法安全恢复 。**
  • 5.5之前默认的存储引擎
  • ==优势是访问的速度快 ,对事务完整性没有要求或者以SELECT、INSERT为主的应用==
  • 针对数据统计有额外的常数存储。故而 count(*) 的查询效率很高 数据文件结构:(在《第02章_MySQL数据目录》章节已讲)
    • 表名.frm 存储表结构
    • 表名.MYD 存储数据 (MYData)
    • 表名.MYI 存储索引 (MYIndex)
  • 应用场景:只读应用或者以读为主的业务

4.3 Archive 引擎

Archive 引擎用于数据存档

  • archive是归档的意思,仅仅支持插入和查询两种肋能(行被插入后不能再修改)。
  • 在MySQL5.5以后 支持索引功能。
  • 拥有很好的压缩机制,使用zlib压缩库,在记录请求的时候实时的进行压缩,经常被用来作为仓库使用。
  • 创建ARCHIVE表时,存储引擎会创建名称以表名开头的文件。数据文件的扩展名为. ARZ。
  • 根据英文的测试结论来看,同样数据量下,Archive表比MyISAM表要小大约75%, 比支持事务处理的InnoDB表小大约83%。
  • ARCHIVE存储弓|擎采用了行级锁。该ARCHIVE引擎支持AUTO_ INCREMENT列属性。AUTO_ INCREMENT列可以具有唯一索引或非唯一索引。尝试在任何其他列上创建索引会导致错误。
  • Archive表适合日志和数据采集(档案)类应用;适合存储大量的独立的作为历史记录的数据。拥有很高的插入速度,但是对查询的支持较差。
  • 下表展示了ARCHIVE存储引擎功能
  • 下表展示了ARCHIVE 存储引擎功能

4.4 Blackhole 引擎

Blackhole 引擎会丢弃写操作,读操作会返回空内容

  • Blackhole引擎没有实现任何存储机制,它会丢弃所有插入的数据,不做任何保存。
  • 但服务器会记录Blackhole表的日志,所以可以用于复制数据到备库,或者简单地记录到日志。但这种应用方式会碰到很多问题,因此并不推荐。

4.5 CSV 引擎

CSV 引擎存储数据时,以逗号分隔各个数据项

  • CSV引|擎可以将普通的CSV文件作为MySQL的表来处理,但不支持索引。
  • CSV引擎可以作为一种 数据交换的机制,非常有用。
  • CSV存储的数据直接可以在操作系统里,用文本编辑器,或者excel读取。
  • 对于数据的快速导入、导出是有明显优势的。

​ 创建CSV表时,服务器会创建一个纯文本数据文件, 其名称以表名开头并带有.CSV 扩展名。当你将数据存储到表中时,存储弓|擎将其以逗号分隔值格式保存到数据文件中。

使用案例如下

mysql> CREATE TABLE test (i INT NOT NULL, c CHAR(10) NOT NULL) ENGINE = CSV;
Query OK, 0 rows affected (0.06 sec)
mysql> INSERT INTO test VALUES(1,'record one'),(2,'record two');
Query OK, 2 rows affected (0.05 sec)
Records: 2 Duplicates: 0 Warnings: 0
mysql> SELECT * FROM test;
+---+------------+
| i |      c     |
+---+------------+
| 1 | record one |
| 2 | record two |
+---+------------+
2 rows in set (0.00 sec)

创建CSV表还会创建相应的元文件 ,用于 存储表的状态 和 表中存在的行数 。此文件的名称与表的名称相 同,后缀为 CSM 。如图所示

image-20230413220457900

如果检查 test.CSV 通过执行上述语句创建的数据库目录中的文件,其内容使用Notepad++打开如下:

"1","record one"
"2","record two"

这种格式可以被 Microsoft Excel 等电子表格应用程序读取,甚至写入。使用Microsoft Excel打开如图所示

image-20230413220507140

4.6 Memory 引擎

Memory 引擎置于内存的表

概述:

Memory采用的逻辑介质是内存 ,响应速度很快但是当mysqld守护进程崩溃的时候数据会丢失 。另外,要求存储的数据是数据长度不变的格式,比如,Blob和Text类型的数据不可用(长度不固定的)。

主要特征:

  • Memory同时 支持哈希(HASH)索引 和 B+树索引
  • Memory表至少比MyISAM表要快一个数量级 。
  • MEMORY 表的大小是受到限制 的。表的大小主要取决于两个参数,分别是 max_rows 和 max_heap_table_size 。其中,max_rows可以在创建表时指定;max_heap_table_size的大小默认为16MB,可以按需要进行扩大。
  • 数据文件与索引文件分开存储。
  • 缺点:其数据易丢失,生命周期短。基于这个缺陷,选择MEMORY存储引擎时需要特别小心。

使用Memory存储引擎的场景:

  1. 目标数据比较小 ,而且非常频繁的进行访问 ,在内存中存放数据,如果太大的数据会造成内存溢出 。可以通过参数 max_heap_table_size 控制Memory表的大小,限制Memory表的最大的大小。
  2. 如果数据是临时的 ,而且必须立即可用得到,那么就可以放在内存中。
  3. 存储在Memory表中的数据如果突然间丢失的话也没有太大的关系

4.7 Federated 引擎

Federated 引擎访问远程表

Federated引擎是访问其他MySQL服务器的一个代理 ,尽管该引擎看起来提供了一种很好的跨服务器的灵活性 ,但也经常带来问题,因此默认是禁用的 。

4.8 Merge引擎

Merge引擎管理多个MyISAM表构成的表集合

4.9 NDB引擎

NDB引擎是MySQL集群专用存储引擎

也叫做 NDB Cluster 存储引擎,主要用于 MySQL Cluster 分布式集群 环境,类似于 Oracle 的 RAC 集 群。

4.10 引擎对比

MySQL中同一个数据库,不同的表可以选择不同的存储引擎。如下表对常用存储引擎做出了对比。

image-20230413220552737

其实这些东西大家没必要立即就给记住,列出来的目的就是想让大家明白不同的存储引擎支持不同的功能。

其实我们最常用的就是 InnoDB 和 MyISAM ,有时会提一下 Memory 。其中 InnoDB 是 MySQL 默认的存储引擎。

5. MyISAM和InnoDB

很多人对 InnoDB 和 MyISAM 的取舍存在疑问,到底选择哪个比较好呢?

==MySQL5.5之前的默认存储引擎是MyISAM,5.5之后改为了InnoDB。==

首先对于InnoDB存储引擎,提供了良好的事务管理、崩溃修复能力和并发控制。因为InnoDB存储引擎支持事务,所以对于要求事务完整性的场合需要选择InnoDB,比如数据操作除了插入和查询以外还包含有很多更新、删除操作,像财务系统等对数据准确性要求较高的系统。缺点是其读写效率稍差,占用的数据空间相对比较大。

其次对于MyISAM存储引擎,如果是小型应用,系统以读操作和插入操作为主,只有很少的更新、删除操作,并且对事务的要求没有那么高,则可以选择这个存储引擎。MyISAM存储引擎的优势在于占用空问小,处理速度快; 缺点是不支持事务的完整性和并发性

这两种引擎各有特点,当然你也可以在MySQL中,针对不同的数据表,可以选择不同的存储引擎。

对比项 MyISAM InnoDB
外键 不支持 支持
事务 不支持 支持
行表锁 表锁,即使操作一条记录也会锁住整张表,不适合高并发的操作 行锁,操作时只锁住某一行,不对其他有影响,适合高并发的操作。
缓存 只缓存索引,不缓存真实数据 不仅缓存索引还要缓存真实数据,对内存要求较高,而且内存大小对性能有决定性的影响
自带系统计表使用 Y N
关注点 性能:节省资源、消耗少、简单业务 事务:并发写、事务、更大资源
默认安装 Y Y
默认值 N Y


第05章_存储引擎
https://xhablog.online/2021/04/18/MySQL高级-第05章_存储引擎/
作者
Xu huaiang
发布于
2021年4月18日
许可协议