爱收集资源网

MySQL X-Engine:完美模拟传统数据库的DDL操作

网络整理 2023-10-29 07:02

X-Engine是阿里巴巴自研的储存引擎,作为阿里云 RDS MySQL 的一个可选引擎,除了主打高性能和低成本mysql当前时间减一天,还降低了不少造福用户的新功能。本文将详尽介绍 MySQL(X-Engine) 如何近乎瞬时完成传统数据库须要数小时完成的DDL操作。

数据库DDL操作面临的问题

互联网业务发展迅速,应用模式频繁修改是常态。相应地,数据库访问模式和schema也急剧变化。DDL(Data Definition Language)是SQL的一类,主要作用是创建和修改数据的schema信息,最常见的操作包括:加减列、更改列类型、加减索引等。

熟悉MySQL的朋友都晓得,在8.0曾经,虽然Online DDL不阻塞其它DML(Insert/Update/Delete)操作,但许多重要的DDL操作,如加列、减列等,仍旧须要等待数小时、甚至好几天时间(依据数据量的大小)才会生效。更改列类型等操作甚至仍须要锁表执行,阻塞DML操作。

DDL操作运行时间长,占用系统资源,需要额外的c盘空间(建立临时表),影响系统吞吐,并且一旦DDL过程中实例crash,恢复时间也会好久。以加列DDL为例,MySQL经历如下过程:

1.以新schema构建空表。

2.拷贝数据到新表mysql当前时间减一天,并且将新加列的值赋为默认值,同时更新索引表。数据库接受到的DML操作被记录在临时文件。

3.加exclusive lock,阻塞写操作,将临时文件记录的DML操作apply到新表。如果DML好多,这一阶段将耗费较多时间。

4.删掉旧表,将新表命名为旧表的名子。

显然,这个过程加锁时间长,拷贝数据操作会占用系统资源和临时空间,并须要大量I/O。为了适应变化频繁的业务,不立刻修改储存层数据、可以快速完成的DDL(我们称之为Fast DDL)成为了一个必要feature。

MySQL 8.0 增加了instant add column功能,可以在短时间内只更改table元信息,完成加列操作。遗憾的是,它还不支持其它类型的DDL。得益于阿里自研的储存引擎X-Engine储存了多版本Table Schema,每一行记录在引擎层就完成了解析,并且可以根据更新版本的schema实现格式转换,X-Engine因而可支持多种类型的Fast DDL。

业界Fast DDL实现方案

record记录了列个数, instant add column操作只更改系统表。

写操作:新格式的记录。

读操作:根据储存在系统表中default value补足新加列。

支持类型:

Change index optionRename table

mysql当前日期减去30天_mysql当前时间减一天_sql当前日期减一天

Set/drop default

Modify column when the table is empty

Add/drop virtual columnsAdd columns

整体实现方案与MySQL 8.0类似,record记录了列个数,在leftmost leaf page中记录所有列的default值。

支持类型:

Add column

Drop column

Extend VARCHAR maximum (Only if the physical format allows; not VARCHAR(255) to VARCHAR(256))

发生DDL后,更新系统表,新、旧版本的schema均要记录出来。然后广播该更改。之后接受DML恳求,首先转换相关leaf page的所有记录,然后执行DML。

select恳求会将旧版本的记录拼接成新版本记录。

支持类型

only supports adding nullable columns, without default values

X-Engine多版本schema

顾名思义,Fast DDL指数据库才能在极短的时间内完成用户发出的DDL指令并返回。之所以如此快,是因为只更改系统表里的元数据,不变更引擎层储存的数据。其实现的关键在于:元信息变更以后,内存、磁盘中的数学记录该怎么解析。

X-Engine的构架采用了LSM-Tree的思想,将新写入的数据以追加形式写入显存memtable,memtable到一定大小后switch为immutable memtable,不再更改。然后逐步以固定大小extent的方式,flush到持久化储存中。

当extent到一定数目后,通过合并(Compaction)操作,将相同Key的多个版本合并。为了让每行记录可解析,最直观简单的方案便是将元信息附着在记录里边。

mysql当前日期减去30天_mysql当前时间减一天_sql当前日期减一天

为了才能不依赖系统表解析记录,X-Engine储存了较为详尽的元数据,如果为每一行都附着一份,会占用大量的空间。为了大大降低储存成本,我们保证每位memtable和extent内部的数据schema一致,并将schema信息储存在memtable和extent之上。

schema信息包含了例如列个数、列类型、列厚度、默认值等关键信息。利用这种信息,X-Engine可以在返回结果之前,完成列解析,并只需返回查询目标列的对应结果。下面给出了一个具体的事例,同一张表存在不同schema版本的extent时,如何返回结果。

X-Engine Fast DDL实现

当 MySQL 接收到一条Fast DDL词句时,更新相关系统表及元数据,新版本的表结构急剧生效,这时这条DDL句子就执行成功啦!到现今为止X-Engine储存的信息没有发生任何变化。

读恳求

当系统接收到Select恳求时,MySQL 会将恳求本身,连同当前最新版本schema信息(称之为target schema)传递到X-Engine。X-Engine首先定位到记录的位置(某个memtable或extent),并取相应数据schema解析记录得到初步结果。接着,对比数据schema和target schema,对初步结果做适当填充、删减或更改得到最终结果返回。

X-Engine schema更新

Fast DDL命令执行成功,新版本的schema生效,X-Engine还对此无感知。当接收到第一条针对该表的DML(Insert/Update/ Delete)请后,如果发觉X-Engine的活跃memtable的schema版本落后于最新版本,会触发switch memtable行为:冻结当前活跃memtable,产生新活跃memtable,将新schema赋于新活跃memtable。为了保证数据的正确性,该操作会等待所有正在进行的写事务完成后再执行。

写恳求

每个写事务可能涉及到n(n>=1)个表。事务在递交时,需要在写入活跃memtable之前判定:事务写入数据的schema版本是否与活跃memtable的schema版本一致,如果不一致则应当报错退出,提醒用户重试。

Flush/Compaction

内存中memtable数目到一定个数时会触发Flush操作,被选中memtable的数据以extent的方式写入c盘,schema也急剧由memtable传递到extent。Compaction操作会合并多个extent,如果参与同一任务的extent schema版本不一致,X-Engine会以其中最新版本为准,生成新extent。

总结

Fast DDL可以解决好多应用的痛点,加列、扩展列的常用的操作不用再须要漫长的等待。技术上,X-Engine通过储存详尽的多版本schema信息,不仅无需利用系统表解析记录,而且可以轻易地实现不同版本schema之间的数据转换,进而可以支持丰富的Fast DDL类型。

mysql当前时间减一天