使用MySQL如何实现分页查询

一、分页

1. 什么是分页

2. 真分页

3. 假分页

4. 缓存层

二、MySQL实现分页

1. LIMIT用法

2. 分页公式

8种MySQL分页方法总结

方法1: 直接使用数据库提供的SQL语句

方法2: 建立主键或唯一索引, 利用索引(假设每页10条)

方法3: 基于索引再排序

方法4: 基于索引使用prepare

方法5:利用MySQL支持ORDER操作可以利用索引快速定位部分元组,避免全表扫描

方法6: 利用"子查询/连接+索引"快速定位元组的位置,然后再读取元组. 道理同方法5

方法7: 存储过程类（最好融合上述方法5/6）

方法8: 反面方法

在项目开发当中，经常要实现分页功能，在面试时也会经常被问到：什么是分页。这是因为在一个页面上能够显示的数据是有限的，而存放在数据库中的数据往往很多，我们必须将这些数据安放到不同的页面中去。

一、分页

1. 什么是分页

一般在客户端实现分页功能的时候，要显示当前页的数据、当前所在页数、临近页面的按钮以及总页数等等。这些数据随着翻页的进行能够动态的变化，为了实现这样的效果，一般会采取两种办法：真分页和假分页。这样的划分方式是从与数据库的交互方式出发的，是每次翻页时都进行查询还是一次性查出所有的数据。

2. 真分页

真分页指的是每次在进行翻页时都只查询出当前页面的数据，特点就是与数据库的交互次数较多，但是每次查询的数据量较少，数据也不需要一直保存在内存中。适用于数据量比较大的场景，数据不适合全量查出的情况。

3. 假分页

假分页指的是对于要显示的数据一次性全部查出，一直存在在服务端或客户端，在前端进行分页或由服务端控制分页。将根据当前所在页来计算应该显示的数据所在下标，用循环取出目标数据。只有当会话断开或页面关闭，相应的资源才会被释放。

4. 缓存层

真分页和假分页都要和数据库进行交互，对于真分页来说不需要担心数据同步的问题，因为每次都是查询出最新的，但是数据库的负担会很重，尤其是用户量大的情况下。

假分页可以在一定程度上减轻数据库的压力，但是数据不能及时得到同步，除非重新请求或页面刷新。

一般在企业中会有缓存层的存在，既能有效降低数据库的压力，又能及时的进行数据同步。在对数据库中的数据进行修改后，要将变更后的数据及时同步到缓存层，在进行数据查询时从缓存层获取。

二、MySQL实现分页

本文将介绍如何通过真分页的方式，每次取出所需数据。对于不同的数据，实现分页有不同的方式，在MySQL中可以使用LIMIT来限制查询出的数据。

1. LIMIT用法

LIMIT出现在查询语句的最后，可以使用一个参数或两个参数来限制取出的数据。其中第一个参数代表偏移量：offset（可选参数），第二个参数代表取出的数据条数：rows。

单参数用法

当指定一个参数时，默认省略了偏移量，即偏移量为0，从第一行数据开始取，一共取rows条。

/* 查询前5条数据 */
SELECT * FROM Student LIMIT 5;

双参数用法

当指定两个参数时，需要注意偏移量的取值是从0开始的，此时可以有两种写法：

/* 查询第1-10条数据 */
SELECT * FROM Student LIMIT 0,10;
/* 查询第11-20条数据 */
SELECT * FROM Student LIMIT 10 OFFSET 10;

2. 分页公式

总页数计算

在进行分页之前，我们需要先根据数据总量来得出总页数，这需要用到COUNT函数和向上取整函数CEIL，SQL如下：

/* 获得数据总条数 */
SELECT COUNT(*) FROM Student;
/* 假设每页显示10条，则直接进行除法运算，然后向上取整 */
SELECT CEIL(COUNT(*) / 10) AS pageTotal FROM Student;

核心信息当前页：pageNumber

每页数据量：pageSize

在实际操作中，我们能够得到的信息有当前所在页以及每页的数据量，同时要注意一下是否超出了最大页数。以每页10条为例，则前三页的数据应为：

第1页：第1~10条，SQL写法：LIMIT 0,10

第2页：第11~20条，SQL写法：LIMIT 10,10

第3页：第21~30条，SQL写法：LIMIT 20,10

据此我们可以总结出，LIMIT所需要的两个参数计算公式如下：

offset：(pageNumber - 1) * pageSize

rows：pageSize

8种MySQL分页方法总结 方法1: 直接使用数据库提供的SQL语句

—语句样式: MySQL中,可用如下方法: SELECT * FROM 表名称 LIMIT M,N。

—适应场景: 适用于数据量较少的情况(元组百/千级)。

—原因/缺点: 全表扫描,速度会很慢且有的数据库结果集返回不稳定(如某次返回1,2,3,另外的一次返回2,1,3)。Limit限制的是从结果集的M位置处取出N条输出,其余抛弃。

方法2: 建立主键或唯一索引, 利用索引(假设每页10条)

—语句样式: MySQL中,可用如下方法:

代码如下:

SELECT * FROM 表名称 WHERE id_pk > (pageNum*10) LIMIT M

—适应场景: 适用于数据量多的情况(元组数上万)。

—原因: 索引扫描,速度会很快。有朋友提出因为数据查询出来并不是按照pk_id排序的，所以会有漏掉数据的情况，只能方法3。

方法3: 基于索引再排序

—语句样式: MySQL中,可用如下方法: SELECT * FROM 表名称 WHERE id_pk > (pageNum*10) ORDER BY id_pk ASC LIMIT M。

—适应场景: 适用于数据量多的情况(元组数上万). 最好ORDER BY后的列对象是主键或唯一所以,使得ORDERBY操作能利用索引被消除但结果集是稳定的(稳定的含义,参见方法1)。

—原因: 索引扫描,速度会很快. 但MySQL的排序操作,只有ASC没有DESC(DESC是假的,未来会做真正的DESC,期待)。

方法4: 基于索引使用prepare

（第一个问号表示pageNum，第二个？表示每页元组数）

—语句样式: MySQL中,可用如下方法:

代码如下:

PREPARE stmt_name FROM SELECT * FROM 表名称 WHERE id_pk > (？* ？) ORDER BY id_pk
ASC LIMIT M

—适应场景: 大数据量。

—原因: 索引扫描,速度会很快. prepare语句又比一般的查询语句快一点。

方法5:利用MySQL支持ORDER操作可以利用索引快速定位部分元组,避免全表扫描

—比如: 读第1000到1019行元组(pk是主键/唯一键)。

代码如下:

—SELECT * FROM your_table WHERE pk>=1000 ORDER BY pk ASC LIMIT 0,20 方法6: 利用"子查询/连接+索引"快速定位元组的位置,然后再读取元组. 道理同方法5

—如(id是主键/唯一键,蓝色字体时变量):

利用子查询示例:

代码如下:

SELECT* FROMyour_table WHEREid <=
(SELECTid FROMyour_table ORDER
BYid descLIMIT (p a g e − 1 ) ∗ page-1)*page−1)∗pagesize ORDERBYid desc
LIMIT $pagesize

利用连接示例:

代码如下:

SELECT* FROMyour_table ASt1
JOIN(SELECTid FROMyour_table ORDERBY
id descLIMIT (p a g e − 1 ) ∗ page-1)*page−1)∗pagesize ASt2
WHERE
t1.id <= t2.id ORDERBYt1.id descLIMIT $pagesize;

方法7: 存储过程类（最好融合上述方法5/6）

—语句样式: 不再给出

—适应场景: 大数据量. 作者推荐的方法

—原因: 把操作封装在服务器，相对更快一些。

方法8: 反面方法

—网上有人写使用 SQL_CALC_FOUND_ROWS。没有道理，勿模仿。

基本上,可以推广到所有数据库,道理是一样的。但方法5未必能推广到其他数据库,推广的前提是,其他数据库支持ORDER BY操作可以利用索引直接完成排序。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持易知道(ezd.cc)。