sql server 性能调优资源等待之PAGELATCH

一.概述

　　在前几章介绍过 sql server 性能调优资源等待之PAGEIOLATCH，PAGEIOLATCH是出现在sql server要和磁盘作交互的时候，所以加个IO两个字。这次来介绍PAGELATCH。PAGELATCH类型是sqlserver在缓冲池里的数据页面上经常加的另一类latch锁。

　　既然缓冲池里的数据页面与PAGELATCH有关系，那先来介绍数据页面。

　　1. 数据页面

　　数据页面在“sql server 索引阐述系列二索引存储结构”中有详细介绍,这里讲与PAGELATCH有关的知识点。一个页面包含页头，数据存储，页尾偏移量。在页头里包含了页面属性，页面编号，记录了当前页面空闲的起始位置，当sqlserver 在要插入的时候，就能够很快地找到插入的位置，而页尾的偏移量记录了每一条数据行所有页中的位置，当需要查找页中数据时，通过页尾的偏移量很快能定位。

　　当数据行发生变化时， sql server不但要去修改数据本身，还要维护页中数据行与偏移量的关系。

2. PAGELATCH

　　讲了这么多关于数据页面，现在来理清一下关系， lock锁是保证数据页中数据的逻辑关系，PAGEIOLATCH的latch锁是保证数据页与磁盘进行存储的关系， PAGELATCH的latch锁是保证数据页中数据行与页尾的偏移量的关系。当然这种区别介绍是为了更好的去理解它们之间的关系，PAGELATCH作用并不只是这点, 它还会维护系统页面如SGAM,PFS,GAM页面等。

　　3. HotPage现象

　　当我们为一个表创建主键自增ID时，那么sql server将按照ID字段的值顺序进行存储，在大并发下，为了保证ID值按顺序存放在数据页中，这时PAGELATCH就会latch锁住数据页面里的存储结构，使ID值排队保持先后顺序。测试Hotpage现象可以是程序后端并发插入或使用 SQLIOSim工具来并发测试。

下面来看一个简单的图：当前表里有一个page 100的页面，该页中已有二行数据(rid1和rid2) 分别对应着页尾的偏移量1和2。这时有二个插入任务，同时插入到page100页，假设第一个任务申请到了ex_latch锁，第二个任务就会等待，使数据行和偏移量对一一对应。

　　由于数据页的改动都是在内存中完成的，所以每次修改时间都应该非常短，几乎可以忽略。如果该资源成为了sql server等待的瓶颈有以下几种情况:

　　(1) sql server 没有的明显的内存和磁盘瓶颈。

(2) 大量的并发集中在表里的一个数据页上叫hotpage

(3) tempdb 临时表也可以会成为瓶颈，通常可以通过增加tempdb文件来缓解。具体查看Tempdb怎么会成为性能瓶颈？。

4. 查看PAGELATCH现象

4.1 通过sys.dm_exec_query_stats来查看实例级别的等待

select wait_type,
waiting_tasks_count,
wait_time_ms ,
max_wait_time_ms,
signal_wait_time_ms
from sys.dm_os_wait_stats
where wait_type like 'pagelatch%' 
order by  wait_time_ms desc

在实例级别中等待次数最多的是PAGELATCH_EX的latch 排它锁, 平均每次耗时90毫秒，这个平均值应该是不会有性能问题。

4.2 能过sys.dm_exec_requests 来实时查看sql语句级, 可以采用不定时监听能过session_id来获取sql 语句所对应的表，以及等待的数据页类型。

SELECT * FROM sys.dm_exec_requests  WHERE wait_type LIKE 'pagelatch%'

5. 解决思路

　　(1) 通过设计表结构，使hotpage现象由单面的并发访问，分散到多个页面。

　　(2) 如果是在identity字段上有瓶颈，可以创建多个分区，因为每个分区都有自己的存储单位，这样hot 单页现象就分散了。

posted on 2018-07-20 10:27 花阴偷移阅读(…) 评论(…) 编辑收藏

本文链接：https://www.cnblogs.com/MrHSR/p/9301080.html

sql server 性能调优资源等待之PAGELATCH