【PostgreSQL】前缀模糊查询级优化

monkjavaer 2019-07-08 原文

前匹配模糊

使用B-Tree来加速优化前匹配模糊查询

构造数据

新建一张商品表，插入一千万条数据。

create table goods(id int, name varchar);

insert into goods select generate_series(1,10000000),md5(random()::varchar);

未建立索引时查询”123%”的商品名字，执行计划显示耗时大约为575ms：

explain (analyze,verbose,timing,costs,buffers) select * from goods where name like '123%' ;
========================================
Gather  (cost=1000.00..136516.59 rows=1000 width=37) (actual time=1.390..572.857 rows=2364 loops=1)
  Output: id, name
  Workers Planned: 2
  Workers Launched: 2
  Buffers: shared hit=83334
  ->  Parallel Seq Scan on public.goods  (cost=0.00..135416.59 rows=417 width=37) (actual time=0.750..528.116 rows=788 loops=3)
        Output: id, name
        Filter: ((goods.name)::text ~~ '123%'::text)
        Rows Removed by Filter: 3332545
        Buffers: shared hit=83334
        Worker 0: actual time=1.032..511.776 rows=676 loops=1
          Buffers: shared hit=24201
        Worker 1: actual time=0.145..511.737 rows=755 loops=1
          Buffers: shared hit=26101
Planning time: 0.065 ms
Execution time: 573.157 ms

优化1，建立索引，lc_collate方式（B-Tree）

lc_collate (string)
报告文本数据排序使用的区域。详见第 23.1 节。该值是在数据库被创建时确定的。

lc_collate (string)
报告文本数据排序使用的区域。详见第 23.1 节。该值是在数据库被创建时确定的。

create index idx_c on goods(name collate "C");

执行计划显示耗时为10ms以内：

explain (analyze,verbose,timing,costs,buffers) select * from goods where name like '123%' collate "C";

优化2，建立索引，操作符类varchar_pattern_ops方式

create index idx_varchar on goods(name varchar_pattern_ops);

执行计划显示耗时为5ms以内：

explain (analyze,verbose,timing,costs,buffers) select * from goods where name like '123%' collate "C";

======================================
Bitmap Heap Scan on public.goods  (cost=86.60..7681.10 rows=1000 width=37) (actual time=0.740..4.628 rows=2364 loops=1)
  Output: id, name
  Filter: ((goods.name)::text ~~ '123%'::text)
  Heap Blocks: exact=2330
  Buffers: shared hit=2351
  ->  Bitmap Index Scan on idx_varchar  (cost=0.00..86.35 rows=2179 width=0) (actual time=0.487..0.487 rows=2364 loops=1)
        Index Cond: (((goods.name)::text ~>=~ '123'::text) AND ((goods.name)::text ~<~ '124'::text))
        Buffers: shared hit=21
Planning time: 0.139 ms
Execution time: 4.891 ms

PostgreSQL扩展

关键字ILIKE可以替换LIKE，表示大小写无关，这是一个PostgreSQL扩展。

参考

https://www.postgresql.org/docs/10/indexes-opclass.html
https://github.com/digoal/blog/blob/master/201704/20170426_01.md

版权声明：本文为monkjavaer原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/monkjavaer/p/11152985.html

【PostgreSQL】前缀模糊查询级优化的更多相关文章

带你快速了解 MongoDB 分布式集群
在分布式应用系统中，mongodb 已经成为 NoSQL 经典数据库。要想很好的使用 mongodb，仅仅知道 […]...
Java使用UDP发送数据到InfluxDB
最近在做压测引擎相关的开发，需要将聚合数据发送到InfluxDB保存以便实时分析和控制QPS。下面介绍对In […]...
Teradata 数据库
Teradata 数据库笔者大学所学计算机专业，读书时接触过Oracle、mysql和SQL SERVER， […]...
在pgsql库用触发器自动触发PostgreSQL的存储过程，实现插入。
需求：在对表A 执行 insert操作时，筛选符合条件的数据 insert到表B中，编写为存储过程（postg […]...
Cassandra与Kafka的集成
Cassandra和Kafka经常一起用于微服务架构中。本文将介绍几种Cassandra和Kafka常见的集成 […]...
Mysql无法选取非聚合列
教程所示图片使用的是 github 仓库图片，网速过慢的朋友请移步>>> （原文）Mysql […]...
SQL Server FOR XML PATH 和 STUFF函数的用法
　　　FOR XML PATH ，其实它就是将查询结果集以XML形式展现，将多行的结果，展示在同一行。　　　 […]...
详解MySQL执行事务的语法和流程
摘要：MySQL 提供了多种存储引擎来支持事务。 MySQL 提供了多种存储引擎来支持事务。支持事务的存储引擎 […]...

随机推荐

快速傅里叶变换(FFT)与多项式算法学习笔记
参考资料:menci的博客前言: 最近在学习生成函数,无奈的发现如果我不学习\(O(nlogn)\)的多项式 […]...
求超大文件上传方案( php )
最近遇见一个需要上传百兆大文件的需求，调研了七牛和腾讯云的切片分段上传功能，因此在此整理前端大文件上传相关功能的实现。在某些业务中，大文件上传是一个比较重要的交互场景，如上传入库比较大的Excel表格数据、上传影音文件等。如果文件...
网络流量预测入门（二）之LSTM介绍
目录网络流量预测入门（二）之LSTM介绍 LSTM简介 Simple RNN的弊端 LSTM的结构细胞状态 […]...
Redis的安装和Jedis的使用
Redis的安装和学习资料 Redis的安装可以参考 https://www.cnblogs.com/dddy […]...
H3C Telnet 配置
Telnet 配置管理方法是网络工程师和网络管理员使用最广泛的一种设备访问控制方法，它通过局域网或广域网实现 […]...
360在线网站安全检测，web安全测试AppScan扫描工具，XSS常用的攻击手法
360在线网站安全检测，web安全测试AppScan扫描工具，XSS常用的攻击手法如何做好网站的安全性测试 […]...
【iOS CocoaPods篇】iOS 10.10 10.11 10.12 安装升级CocoPods
CocoPods简介 CocoaPods是一个用Ruby写的，负责管理iOS以及OSX系统下的一个第三方类库管 […]...
解决Unity中模型部件的MeshCollider不随动画一起运动的问题
Unity的3d游戏开发中，经常遇到需要将模型的某一部分（比如武器），单独做碰撞处理的情况。导入模型后，给武 […]...

展开目录

目录导航