1、窗口函数

 

CURRENT ROW:当前行

n PRECEDING:往前n行数据

n FOLLOWING:往后n行数据

UNBOUNDED:起点,UNBOUNDED PRECEDING 表示从前面的起点, UNBOUNDED FOLLOWING表示到后面的终点

LAG(col,n,default_val):往前第n行数据

LEAD(col,n, default_val):往后第n行数据

NTILE(n):把有序窗口的行分发到指定数据的组中,各个组有编号,编号从1开始,对于每一行,NTILE返回此行所属的组的编号。注意:n必须为int类型。

 

创建一个business

create table business(
name string,
orderdate string,
cost int
) ROW FORMAT DELIMITED FIELDS TERMINATED BY \’,\’;
load data local inpath “/opt/module/export_data/business.txt” into table business;

 

 

1Over()over中制定数据窗口的大小,如果不写则指定全表

例:查询在2017年四月份购买过的顾客及总人数

Select name,count(name) over()

From business

Where substring(orderdate,1,7)=”2017-04”

Group by name;

(2)查询顾客的购买明细及月购买总额

 

Select *,sum(cost) over(partition  by moth(orderdate)) from business;

 

(3)将每个顾客的cost按照日期进行累加

Select *,sum(cost)  over(partition by name  order  by orderdate ) from business;

(4)查看顾客上次的购买时间

Select *,lag(orderdate,1)  over(partition by name order by  orderdate) as time1 from business;

 

(5)查询前20%时间的订单信息

 

select *

from (select name,orderdate,cost, ntile(5) over(order by orderdate) sortedfrom business) t where sorted = 1;

2、Rank

Rank():排序相同时会重复,总数不会变

Dense_rank():排序相同时会重复,总数会减少

Row_number():会根据顺序计算

 

例子:

 

 

计算每门学科成绩排名。

 

 

select *,
rank() over(partition by subject order by score desc) rp,
dense_rank() over(partition by subject order by score desc) drp,
row_number() over(partition by subject order by score desc) rmp
from score;

 

3、日期相关函数

(1)current_date返回当前日期

Select  current_date();

(2)date_add, date_sub 日期的加减

Select date_add(current_date(),1);

(3)两个日期之间的日期差datediff(当前时间,其他时间)

Select datediff(current_date(),”1990-06-01”);

 

版权声明:本文为wanghongwei1202原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/wanghongwei1202/p/14038489.html