我有以下数据集.
- create table t1 (
- dept number,date1 date
- );
- Table created.
- insert into t1 values (100,'01-jan-2013');
- insert into t1 values (100,'02-jan-2013');
- insert into t1 values (200,'03-jan-2013');
- insert into t1 values (100,'04-jan-2013');
- commit;
我的目标是创建一个排名列,每次更改部门时都会重置.我可以用于“partition by”子句的最接近的列是dept,但这不会给我想要的结果.
- sql> select * from t1;
- DEPT DATE1
- ---------- ---------
- 100 01-JAN-13
- 100 02-JAN-13
- 200 03-JAN-13
- 100 04-JAN-13
- select dept,date1,rank () Over (partition by dept order by date1) rnk
- from t1
- order by date1;
- DEPT DATE1 RNK
- ---------- --------- ----------
- 100 01-JAN-13 1
- 100 02-JAN-13 2
- 200 03-JAN-13 1
- 100 04-JAN-13 3
期望的输出如下.最后一个rnk = 1是因为Jan-04记录是变更后的第一个记录.
- DEPT DATE1 RNK
- ---------- --------- ----------
- 100 01-JAN-13 1
- 100 02-JAN-13 2
- 200 03-JAN-13 1
- 100 04-JAN-13 1 <<<----------
有什么指针吗?
解决方法
这有点复杂.而不是使用rank()等,使用lag()来查看某些内容何时发生变化.然后做一个标志的累积和.
- select dept,CASE WHEN StartFlag = 0 THEN 1
- ELSE 1+StartFlag+NVL(lag(StartFlag) over (order by date1),0)
- END as rnk
- from (select t1.*,(case when dept = lag(dept) over (order by date1)
- then 1
- else 0
- end) as StartFlag
- from t1
- ) t1
- order by date1;
编辑:
这是戈登编辑我自己的答案.哎呀.原始查询是90%的方式.它确定了数字应该增加的组,但没有分配组内的数字.我会用另一个row_number()级别执行此操作,如下所示:
- select dept,row_number() over (partition by dept,grp order by date1) as rnk
- from (select dept,startflag,sum(StartFlag) over (partition by dept order by date1) as grp
- from (select t1.*,(case when dept = lag(dept) over (order by date1)
- then 0
- else 1
- end) as StartFlag
- from t1
- ) t1
- ) t1
- order by date1;
因此,总体思路如下.首先使用lag()来确定组的开始位置(即,从一个日期到下一个日期的部门更改).然后,通过累积总和为这些分配“组ID”.这些是要枚举的记录.最后一步是使用row_number()枚举它们.