oracle中 connect by prior 递归算法
Oracle中start with...connect by prior子句使用方法 connect by 是结构化查询中用到的,其基本的语法是:
select ... from tablename start with 条件1
connect by 条件2
where 条件3;
例:
select * from table
start with org_id = ‘HBHqfWGWPy‘
connect by prior org_id = parent_id;
简单说来是将一个树状结构存储在一张表里,比方一个表中存在两个字段:
org_id,parent_id那么通过表示每一条记录的parent是谁,就能够形成一个树状结构。
用上述语法的查询能够取得这棵树的全部记录。
当中:
条件1 是根结点的限定语句,当然能够放宽限定条件,以取得多个根结点,实际就是多棵树。
条件2 是连接条件,当中用PRIOR表示上一条记录,比方 CONNECT BY PRIOR org_id = parent_id就是说上一条记录的org_id 是本条记录的parent_id,即本记录的父亲是上一条记录。
条件3 是过滤条件,用于对返回的全部记录进行过滤。
简介例如以下:
早扫描树结构表时,须要依此訪问树结构的每一个节点,一个节点仅仅能訪问一次,其訪问的过程例如以下:
第一步:从根节点開始;
第二步:訪问该节点;
第三步:推断该节点有无未被訪问的子节点,若有,则转向它最左側的未被訪问的子节,并运行第二步,否则运行第四步;
第四步:若该节点为根节点,则訪问完成,否则运行第五步;
第五步:返回到该节点的父节点,并运行第三步骤。
总之:扫描整个树结构的过程也即是中序遍历树的过程。
1. 树结构的描写叙述
树结构的数据存放在表中,数据之间的层次关系即父子关系,通过表中的列与列间的关系来描写叙述,如EMP表中的EMPNO和MGR。EMPNO表示该雇员的编号,MGR表示领导该雇员的人的编号,即子节点的MGR值等于父节点的EMPNO值。在表的每一行中都有一个表示父节点的MGR(除根节点外),通过每一个节点的父节点,就能够确定整个树结构。
在SELECT命令中使用CONNECT BY 和蔼START WITH 子句能够查询表中的树型结构关系。其命令格式例如以下:
SELECT 。。。
CONNECT BY {PRIOR 列名1=列名2|列名1=PRIOR 裂名2}
[START WITH];
当中:CONNECT BY子句说明每行数据将是按层次顺序检索,并规定将表中的数据连入树型结构的关系中。PRIORY运算符必须放置在连接关系的两列中某一个的前面。对于节点间的父子关系,PRIOR运算符在一側表示父节点,在还有一側表示子节点,从而确定查找树结构是的顺序是自顶向下还是自底向上。在连接关系中,除了能够使用列名外,还同意使用列表达式。START WITH 子句为可选项,用来标识哪个节点作为查找树型结构的根节点。若该子句被省略,则表示全部满足查询条件的行作为根节点。
START WITH: 不但能够指定一个根节点,还能够指定多个根节点。
2. 关于PRIOR
运算符PRIOR被放置于等号前后的位置,决定着查询时的检索顺序。
PRIOR被置于CONNECT BY子句中等号的前面时,则强制从根节点到叶节点的顺序检索,即由父节点向子节点方向通过树结构,我们称之为自顶向下的方式。如:
CONNECT BY PRIOR EMPNO=MGR
PIROR运算符被置于CONNECT BY 子句中等号的后面时,则强制从叶节点到根节点的顺序检索,即由子节点向父节点方向通过树结构,我们称之为自底向上的方式。比如:
CONNECT BY EMPNO=PRIOR MGR
在这样的方式中也应指定一个開始的节点。
3. 定义查找起始节点
在自顶向下查询树结构时,不但能够从根节点開始,还能够定义不论什么节点为起始节点,以此開始向下查找。这样查找的结果就是以该节点为開始的结构树的一枝。
4.使用LEVEL
在具有树结构的表中,每一行数据都是树结构中的一个节点,因为节点所处的层次位置不同,所以每行记录都能够有一个层号。层号依据节点与根节点的距离确定。不论从哪个节点開始,该起始根节点的层号始终为1,根节点的子节点为2, 依此类推。
5.节点和分支的裁剪
在对树结构进行查询时,能够去掉表中的某些行,也能够剪掉树中的一个分支,使用WHERE子句来限定树型结构中的单个节点,以去掉树中的单个节点,但它却不影响其后代节点(自顶向下检索时)或前辈节点(自底向顶检索时)。
6.排序显示
象在其他查询中一样,在树结构查询中也能够使用ORDER BY 子句,改变查询结果的显示顺序,而不必依照遍历树结构的顺序
----------------------------------------------------------------------------------------------------------
oracle 提供了start with connect by 语法结构能够实现递归查询。
1. 一个简单举例:
SQL> select * from test;
BILL_MONTH DAY_NUMBER MSISDN
-------------------- ---------- --------------------
200803 1 13800
200803 3 13800
200803 2 13800
200803 2 13801
200803 4 13804
200803 5 13804
200803 7 13804
200803 8 13804
200803 6 13802
200803 6 13801
200803 7 13801
200803 8 13801
12 rows selected
SQL>
SQL> select * from test
2 start with day_number=1
3 connect by prior day_number=day_number-1 and prior msisdn= msisdn
4 ;
BILL_MONTH DAY_NUMBER MSISDN
-------------------- ---------- --------------------
200803 1 13800
200803 2 13800
200803 3 13800
SQL>
上面的语句查找出了从1開始,而且day_number 逐渐+1 递增的,而且 msisdn 同样的哪些个数据.
2. start with connect by 语法结构
如上面说看到的 样例, 其语法结构为 start with condition connect by condition (含 prior keyword)
start with conditon 给出的seed 数据的范围, connect by 后面给出了递归查询的条件,prior keyword表示父数据,prior 条件表示子数据须要满足父数据的什么条件。
在以下的这个start with connect by 结构中,就表示 查找出了从1開始,而且day_number 逐渐+1 递增的,而且 msisdn 同样的那些个数据.
start with day_number=1
connect by prior day_number=day_number-1 and prior msisdn= msisdn
3. 运行计划
对于这个特殊的语法结构,我们来看看它的运行计划。
通过以下的运行计划,我们能够看出,对于简单的訪问一个对象的递归查询,实际上oracle 要三次訪问要查询的对象。因此,这一个告诉我们,在使用递归查询时,一定要慎重,由于即使原表数据不多,可是三倍的訪问喜爱来,代价也会非常大。
SQL> explain plan for
2
2 select * from test
3 --where bill_month=‘200803‘
4 start with day_number=1
5 connect by prior day_number=day_number-1 and prior msisdn= msisdn
6 ;
Explained
SQL> select * from table( dbms_xplan.display);
PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
-------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost |
-------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | | | |
|* 1 | CONNECT BY WITH FILTERING| | | | |
|* 2 | FILTER | | | | |
| 3 | TABLE ACCESS FULL | TEST | | | |
| 4 | NESTED LOOPS | | | | |
| 5 | BUFFER SORT | | | | |
| 6 | CONNECT BY PUMP | | | | |
|* 7 | TABLE ACCESS FULL | TEST | | | |
| 8 | TABLE ACCESS FULL | TEST | | | |
-------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
1 - filter("TEST"."DAY_NUMBER"=1)
2 - filter("TEST"."DAY_NUMBER"=1)
PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
7 - filter("TEST"."MSISDN"=NULL AND "TEST"."DAY_NUMBER"-1=NULL)
Note: rule based optimization
23 rows selected
SQL>
另外,发现了在含有其它条件的递归中,是先处理全部的递归查询,最后才用增加的条件过滤.
请看以下的样例。
和上面的运行计划对照下我们能够知道,增加条件 where bill_month=‘200803‘ 后,实际上却是在递归完毕后,最后才运行的 1 - filter("TEST"."BILL_MONTH"=‘200803‘) 。
所以,为了确保语句的性能,不要直接增加条件在start with connect by 结构中,而是要想办法将原表的数据控制住。这个能够採用子查询的办法,或者使用暂时表等(最好採用暂时表,将数据量从本源上控制住;由于从子查询的运行计划我们能够看到,它每次也都是訪问全表,再用条件过滤,要反复三次,不是一次过滤就够了).
--直接增加条件后的运行计划
SQL> explain plan for
2
2 select * from test
3 where bill_month=‘200803‘
4 start with day_number=1
5 connect by prior day_number=day_number-1 and prior msisdn= msisdn
6 ;
Explained
SQL> select * from table( dbms_xplan.display);
PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
--------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost |
--------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | | | |
|* 1 | FILTER | | | | |
|* 2 | CONNECT BY WITH FILTERING| | | | |
|* 3 | FILTER | | | | |
| 4 | TABLE ACCESS FULL | TEST | | | |
| 5 | NESTED LOOPS | | | | |
| 6 | BUFFER SORT | | | | |
| 7 | CONNECT BY PUMP | | | | |
|* 8 | TABLE ACCESS FULL | TEST | | | |
| 9 | TABLE ACCESS FULL | TEST | | | |
--------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
1 - filter("TEST"."BILL_MONTH"=‘200803‘)
PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
2 - filter("TEST"."DAY_NUMBER"=1)
3 - filter("TEST"."DAY_NUMBER"=1)
8 - filter("TEST"."MSISDN"=NULL AND "TEST"."DAY_NUMBER"-1=NULL)
Note: rule based optimization
25 rows selected
SQL>
--使用子查询,将过滤条件嵌在子查询中
SQL> explain plan for
2
2 select * from (select * from test
3 where bill_month=‘200803‘)
4 start with day_number=1
5 connect by prior day_number=day_number-1 and prior msisdn= msisdn
6 ;
Explained
SQL> select * from table(dbms_xplan.display);
PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
-------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost |
-------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | | | |
|* 1 | CONNECT BY WITH FILTERING| | | | |
|* 2 | FILTER | | | | |
|* 3 | TABLE ACCESS FULL | TEST | | | |
| 4 | NESTED LOOPS | | | | |
| 5 | BUFFER SORT | | | | |
| 6 | CONNECT BY PUMP | | | | |
|* 7 | TABLE ACCESS FULL | TEST | | | |
|* 8 | TABLE ACCESS FULL | TEST | | | |
-------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
1 - filter("TEST"."DAY_NUMBER"=1)
2 - filter("TEST"."DAY_NUMBER"=1)
PLAN_TABLE_OUTPUT
--------------------------------------------------------------------------------
3 - filter("TEST"."BILL_MONTH"=‘200803‘)
7 - filter("TEST"."BILL_MONTH"=‘200803‘ AND "TEST"."MSISDN"=NULL AND
"TEST"."DAY_NUMBER"-1=NULL)
8 - filter("TEST"."BILL_MONTH"=‘200803‘)
Note: rule based optimization
26 rows selected
SQL>
4. 实际中 递归查询的使用。
问题:
数据库里有字段day_number,msisdn。怎样写月度连续3天有记录的手机号?表结构例如以下:
id bill_month day_number msisdn
1 200803 1 13800000000
2 200803 1 130137.....
3 200803 2 13800000000
4 200803 3 13800000000
..............................
表中3月份连续3天有记录的纪录就是1380000000。请问怎样写这种sql?
解决方式:
SQL> create table test ( bill_month varchar2(20),day_number number ,msisdn varchar2(20));
Table created
SQL> insert into test values ( ‘200803‘,1,‘13800‘);
1 row inserted
SQL> insert into test values ( ‘200803‘,3,‘13800‘);
1 row inserted
SQL> insert into test values ( ‘200803‘,2,‘13800‘);
1 row inserted
SQL> insert into test values ( ‘200803‘,2,‘13801‘);
1 row inserted
SQL> insert into test values ( ‘200803‘,4,‘13804‘);
1 row inserted
SQL> insert into test values ( ‘200803‘,5,‘13804‘);
1 row inserted
SQL> commit;
Commit complete
SQL> select * from test;
BILL_MONTH DAY_NUMBER MSISDN
-------------------- ---------- --------------------
200803 1 13800
200803 3 13800
200803 2 13800
200803 2 13801
200803 4 13804
200803 5 13804
6 rows selected
SQL>
SQL> select distinct msisdn from test a
2 where bill_month=‘200803‘
3 and exists
4 ( select msisdn from test
5 where bill_month=‘200803‘ and msisdn=a.msisdn
6 start with day_number=a.day_number
7 connect by prior day_number=day_number-1 and prior msisdn= msisdn
8 group by msisdn
9 having count(*)>=3
10 );
MSISDN
--------------------
13800
SQL> select * from test;
BILL_MONTH DAY_NUMBER MSISDN
-------------------- ---------- --------------------
200803 1 13800
200803 3 13800
200803 2 13800
200803 2 13801
200803 4 13804
200803 5 13804
6 rows selected
SQL> insert into test values ( ‘200803‘,7,‘13804‘);
1 row inserted
SQL> insert into test values ( ‘200803‘,8,‘13804‘);
1 row inserted
SQL> insert into test values ( ‘200803‘,6,‘13802‘);
1 row inserted
SQL> insert into test values ( ‘200803‘,6,‘13801‘);
1 row inserted
SQL> insert into test values ( ‘200803‘,7,‘13801‘);
1 row inserted
SQL> insert into test values ( ‘200803‘,8,‘13801‘);
1 row inserted
SQL> select * from test;
BILL_MONTH DAY_NUMBER MSISDN
-------------------- ---------- --------------------
200803 1 13800
200803 3 13800
200803 2 13800
200803 2 13801
200803 4 13804
200803 5 13804
200803 7 13804
200803 8 13804
200803 6 13802
200803 6 13801
200803 7 13801
200803 8 13801
12 rows selected
SQL> commit;
Commit complete
SQL>
SQL> select distinct msisdn from test a
2 where bill_month=‘200803‘
3 and exists
4 ( select msisdn from test
5 where bill_month=‘200803‘ and msisdn=a.msisdn
6 start with day_number=a.day_number
7 connect by prior day_number=day_number-1 and prior msisdn= msisdn
8 group by msisdn
9 having count(*)>=3
10 );
MSISDN
--------------------
13800
13801
SQL>