本文共 5031 字,大约阅读时间需要 16 分钟。
本文转载于网络,方便自己查询使用。
一.相关概念 1·rowid,伪列:就是系统自己给加上的,每个表都有一个伪列,不并不是物理存在。它不能修改,删除,和添加, rowid在该行的生命周期是唯一的,如果向数据库插入一列,只会引起行的变化,但是rowid并不会变。 2·recursive sql概念:当用户执行一些SQL语句时,会自动执行一些额外的语句,我们把这些额外的SQL语句称为 “recursive calls” 或者是“recursive sql statement”,当在执行一个DDL语句时,Oracle总会隐含的发出一些Recursiv sql语句,用于修改数据字典,如果数据字典没有在共享内存中,则就执行“resursive calls”,它会把数据字典从物理读取到共享内存。当然DML和select语句都可能引起recursive SQL。 3·row source 行源:在查询中,由上一操作返回的符合条件的数据集,它可能是整个表,也可能是部分,当然也可以对2个表进行连接操作(join)最后得到的数据集 4·predicate:一个查询中的where限制条件 5·driving table 驱动表:该表又成为外层表,这个感念用于内嵌和HASH连接中,如果返回数据较大,会有负面影响, 返回行数据较小的适合做驱动表 6·probed table 被探查表:该表又称为内层表,我们在外层表中取得一条数据,在该表中寻找符合连接的条件的行。 7·组合索引(concatenated index)由多个列组成的索引,在组合索引中有一个重要的概念,就是引导索引, create index idx_tab on tab(col1,col2,col3), indx_tab则称为组合索引, col1则称为引导列 在查询条件where后,必须使用引导索引,才会使用该组合索引 8.可选择性(selectivity)比较一下列中唯一键的数量和表中的行数,就可以判断该列的可选择性。 如果该列的“ 唯一键的数量/表中的行数”的比值越接近1,则该列的可选择性越高,该列就越适合创建索引,同样索引的可选择性也越高。 在可选择性高的列上进 行查询时,返回的数据就较少,比较适合使用索引查询。 二.Oracle访问数据的存取方法 1.全表扫描(Full tabel scans,FTS) 为了实现全表扫描,Oracle读取数据库中的每一行,并检查每一行是否满足语句的where限制条件一个多块读操作, 可以使io能读取多块数据块。减少了IO次数,提高了系统的吞吐量。在多块读的方法的使用下,可以高效的实现 数据库全表扫描,而且,中有在全表扫描的情况下,在可以使用多块读的方法。在这个种访问模式下,数据块只 读一次。 【注意】 使用FTS的前提是,在较大的表中,不建议使用FTS,除非取出的数据较多,超过总量的5%-10%,或者使用并行查询时 2.通过rowid的表存取 行的ROWID指向了该行的数据文件,数据块,以及在数据块中的位置,使用rowid能快速的定位到要取得数据的行上, 在Oracle中,这是取得单行最快的方式。 【注意】 该存取方法,不会用到多块读操作,一次IO只能读取一个数据块。 3.索引扫描(index scan 和 index lookup) 索引扫描时通过index查找到对应行的rowid,然后通过rowid从数据库中得到具体的数据。该方法分为两个步骤, (1)扫描索引得到得到rowid 说明:索引中不止储存着索引值,还存放的行的rowid (2)通过rowid得到表中的数据 【注意】 1.由于索引经常使用,因此绝大多数都Cache到内存当中,所以第一步通常是逻辑IO,即数据可以从内存中取得 2.但是对第二步来说,如果数据比较大,就不可能存放在内存,因此是个物理操作,是极其耗时间的,因此,从大表中 进行索引扫描,如果数量大于总数的5%-10%,则效力会下降很多 3.如果索引的数据都能在表中能找到,就可以避免第二步操作,避免了不必要的IO。效力会很高。 4.如果SQL语句会对索引排序,因为索引已经预先排好了戏,索引在执行计划中不需要在对索引排序。 根据索引的类型与where限制条件的不同,有4种数据类型的索引 1.唯一索引(index unique scan) 通过唯一索引查找一个数值,通常是rowid,如果表中存在unique,或者是primary key的话,Oracle通常实现 唯一索引 2.索引范围扫描(index range scan) 如果要取得多行数据,通常在唯一索引上加上范围操作,例如(>,<) *使用index rang scan的三种情况 (a)在唯一索引上有where条件筛选 (b)在组合索引上,使用部分列进行查询,导致查询出多行 (c)对非唯一 索引列进行的任何查询 3.索引全扫描(index full scan) 与全表扫描想对应的就是全索引扫描,它必要保证要取得的数据都从索引中直接得到 例: Index BE_IX is a concatenated index on big_emp (empno, ename) SQL> explain plan for select empno, ename from big_emp order by empno,ename; 4.索引快速扫描(index fash full scan) 索引快速扫描和index full scan相似,不会对查询出的数据进行排序。 三.表之间的连接 根据row source连接的条件不同,可以分为等值连接(where a.col3=b.col4)非等值连接(where a.col3>b.col4)外连接 (where a.col3=b.col4(+)) 1.典型的连接类型 (a)排序--合并连接(sort merge join,SMJ) (b)嵌套循环(nested loops,NL) (c)哈希连接(hash join,) A.排序--合并连接 1)首先生成row source1需要的数据,让后对连接关联的列进行排序。 2)然后生成row source2需要的数据,然后对这些数据按照与row socurce1相对应的操作关联列进行排序。 3)将两边排好序的数据进行合并操作,将2个row source按照连接条件连接起来。 [注意] ·.如果row source已经在关联上列上被排序,那个连接操作就不会执行sort操作,将大大的提高效率,因为排序时极其 消耗资源的,预先被排序的row source包括索引,或者已经排好序的列。 ·.排序是非常耗时的操作,尤其是大表,基于这个原因,SMJ通常不是一个好的解决办法,如果排序的工作早已做好 那将极大的提高效率 ·.对于非等值连接,这种连接方式的效率是比较高的。 B.圈套循环。 在连接有驱动表的概念,实际上连接过程就是2层嵌套循环,所以外层表的值也少也好。 [执行原理] 从内部表来看,需要得到外层表的每一行,去匹配内部表的所有行,因此保持外部表竟可能小,和高效率访问内部表,是 连接性能的关键。 [优点] nested loops可以返回已经连接的行,而不必等待所有的行连接完,因此能快速响应,特别适合用在 需要快速响应的语句中。 C.hash join 较小的row source用来构建hash table和bitmap,而第二个用来被hansed,并与第一个生成的hash table进行匹配。 bitmap用来作为一种较快查询的方法,用来检查hash table是否有匹配的行,特别在表大的情况下,不能容纳在内存 中,这个连接方法非常有效。这个链接,也有驱动表的概念,有来构造hash table,bitmap的表叫驱动表,如果被 构建的hash table,bitmap都能容纳在内存中,这个效率非常高。 【注意】 1)要使哈希连接有效,需要设置HASH_JOIN_ENABLED=TRUE,缺省情况下该参数为TRUE,另外,不要忘了还要设置 hash_area_size参数,以使哈希连接高效运行,因为哈希连接会在该参数指定大小的内存中运行,过小的参数 会使哈希连接的性能比其他连接方式还 要低 2)只能用于等值连接。 3)在2个较大的row source之间连接时会取得相对较好的效率,在一个row source较小时则能取得更好的效率。
解释结果 1.AND-EQUAL 该步骤具有两个或更多个子步骤,每一个子步骤返回一系列的ROWID.AND-EQUAL操作选择的是索引子操作返回的rowid 2.BITMAP conversoin to rowids --将位图从位图索引转换成可以用于提取实际资料的一系列的ROWID conversoin from rowids --将一系列的ROWID转换成位图表示 conversoin count --对位图的行数进行统计 index single scan --为单个索引提取位图 index range scan --返回的位图是一定范围的关键值 index full scan --扫描整个位图索引 MERGE --合并连个位图,并作为一个位图返回结果 Minus --该操作是merge的相反操作,而且可以具有两个或3个字操作并返回位图 第一个子操作返回的位图用作起点,第一个位图减去第二个位图中提供的所有行。如果第二个位图为空,那么所有的 null列也将被减去。 or --将两个位图作为输入 3.connect by --分层提取行,因为查询采用了CONNECT BY C从句 4.concatenaction --合并多个行集为一行。 5.count --计算从表中也选择的行数 stopkey --计算的行数被查询语句中的where 中的 rownum所限制 6.filter --将一系列的行数作为输入,并过滤到where从句查询而得到的结果 7.firsh row --提取查询结果集的第一行 8.for udpate -- 为提取的行加锁。 9.hash join --使用散列连接法连接两张表 10.index unique --从索引中查找唯一值 range scan --从一定范围中查找,是按照升序的方式 range scans desc --扫描行在一定范围之内,但是是按照降序的方式 11.inlist iterator --在in谓词中为一个值执行一次或者多次操作 13 intersection --将两个结果集合并成一个集,并返回在它们之间出现的共同的值 14 merger join --提供共同值,用来连续两个结果集的结果。是内连接 output --外 anit --反 seml --半 15 nosted loops --该操作涉及到2个子程序的操作,第一个返回一个行集,在用行集中的每一行,执行第二个子操作。 output --用于执行外部圈套循环 16 partition [分区] --执行一个或者多个分区操作,partition-start,partition-stop将提供分区的范围 singnal --显示操作将在单个分区上执行 iterator --在许多个分区中执行 all --显示操作将在所有分区上执行 inlist --显示操作在分区上执行,并用IN谓词驱动 17 projection --采用多个查询作为输入,并返回单个记录集。常和intersection,minus, unqie使用 18 sort aggregate --在行集上采用分组函数 unique --对行集排序,去掉重复的行 join -- 和merger相同 group up -- 分组排序 orday by --按照orday by进行排序 19 table access full --显示指定表中的所有行 cluster --与特定索引键进行匹配的所有行 hash --散列 by rowid --显示oracle表将从rowid提取 20 unqie 显示两个集,并去掉重复行 21 view 产生视图,并返回结果行集。