使用集合运算符
使用集合运算符
Set 运算符用于连接两个(或多个)SELECT 语句的结果。Oracle 11g 中可用的 SET 运算符是 UNION、UNION ALL、INTERSECT 和 MINUS。
UNION 集合运算符返回两个 SELECT 语句的组合结果。本质上,它从结果中删除重复项,即每个重复的结果只列出一行。要对抗这种行为,请使用 UNION ALL 集合运算符,它保留了重复项最终结果。INTERSECT 只列出两个 SELECT 查询共有的记录;如果在第一个查询的结果中也找到了第二个查询的结果,则 MINUS 集合运算符将从输出中删除第二个查询的结果。INTERSECT 和 MINUS 集合操作产生不重复的结果。
所有的 SET 运算符在它们之间共享相同的优先级。相反,在查询执行期间,Oracle 从左到右或从上到下开始计算。如果明确使用括号,则顺序可能不同,因为括号将优先于悬空运算符。
要记住的要点 –
-
所有参与的 SELECT 语句必须选择相同数量的列。显示中使用的列名取自第一个查询。
-
列列表的数据类型必须兼容/可被 oracle 隐式转换。如果组件查询中对应的列属于不同的数据类型组,Oracle 不会进行隐式类型转换。例如,如果第一个组件查询中的列是数据类型的,而第二个组件查询中对应的列是数据类型类型 CHAR,Oracle 不会执行隐式转换,但会引发 ORA-01790 错误。
-
必须使用位置排序对结果集进行排序。Set 运算符不允许单独的结果集排序。ORDER BY 可以在查询结束时出现一次。例如,
-
UNION 和 INTERSECT 运算符是可交换的,即查询的顺序并不重要;它不会改变最终结果。
-
在性能方面,UNION ALL 与 UNION 相比表现出更好的性能,因为在过滤重复项和对结果集进行排序时不会浪费资源。
-
集合运算符可以是子查询的一部分。
-
不能在包含 TABLE 集合表达式的 SELECT 语句中使用集合运算符。
-
LONG、BLOB、CLOB、BFILE、VARRAY 或嵌套表不允许在 Set 运算符中使用。For update 子句不允许与 set 运算符一起使用。
联盟
当使用 UNION 运算符连接多个 SELECT 查询时,Oracle 在删除所有重复项后按排序顺序(默认为升序)显示所有复合 SELECT 查询的组合结果,而不会忽略 NULL 值。
考虑使用 UNION 运算符连接的以下五个查询。最终的组合结果集包含来自所有 SQL 的值。注意数据的重复删除和排序。
SELECT 1 NUM FROM DUAL UNION SELECT 5 FROM DUAL UNION SELECT 3 FROM DUAL UNION SELECT 6 FROM DUAL UNION SELECT 3 FROM DUAL; NUM ------- 1 3 5 6
需要注意的是,SELECT 查询中选择的列必须是兼容的数据类型。当违反规则时,Oracle 会抛出错误消息。
SELECT TO_DATE('12-OCT-03') FROM DUAL UNION SELECT '13-OCT-03' FROM DUAL; SELECT TO_DATE('12-OCT-03') FROM DUAL * ERROR at line 1: ORA-01790: expression must have same datatype as corresponding expression
联合所有
UNION 和 UNION ALL 的功能相似,但略有不同。但是 UNION ALL 给出的结果集没有删除重复和排序数据。例如,在上面的查询中,将 UNION 替换为 UNION ALL 以查看效果。
考虑 UNION 部分中演示的查询。请注意在没有排序和重复数据删除的情况下生成的输出的差异。
SELECT 1 NUM FROM DUAL UNION ALL SELECT 5 FROM DUAL UNION ALL SELECT 3 FROM DUAL UNION ALL SELECT 6 FROM DUAL UNION ALL SELECT 3 FROM DUAL; NUM ------- 1 5 3 6 3
相交
使用 INTERSECT 运算符,Oracle 显示来自两个 SELECT 语句的公共行,没有重复,数据按排序顺序排列(默认为升序)。
例如,下面的 SELECT 查询检索部门 10 和 20 中常见的工资。根据 ISO SQL 标准,INTERSECT 在集合运算符的评估优先级上高于其他查询,但 Oracle 尚未合并。
SELECT SALARY FROM employees WHERE DEPARTMENT_ID = 10 INTRESECT SELECT SALARY FROM employees WHERE DEPARTMENT_ID = 20 SALARY --------- 1500 1200 2000
减
减号运算符显示第一个查询中存在但第二个查询中不存在的行,默认情况下没有重复和数据按升序排列。
SELECT JOB_ID FROM employees WHERE DEPARTMENT_ID = 10 MINUS SELECT JOB_ID FROM employees WHERE DEPARTMENT_ID = 20; JOB_ID ------------- HR FIN ADMIN
匹配 SELECT 语句
在某些情况下,复合 SELECT 语句可能具有不同的所选列的计数和数据类型。因此,为了显式匹配列列表,在缺失位置插入 NULL 列,以匹配每个 SELECT 语句中所选列的计数和数据类型。对于数字列,也可以替换零以匹配查询中选择的列的类型。
在下面的查询中,员工姓名 (varchar2) 和位置 id (number) 的数据类型不匹配。因此,由于兼容性问题,执行以下查询会引发错误。
SELECT DEPARTMENT_ID "Dept", first_name "Employee" FROM employees UNION SELECT DEPARTMENT_ID, LOCATION_ID FROM departments; ERROR at line 1: ORA-01790: expression must have same datatype as corresponding expression
明确地,可以通过将 NULL 替换为位置 ID 和员工姓名来匹配列。
SELECT DEPARTMENT_ID "Dept", first_name "Employee", NULL "Location" FROM employees UNION SELECT DEPARTMENT_ID, NULL "Employee", LOCATION_ID FROM departments;
在 SET 操作中使用 ORDER BY 子句
ORDER BY 子句在包含复合 SELECT 语句的查询末尾只能出现一次。这意味着单个 SELECT 语句不能有 ORDER BY 子句。此外,排序可以仅基于出现在第一个 SELECT 查询中的列。因此,建议使用列位置对复合查询进行排序。
下面的复合查询将两个部门的结果统一起来,并按 SALARY 列进行排序。
SELECT employee_id, first_name, salary FROM employees WHERE department_id=10 UNION SELECT employee_id, first_name, salary FROM employees WHERE department_id=20 ORDER BY 3;