작성
·
308
0
안녕하세요. sql 초보입니다.
조인 실습 02에서 max(ename) as ename를 max함수로 한 이유가 뭔가요?
---
with 함수를 잘 몰라서, 아래와 같이 하기는 했는데
select b.empno, b.ename, avg(c.sal) as AVERGESAL
from hr.dept a
join hr.emp b on a.deptno = b.deptno
join emp_salary_hist c on b.empno = c.empno
where a.dname in ('SALES','RESEARCH')
group by b.empno
order by 1, 2
---
결과값은 동일해보였지만, 설명해주신 쿼리문으로 이해하려고 구글링을 해보았습니다.
나머지는 이해가 가는데 max함수가 저렇게 쓰인 이유에 대해서는 잘 이해가 안갑니다!ㅜ
답변 1
2
안녕하십니까,
이후 강의인 group by 에서도 설명을 드릴텐데, group by 를 사용할 경우 select 절에 올 수 있는 컬럼은 group by 절에 사용된 컬럼과 집계 함수 입니다.
때문에 적어주신 아래 쿼리는 select 절에 group by 컬럼이 아닌 b.ename이 되어 있어서 수행이 되지 않는 것이 정상입니다.
select b.empno, b.ename, avg(c.sal) as AVERGESAL
from hr.dept a
join hr.emp b on a.deptno = b.deptno
join hr.emp_salary_hist c on b.empno = c.empno
where a.dname in ('SALES','RESEARCH')
group by b.empno
order by 1, 2
그런데 수행이 되는 이유는 postgresql이 똑똑하기(?) 때문입니다.
group by 강의에서도 말씀 드릴텐데, group by 를 수행하면 group by 절에 나열된 컬럼으로 1의 집합을 만듭니다. 즉 group by 절 컬럼으로 unique한 집합이 만들어 집니다. 그런데 postgresql이 b.empno로 b.ename 이 unique한것을 내부 통계정보로 알고 있습니다. 그러니까 empno가 고유하므로 하나의 empno에 서로 다른 ename(이름)이 올수 없는것을 알고 있습니다. 그래서 empno로 ename이 고유한것을 알고 있기 때문에 위의 SQL을 허용해 줍니다.
일반적으로는 group by 절 컬럼으로 unique 해야 하므로 select 절에 올수 있는 것은 group by 절 컬럼과 집계 함수 입니다. 그래서 아래와 같이 max(b.ename)을 적용하는 것이 다른 db에서도 동작할 수 있는 SQL 입니다.
select b.empno, max(b.ename) as ename, avg(c.sal) as AVERGESAL
from hr.dept a
join hr.emp b on a.deptno = b.deptno
join hr.emp_salary_hist c on b.empno = c.empno
where a.dname in ('SALES','RESEARCH')
group by b.empno
order by 1, 2
감사합니다.
안녕하세요 강사님
unique값으로 max를 썼다면, min(ename) 해도 문제가 없나요?
같은 결과가 나오고, 이름에 max,min( 최댓값.최솟값) 구분이 의미가 없는 것 같아 문의드립니다.
뒤에 강의 듣고 더 이해가 갔습니다. 친절한 설명 감사드립니다!