관리 메뉴

Rootable의 개발일기

프로그래머스 SQL 풀이 - 오프라인/온라인 판매 데이터 통합하기 본문

프로그래머스 - SQL Kit

프로그래머스 SQL 풀이 - 오프라인/온라인 판매 데이터 통합하기

dev-rootable 2023. 5. 19. 21:56

https://school.programmers.co.kr/learn/courses/30/lessons/131537

 

프로그래머스

코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.

programmers.co.kr

 

문제 설명

다음은 어느 의류 쇼핑몰의 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블과 오프라인 상품 판매 정보를 담은 OFFLINE_SALE 테이블 입니다. ONLINE_SALE 테이블은 아래와 같은 구조로 되어있으며 ONLINE_SALE_IDUSER_IDPRODUCT_IDSALES_AMOUNTSALES_DATE는 각각 온라인 상품 판매 ID, 회원 ID, 상품 ID, 판매량, 판매일을 나타냅니다.

 

출처 : 프로그래머스

 

동일한 날짜, 회원 ID, 상품 ID 조합에 대해서는 하나의 판매 데이터만 존재합니다.

 

OFFLINE_SALE 테이블은 아래와 같은 구조로 되어있으며 OFFLINE_SALE_IDPRODUCT_IDSALES_AMOUNTSALES_DATE는 각각 오프라인 상품 판매 ID, 상품 ID, 판매량, 판매일을 나타냅니다.

 

출처 : 프로그래머스

 

동일한 날짜, 상품 ID 조합에 대해서는 하나의 판매 데이터만 존재합니다.

 

문제

ONLINE_SALE 테이블과 OFFLINE_SALE 테이블에서 2022년 3월의 오프라인/온라인 상품 판매 데이터의 판매 날짜, 상품ID, 유저ID, 판매량을 출력하는 SQL문을 작성해주세요. OFFLINE_SALE 테이블의 판매 데이터의 USER_ID 값은 NULL 로 표시해주세요. 결과는 판매일을 기준으로 오름차순 정렬해주시고 판매일이 같다면 상품 ID를 기준으로 오름차순, 상품ID까지 같다면 유저 ID를 기준으로 오름차순 정렬해주세요.

 

예시

ONLINE_SALE 테이블

 

출처 : 프로그래머스

 

OFFLINE_SALE 테이블

 

출처 : 프로그래머스

 

각 테이블의 2022년 3월의 판매 데이터를 합쳐서, 정렬한 결과는 다음과 같아야 합니다.

 

출처 : 프로그래머스

 

풀이

이 문제는 1, 2번 때문에 애를 좀 먹었다.

 

1. JOIN 가능 여부 > 불가능

 

상품 ID 로 연결되어 있는 것처럼 보였지만 예시를 자세히 보면 두 개의 테이블은 독립적으로 조건에 맞는 로우를 갖고 와서 이어 붙였다. 잘 생각해보면 온라인과 오프라인 판매 실적이기 때문에 독립적으로 불러오는 것이 맞다고 생각한다.

 

2. UNION 조건

 

UNION 을 사용하기 위해서는 두 결과 테이블의 컬럼 수와 타입이 동일해야 한다. 하지만 오프라인 테이블에는 USER_ID 가 없다. 이 부분은 대체 컬럼을 넣으면 된다고 생각했지만 NULL 과 타입이 일치할 수 있을까 하는 물음이 생겼었다. 정답은 NULL과 호환된다. 즉, 대체 컬럼을 NULL로 넣고, 이름만 USER_ID 로 주면 되는 것이다.

 

3. ORDER BY

 

UNION 을 사용하는 상황이기 때문에 ORDER BY 는 전역적으로 적용되어야 한다. 따라서, 특정 테이블의 컬럼이 아닌 컬럼명만 적으면 된다.

 

4. UNION vs UNION ALL -> Anything

 

UNION은 기본적으로 DISTINCT하게 레코드를 갖고 온다. 즉, 중복된 레코드를 제외하고 병합한다.

반면, UNION ALL은 중복을 포함하여 병합한다.

이 문제에서는 어떤 것을 해도 정답으로 처리된다.

 

정답 코드

 

SELECT date_format(sales_date, '%Y-%m-%d') as SALES_DATE, PRODUCT_ID
, USER_ID, SALES_AMOUNT
FROM ONLINE_SALE a
WHERE date_format(sales_date, '%m') = 3
UNION
SELECT date_format(sales_date, '%Y-%m-%d') as SALES_DATE, PRODUCT_ID
, NULL AS USER_ID, SALES_AMOUNT
FROM OFFLINE_SALE b
WHERE date_format(sales_date, '%m') = 3
ORDER BY SALES_DATE, PRODUCT_ID, USER_ID