관리 메뉴

Rootable의 개발일기

프로그래머스 SQL 풀이 - 년, 월, 성별 별 상품 구매 회원 수 구하기 본문

프로그래머스 - SQL Kit

프로그래머스 SQL 풀이 - 년, 월, 성별 별 상품 구매 회원 수 구하기

dev-rootable 2023. 5. 24. 16:14

https://school.programmers.co.kr/learn/courses/30/lessons/131532

 

프로그래머스

코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.

programmers.co.kr

 

문제 설명

다음은 어느 의류 쇼핑몰에 가입한 회원 정보를 담은 USER_INFO 테이블과 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블 입니다.USER_INFO 테이블은 아래와 같은 구조로 되어있으며 USER_IDGENDERAGEJOINED는 각각 회원 ID, 성별, 나이, 가입일을 나타냅니다.

 

출처 : 프로그래머스

 

GENDER 컬럼은 비어있거나 0 또는 1의 값을 가지며 0인 경우 남자를, 1인 경우는 여자를 나타냅니다.

 

ONLINE_SALE 테이블은 아래와 같은 구조로 되어있으며, ONLINE_SALE_IDUSER_IDPRODUCT_IDSALES_AMOUNTSALES_DATE는 각각 온라인 상품 판매 ID, 회원 ID, 상품 ID, 판매량, 판매일을 나타냅니다.

 

출처 : 프로그래머스

 

동일한 날짜, 회원 ID, 상품 ID 조합에 대해서는 하나의 판매 데이터만 존재합니다.

 

문제

USER_INFO 테이블과 ONLINE_SALE 테이블에서 년, 월, 성별 별로 상품을 구매한 회원수를 집계하는 SQL문을 작성해주세요. 결과는 년, 월, 성별을 기준으로 오름차순 정렬해주세요. 이때, 성별 정보가 없는 경우 결과에서 제외해주세요.

 

예시

예를 들어 USER_INFO 테이블이 다음과 같고

 

출처 : 프로그래머스

 

ONLINE_SALE 테이블이 다음과 같다면

 

출처 : 프로그래머스

 

2022년 1월에 상품을 구매한 회원은 USER_ID 가 1(GENDER=1), 4(GENDER=0)인 회원들이고,
2022년 2월에 상품을 구매한 회원은 USER_ID 가 2(GENDER=NULL), 5(GENDER=1), 6(GENDER=1)인 회원들 이므로,

 

년, 월, 성별 별로 상품을 구매한 회원수를 집계하고, 년, 월, 성별을 기준으로 오름차순 정렬하면 다음과 같은 결과가 나와야 합니다.

 

출처 : 프로그래머스

 

풀이

COUNT 집계 함수 때문에 레벨 4로 분류된 문제인 것 같다.

 

1. JOIN 컬럼은 USER_ID

 

2. 년, 월, 성별 별로라고 했으므로 GROUP BY에 DATE_FORMAT을 통해 추출한 년도, 월과 USER_INFO 테이블의 성별을 주면 된다. 정렬도 해당 순서로 오름차순하라고 했으므로 그대로 들어가면 된다.

 

 - DATE_FORMAT(DATE 값, '%Y') == YEAR(DATE 값)

 - DATE_FORMAT(DATE 값, '%c') == MONTH(DATE 값) // %c : 1자리 월, %m : 2자리 월

 

3. 성별이 없는 경우도 존재한다. 문제에서도 필터링을 요구했으므로 WHERE 또는 HAVING으로 필터링하면 된다.

 

 - GROUP BY에 성별이 들어갔으므로 HAVING으로 필터링해도 된다.

 

4. (⭐) COUNT 집계 함수로 판매횟수를 구하는 것이 아니라 회원수를 구하는 것이다.

 

 - 동일 날짜, 회원 ID, 상품 ID 조합에 대해 하나의 판매 데이터만 존재한다.

 - 하지만 상품 ID만 변경되어도 다른 조합이므로, 같은 날짜에 같은 회원이 여러 상품을 구매할 수 있다는 것이다.

 - GROUP BY에 사용자 별로 집계한 것이 아니므로, 날짜와 성별만으로 그룹핑하면 중복 데이터가 있게 된다.

 - COUNT에 USER_ID를 카운팅하되, DISTINCT를 넣어 카운팅한다.

 

정답 코드

SELECT date_format(b.SALES_DATE, '%Y') as YEAR
, date_format(b.SALES_DATE, '%c') as MONTH
, a.GENDER as GENDER
, COUNT(DISTINCT b.USER_ID) as USERS
FROM USER_INFO a
    JOIN ONLINE_SALE b ON a.USER_ID = b.USER_ID
GROUP BY date_format(b.SALES_DATE, '%Y'), date_format(b.SALES_DATE, '%c'), a.GENDER
HAVING a.GENDER IS NOT NULL
ORDER BY YEAR(b.SALES_DATE), MONTH(b.SALES_DATE), a.GENDER