인프런 커뮤니티 질문&답변

sddyyy1004님의 프로필 이미지
sddyyy1004

작성한 질문수

BigQuery(SQL) 활용편(퍼널 분석, 리텐션 분석)

[빠짝스터디 1주차 과제] ARRAY, STRUCT / PIVOT / 퍼널 쿼리 연습 문제

작성

·

20

0

ARRAY, STRUCT, UNNEST 연습 문제

  • array_exercises 테이블에서 각 영화(title)별로 장르(genres)를 UNNEST해서 보여주세요

SELECT
 title,
 genre
FROM `plucky-catfish-394207.advanced.array_exercises`
   , unnest(genres) as genre
ORDER BY 1
  • array_exercises 테이블에서 각 영화(title)별로 배우(actor)와 배역(character)을 보여주세요. 배우와 배역은 별도의 컬럼으로 나와야 합니다

SELECT
 title,
 actor.actor,
 actor.character,
FROM `plucky-catfish-394207.advanced.array_exercises`
   , unnest(genres) as genre
ORDER BY 1
  • array_exercises 테이블에서 각 영화(title)별로 배우(actor), 배역(character), 장르 (genre)를 출력하세요. 한 Row에 배우, 배역, 장르가 모두 표시되어야 합니다

     

    SELECT
     title,
     actor.actor,
     genre,
    FROM `plucky-catfish-394207.advanced.array_exercises`
       , unnest(genres) as genre
       , unnest(actors) as actors
    ORDER BY 1
  • 앱 로그 데이터(app_logs)의 배열을 풀어주세요

    SELECT
     user_id,
     event_date,
     event_name,
     user_pseudo_id,
     ep.key,
     ep.value.string_value,
     ep.value.int_value
    FROM `plucky-catfish-394207.advanced.array_exercises`
       , unnest(event_params) as ep
    ORDER BY 2

 

PIVOT

  • orders 테이블에서 유저(user_id)별로 주문 금액(amount)의 합계를 PIVOT해주세요. 날짜(order_date)를 행(Row)으로, user_id를 열(Column)으로 만들어야 합니다

    SELECT
     order_date,
     SUM(IF(user_id = 1, amount, 0) as user_1,
     SUM(IF(user_id = 2, amount, 0) as user_2,
     SUM(IF(user_id = 3, amount, 0) as user_3,
    FROM `plucky-catfish-394207.advanced.array_exercises`
       , unnest(event_params) as ep
    GROUP BY 1
    ORDER BY 1
  • orders 테이블에서 날짜(order_date)별로 유저들의 주문 금액(amount)의 합계를 PIVOT 해주세요. user_id를 행(Row)으로, order_date를 열(Column)으로 만들어야 합니다

     

    SELECT
     user_id,
     SUM(IF(order_date = '2023-05-01', amount, 0) as `2023-05-01`,
     SUM(IF(order_date = '2023-05-02', amount, 0) as `2023-05-02`,
     SUM(IF(order_date = '2023-05-03', amount, 0) as `2023-05-03`,
     SUM(IF(order_date = '2023-05-04', amount, 0) as `2023-05-04`,
     SUM(IF(order_date = '2023-05-05', amount, 0) as `2023-05-05`,
    FROM `plucky-catfish-394207.advanced.array_exercises`
       , unnest(event_params) as ep
    GROUP BY 1
    ORDER BY 1
  • orders 테이블에서 사용자(user_id)별, 날짜(order_date)별로 주문이 있다면 1, 없다면 0으로 PIVOT 해주세요. user_id를 행(Row)으로, order_date를 열(Column)로 만들고 주문을 많이 해도 1로 처리합니다

     

    SELECT
     user_id,
     SUM(IF(order_date = '2023-05-01', amount > 0, 1, 0) as `2023-05-01`,
     SUM(IF(order_date = '2023-05-02', amount > 0, 1, 0) as `2023-05-02`,
     SUM(IF(order_date = '2023-05-03', amount > 0, 1, 0) as `2023-05-03`,
     SUM(IF(order_date = '2023-05-04', amount > 0, 1, 0) as `2023-05-04`,
     SUM(IF(order_date = '2023-05-05', amount > 0, 1, 0) as `2023-05-05`,
    FROM `plucky-catfish-394207.advanced.array_exercises`
       , unnest(event_params) as ep
    GROUP BY 1
    ORDER BY 1
  • user_id = 32888이 카트 추가하기(click_cart)를 누를때 어떤 음식(food_id)을 담았나요?

     

    SELECT
     event_date,
     event_name, 
     event_timestamp,
     user_id,
     user_pseudo_id,
     MAX(IF(ep.key = 'firebase_screen', ep.value.string_value, NULL)) as firebase_screen,
     MAX(IF(ep.key = 'food_id', ep.value.int_value, NULL)) as food_id,
     MAX(IF(ep.key = 'session_id', ep.value.int_value, NULL)) as session_id,
    FROM `plucky-catfish-394207.advanced.array_exercises`
       , unnest(event_params) as ep
    WHERE event_date = '2022-08-01'
     AND user_id = 32888
    GROUP BY 1, 2, 3, 4, 5

 

퍼널 분석

WITH base AS (
  SELECT
    event_date
    event_timestamp,
    event_name,
    user_id,
    user_pseudo_id,
    platform,
    MAX(IF(event_param.key = "firebase_screen", event_param.value.string_value, NULL)) AS firebase_screen,
    MAX(IF(event_param.key = "session_id", event_param.value.string_value, NULL)) AS session_id
  FROM advanced.app_logs
  CROSS JOIN UNNEST(event_params) AS event_param
  WHERE

    event_date BETWEEN "2022-08-01" AND "2022-08-18"
  GROUP BY ALL
), filter_event_and_concat_event_and_screen AS (
  SELECT
    * EXCEPT(event_name, firebase_screen, event_timestamp),
    CONCAT(event_name, "-", firebase_screen) AS event_name_with_screen,
    DATETIME(TIMESTAMP_MICROS(event_timestamp), 'Asia/Seoul') AS event_datetime
  FROM base
  WHERE
    event_name IN ("screen_view", "click_payment")
), add_step_number AS (

  SELECT
    event_date, 
    event_name_with_screen,
    CASE 
      WHEN event_name_with_screen = "screen_view-welcome" THEN 1
      WHEN event_name_with_screen = "screen_view-home" THEN 2
      WHEN event_name_with_screen = "screen_view-food_category" THEN 3
      WHEN event_name_with_screen = "screen_view-restaurant" THEN 4
      WHEN event_name_with_screen = "screen_view-cart" THEN 5
      WHEN event_name_with_screen = "click_payment-cart" THEN 6
    ELSE NULL
    END AS step_number,
    COUNT(DISTINCT user_pseudo_id) AS cnt
  FROM filter_event_and_concat_event_and_screen
  GROUP BY ALL
  HAVING step_number IS NOT NULL

답변 1

0

안녕하세요, 인프런 AI 인턴입니다. sddyyy1004님.

BigQuery에서의 다양한 쿼리 작성은 데이터를 이해하고 가공하는 데 중요한 역할을 합니다. 질문하신 퍼널 분석, ARRAY와 STRUCT, 그리고 PIVOT에 대한 쿼리 작성은 데이터 분석에서 필수적인 부분입니다.

관련된 기존 답변

작업하신 쿼리와 비슷한 주제를 다룬 기존의 질문과 답변은 아래의 링크에서 확인하실 수 있습니다. 특히 애리 길의 사용, 구조 분해, PIVOT 등을 다룬 예제들이 있습니다.

  1. 퍼널 SQL 작성 오류 해결 사례

    • 퍼널 쿼리 작성에 있어 흔히 발생할 수 있는 오류와 그 해결 방안이 논의됩니다. 이 쿼리는 퍼널 분석 시 꼭 확인해야 할 사항들을 다루고 있으니 참고해 보세요.
  2. BigQuery에서 UNNEST와 PIVOT 적용하기

    • UNNEST와 PIVOT을 사용하여 데이터 가공을 수행하는 Quory에 대해 상세히 설명하고 있습니다. 각 단계별로 쿼리를 어떻게 작성해야 하는지 확인할 수 있습니다.
  3. Data PIVOT을 사용한 유저 활동 분석

    • 윈도우 함수를 사용하여 데이터를 집계하는데 도움이 되는 응답입니다. WINDOW 함수와 PIVOT의 조합 사용 예시를 볼 수 있습니다.

쿼리를 작성하고 검토할 때의 팁

  • 구문 검사: 함수나 구문의 철자 오류를 점검하세요. 강의에서 제시한 쿼리를 바탕으로 디버깅하면 오류를 줄일 수 있습니다.
  • 표현식의 정확성: PIVOT 등과 같은 복잡한 표현식을 사용할 때, 구문이 올바르게 작성되었는지 확실히 해주세요. 괄호의 짝맞춤도 확인이 필요합니다.
  • 데이터 흐름 이해: 쿼리를 작성할 때 단순히 쿼리 결과만이 아니라, 데이터가 흐르는 과정도 고려하세요. UNNEST나 CROSS JOIN과 같은 코드 부분이 의도에 맞게 처리되고 있는지 꾸준히 확인하는 것이 좋습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

sddyyy1004님의 프로필 이미지
sddyyy1004

작성한 질문수

질문하기