인프런 커뮤니티 질문&답변

이재헌님의 프로필 이미지
이재헌

작성한 질문수

BigQuery(SQL) 활용편(퍼널 분석, 리텐션 분석)

[빠짝스터디 1주차 과제] ARRAY, STRUCT 연습 문제/ PIVOT 연습문제/ 퍼널 쿼리 연습 문제

작성

·

49

0

1) ARRAY, STRUCT 연습문제

1-1)

SELECT
  title,
  genre
FROM
  advanced.array_exercises
CROSS JOIN UNNEST (genres) as genre
ORDER BY title;

1-2)

SELECT
  title,
  actor.actor,
  actor.character
FROM
  advanced.array_exercises
CROSS JOIN UNNEST(actors) as actor
ORDER BY title;

1-3)

SELECT
  title,
  actor.actor,
  actor.character,
  genre
FROM
  advanced.array_exercises
CROSS JOIN UNNEST(genres) as genre
CROSS JOIN UNNEST(actors) as actor
ORDER BY 1,2,3;

1-4)

SELECT
  user_id,
  event_date,
  event_name,
  user_pseudo_id,
  event_param.key,
  event_param.value.string_value,
  event_param.value.int_value
FROM
  advanced.app_logs
CROSS JOIN UNNEST(event_params) as event_param
WHERE
  event_date = '2022-08-01';


2) PIVOT 연습문제

2-1)

1)

SELECT
  order_date,
  SUM(IF(user_id = 1, amount, 0 )) AS user_1,
  SUM(IF(user_id = 2, amount, 0 )) AS user_2,
  SUM(IF(user_id = 3, amount, 0 )) AS user_3
FROM
  advanced.orders
GROUP BY
  1
ORDER BY
  1;

2-2)

SELECT
  user_id,
  SUM(IF(order_date = '2023-05-01', amount, 0)) AS `2023-05-01`,
  SUM(IF(order_date = '2023-05-02', amount, 0)) AS `2023-05-02`,
  SUM(IF(order_date = '2023-05-03', amount, 0)) AS `2023-05-03`,
  SUM(IF(order_date = '2023-05-04', amount, 0)) AS `2023-05-04`,
  SUM(IF(order_date = '2023-05-05', amount, 0)) AS `2023-05-05`
FROM
  advanced.orders
GROUP BY
  1
ORDER BY
  1;

2-3)

SELECT
  user_id,
  MAX(IF(order_date = '2023-05-01', 1, 0)) AS `2023-05-01`,
  MAX(IF(order_date = '2023-05-02', 1, 0)) AS `2023-05-02`,
  MAX(IF(order_date = '2023-05-03', 1, 0)) AS `2023-05-03`,
  MAX(IF(order_date = '2023-05-04', 1, 0)) AS `2023-05-04`,
  MAX(IF(order_date = '2023-05-05', 1, 0)) AS `2023-05-05`
FROM
  advanced.orders
GROUP BY
  1
ORDER BY
  1;

2-4)

SELECT
  event_date,
  event_timestamp,
  event_name,
  event_timestamp,
  user_pseudo_id,
  MAX(CASE WHEN event_param.key = 'firebase_screen' THEN event_param.value.string_value END) as firebase_screen,
  MAX(CASE WHEN event_param.key = 'food_id' THEN event_param.value.int_value END) as food_id,
  MAX(CASE WHEN event_param.key = 'session_id' THEN event_param.value.string_value END) as session_id,
FROM
  advanced.app_logs
CROSS JOIN UNNEST(event_params) as event_param
WHERE
  event_date = '2022-08-01'
GROUP BY ALL 

3) 퍼널 쿼리 연습 문제

WITH main as (
  SELECT
    event_date,
    concat(event_name,'-', event_param.value.string_value) AS event_name_with_screen,
    CASE
      WHEN event_name = 'screen_view' AND event_param.value.string_value = 'welcome' THEN 1
      WHEN event_name = 'screen_view' AND event_param.value.string_value = 'home' THEN 2
      WHEN event_name = 'screen_view' AND event_param.value.string_value = 'food_category' THEN 3
      WHEN event_name = 'screen_view' AND event_param.value.string_value = 'restaurant' THEN 4
      WHEN event_name = 'screen_view' AND event_param.value.string_value = 'cart' THEN 5
      WHEN event_name = 'click_payment' AND event_param.value.string_value = 'cart' THEN 6
    END AS step_num,
    count(distinct user_pseudo_id) AS cnt
  FROM
    advanced.app_logs
  CROSS JOIN UNNEST(event_params) as event_param
  WHERE
    event_date between '2022-08-01' AND '2022-08-18'
  AND event_param.key = 'firebase_screen'
  AND event_name IN ("screen_view",'click_payment')
  GROUP BY 1,2,3
  HAVING step_num IS NOT NULL
)
SELECT
  event_date,
  SUM(IF(step_num = 1, cnt, 0)) AS `screen_view-welcome`,
  SUM(IF(step_num = 2, cnt, 0)) AS `screen_view-home`,
  SUM(IF(step_num = 3, cnt, 0)) AS `screen_view-food_category`,
  SUM(IF(step_num = 4, cnt, 0)) AS `screen_view-restaurant`,
  SUM(IF(step_num = 5, cnt, 0)) AS `screen_view-cart`,
  SUM(IF(step_num = 6, cnt, 0)) AS `click_payment-cart`
FROM
  main
GROUP BY
  1
ORDER BY
  event_date

답변 1

0

안녕하세요, 인프런 AI 인턴입니다. 이재헌님.

BigQuery를 활용하여 SQL 쿼리를 작성하는 것은 데이터 분석 과정에서 매우 중요한 일입니다. ARRAY, STRUCT, PIVOT 및 퍼널 분석과 관련된 쿼리 작성은 특히 복잡할 수 있습니다. 따라서 다양한 방법으로 접근하고, 결과의 정확성을 늘 확인하는 것이 중요합니다.

  1. ARRAY와 STRUCT 활용: ARRAYSTRUCT는 데이터베이스 내의 복잡한 데이터 구조를 다루는 데 사용됩니다. UNNEST를 사용하여 배열 내의 데이터를 펼쳐서 볼 수 있는 것이 특징입니다.

  2. PIVOT 사용하기: PIVOT 연산은 데이터를 다양한 차원에서 이해하는 데 중요한 역할을 합니다. 특정 조건에 따라 열과 행을 전환하여 데이터의 패턴을 쉽게 식별할 수 있습니다.

  3. 퍼널 분석 쿼리 작성: 퍼널 분석은 사용자가 비즈니스 목표를 달성하기 위해 어떤 경로를 거치는지를 파악하는 과정입니다. 조건문과 집계를 통해 사용자 행동의 흐름을 추적할 수 있습니다.

이미지를 첨부하여 자세한 쿼리 결과나 예시를 제공할 수 있으면 이해하는 데 도움이 됩니다.
아래 질문들이 이 문제를 해결하는 데 도움을 줄 수 있을 것입니다.

이 자료들이 이재헌님의 이해도 향상에 도움을 드릴 수 있기를 바랍니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

이재헌님의 프로필 이미지
이재헌

작성한 질문수

질문하기