작성
·
19
0
안녕하세요.
원본 데이터와 Group By 된 데이터를 함께 사용하려고 하는데, 어떻게 하는 게 효율적일지 문의드립니다.
Super Store data를 예시로 질문 정리해보았습니다.
데이터 - 두 가지 데이터 모두 사용 필요합니다.
원본 데이터 : Super Store 원본
Group by Data
위 데이터는 연월이 매월 일정하지 않으나, 분석하는 데이터 형태는 위와 같이 정리했을 때 연월 정보가 거의 빠지지 않고 들어가 있습니다.
분석하고 싶은 내용은 Group By된 데이터에 대해 전년동월대비 값의 증감률을 계산하고, 계산된 값은 원본 데이터에서 매칭되는 컬럼과 연결 하고자 합니다.
이러한 경우 어떻게 하는 게 효율적일까요?
(계산식으로 한다면 어떻게 해야될지는 잘 모르겠지만) 태블로 Desktop 에서 Group By로 얻고 싶은 필드 계산식으로 생성
태블로 Prep에서 Group By 로 얻고 싶은 필드 생성한 후에, 태블로 Desktop에서 가져와서 원본 테이블과 관계 (or Join)
그리고 Group By 시 연월 정보가 행으로 Stack 되어 있는 상태인데 각 행별로 전년동월대비는 어떻게 계산할 수 있을까요? (모든 연월 정보가 있다면 12행 간격으로 상호 매칭되는 데이터가 있을 것입니다.)
답변 1
1
안녕하세요, VizLab 최정민입니다
일단 질문이 글로 쓰여 있어서 의도하신 바를 제가 정확하게 이해했는지 모르겠습니다. 제 이해는 다음과 같습니다
원본 데이터 group by
전년 동월 대비 값 생성
2번의 결과를 가지고 원본 데이터와 다시 연결 시도
이게 맞다면 태블로 프렙이든 태블로 데스크탑이든 어디서든 기술적으로 가능할 것으로 보입니다. 중요한 것은 최종적으로 어떤 것을 구성할지에 따라 데이터셋을 어떻게 준비하는게 가장 좋을지 생각해보는 것이겠죠
group by 데이터와 원본 데이터를 함께 사용하는 것이 좋다고 판단된 경우에는,
태블로 프렙에서 원본 데이터 group by + 전년 동월 대비 생성
태블로 데스크탑에 group by 데이터 불러옴
태블로 데스크탑에 원본 데이터 불러옴
둘을 relationship 방식으로 연결
저라면 일반적으로 이렇게 갈 것 같은데, 구체적인 상황에 따라 달라질 수 있겠죠
전년 동월 대비는 테이블 계산 lookup 함수를 사용해서 만들 수도 있고, date 관련 함수 써서 만들 수도 있습니다. 역시 어떤 상황에서 쓰는지에 따라 어떤 방법이 나을지 판단하게 됩니다
하고 계시는 맥락을 잘 몰라서 브로드한 관점에서 말씀드렸으니, 필요한 내용 중심으로 검토해보시면 되겠습니다!
반드시 두개의 데이터 연결 방법으로 가야하는지에 대해서도 조금 고민이 필요한데요, 하나의 원본만 가지고도 LOD Expression을 적절히 사용하면 원하시는 내용 구현할 수 있을 것 같습니다. 역시 앞서 말씀드린대로, 모든 것은 현재의 상황과 목표 화면을 고려하여 판단하는 것이라서, 무엇이 정답이다, 딱 찝어서 말씀드리기는 어렵습니다 ㅠㅠ
네. 맞게 이해하셨습니다.
group by 데이터와 원본 데이터를 함께 사용하는 것이 좋다고 판단된 경우에는,
태블로 프렙에서 원본 데이터 group by + 전년 동월 대비 생성
태블로 데스크탑에 group by 데이터 불러옴
태블로 데스크탑에 원본 데이터 불러옴
둘을 relationship 방식으로 연결
저도 이런 방식으로 생각했었다가 더 효율적인 방법이 있을까 해서 질문 드렸는데, 이렇게 해보겠습니다.
LOOKUP 함수는 몰랐던 함수인데, Tutorial 보니 하려고 했던 계산이 가능할 것 같네요.
답변 감사합니다.