21.02.24 16:22 작성
·
179
0
안녕하세요, 좋은 강의 감사합니다 :)
혹시 섹션 2 -> Level of Detail -> (모듈 3) Data Investigation in Tableau 의 예시중에 가장 마지막 Google Play 데이터셋의 레코드 개수 10,841건을 '중복이 포함된 APP의 개수'로 해석하셨는데, '전체 크롤링 횟수'로 해석하는 것도 타당하다고 볼 수 있을까요?
감사합니다!
답변 2
2
2021. 02. 24. 17:56
두번째 말씀하신 것이 조금 더 정확한 것으로 보입니다. 우리가 이 데이터셋을 만든 사람이 아니기 때문에 조금 보수적으로(안전하게) 접근하는 것이 좋을 것 같습니다. "크롤링의 횟수"는 다소 해석이 포함된 개념이기 때문에 100% 정확하다고 볼 수는 없고, 문자 그대로 "중복이 존재하는 APP의 개수"로 보는게 맞지 않을까 싶습니다
APP 리뷰 개수가 변경될 때마다 수치를 업데이트한 것인지도 사실은 명확치 않습니다. 크롤러가 돌다가 숫자가 바뀌었을 때에만 기록을 남기도록 되어있는지 확실하지는 않기 때문입니다. 추정을 그렇게 할 수 있을 뿐 100% 클리어한 개념은 아니라는 점만 염두에 두시면 되지 않을까 싶습니다 ^^
0
2021. 02. 24. 17:11
아, 제가 좀 더 고민해보니 '전체 크롤링 횟수'는 정확히 알 수 없는 것 같습니다. 전체 크롤링 횟수는 알 수 없지만, APP의 리뷰 개수가 변경될때마다 데이터를 수집한 결과로 볼 수 있지 않을까 생각이 듭니다!