인프런 커뮤니티 질문&답변

박나현님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2회 기출유형(작업형1)

기출 2회 작업형1

해결된 질문

24.06.08 21:11 작성

·

103

0

선생님! 2번 문제에서 결측치를 중앙값으로 바꾸기 전의 표편과 바꾼 후의 표편 차를 구하라는 문제에서

만약 결측치를 바꾸기 전 표편을 구하지 못한채로 결측치 처리를 해버렸다면 시험상황에서는 다시 원 데이터로 어떻게 돌아갈 수 있나요,,?

(시험환경에서는 코랩처럼 '이전셀 실행' 기능을 쓸 수가 없는데)drop같은 함수를 써서 원래 데이터를 일부 삭제 시켰다가 실수가 생겨 다시 복구해야하는 상황에서도 어떻게 해야하는지 궁금합니다.

답변 2

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 08. 22:48

시험환경과 유사하게 한다면 코랩에서는 1개의 셀을 사용하면 됩니다.

1개의 셀만 사용하면 데이터 불러오기부터 시작하기 때문에 돌아간다는 개념이 없습니다.

 

그리고 혹시나 데이터 불러오기 코드까지 삭제해서 복구가 안된다면

시험환경에서는

image

초기화 버튼이 있어요!! 단, 코딩내용이 사라지니 주의해주세요!!
(시험환경 내 메모장에 잘 옮겨놔주세요)

0

인프런 AI 인턴님의 프로필 이미지

2024. 06. 08. 21:16

안녕하세요, 인프런 AI 인턴입니다.

박나현님의 질문에 대해, 특정한 문제 상황에서 데이터 복구 방법을 찾는 데 도움이 될 수 있는 내용이 있어 안내드립니다.

데이터 처리 과정에서 실수로 데이터를 변경한 경우, 특히 시험 환경에서 ‘이전 셀 실행’과 같이 즉각적으로 이전 상태로 돌아갈 수 없을 때 복구 방법이 필요하게 되는데요, 이와 관련된 질문과 유사한 상황을 처리하는 방법에 대한 답변이 이전에 제공되었습니다.

  • “질문이 있습니다~~”에서 질문자는 결측치를 중앙값으로 채우기 전후의 표준편차를 구하는 과제를 진행하는 중, 코드 실행 순서 때문에 원하는 대로 데이터를 처리하지 못하는 상황에 봉착했습니다. 지식공유자는 여기서 문제를 식별하고, 해당 과정에서 각각의 결과값을 별도의 변수에 저장할 필요성을 언급하며 해결 방안을 제시하고 있습니다.

시험 환경 또는 코딩 테스트 중 오류를 수정할 필요가 있을 때, 대부분의 경우 원본 데이터를 다시 로드하는 것이 가장 확실한 해결책입니다. 데이터를 처음부터 다시 불러오면 모든 변경 사항이 초기화되므로, 실수로 수정된 데이터를 복구할 수 있습니다. 구체적으로, 원본 데이터셋을 다시 로드하는 명령어를 시험 시작 시 저장해 두었다가 필요할 때 사용하면 됩니다.

결측치 처리 이후의 데이터 분석 과정에서 실수를 방지하기 위해, 결측치를 처리하기 전과 후의 상태를 별도의 변수에 저장하거나, 결측치 처리 단계를 별도의 셀/부분에서 수행하여 그 결과를 잘 문서화해두는 것도 좋은 방법입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.