인프런 커뮤니티 질문&답변

hz님의 프로필 이미지
hz

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

5회 기출유형 (작업형2)

작업형2에서 random_state=2022

해결된 질문

작성

·

149

0

5회 작업형2유형 기출 강의에서 수치형 활용 부분에서

random_state=2022 는 무슨 의미인가요?

공부하면서 random_state=0 도 본것 같은데 두개 차이가 무엇인가요? 왜 하는건가요? 2022가 그냥 임의의 숫자인것 같은데 그냥 아무 숫자를 하는건가요? 안해주면 안되는거죠?

답변 2

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

아무런 숫자 정수를 작성하면 됩니다.

동일한 결과를 얻기 위해 사용하고 있어요!

사용하지 않아도 문제는 없어요! 다만 실행때마다 다른결과가 나올 수 있어요!

예를들어 train_test_split에 사용하면 항상 동일하게 나누지만

사용하지 않으면 매번 다르게 데이터를 나누어 무엇때문에 성능이 달라졌는지 알 수 없어요.

 

0

안녕하세요, 인프런 AI 인턴입니다.

hz님의 질문에 대하여, random_state와 관련된 몇 가지 정보를 바탕으로 설명 드립니다. random_state는 일반적으로 모델링 시 데이터를 무작위로 섞거나, 데이터셋을 분할할 때 일관된 결과를 얻기 위해 사용하는 파라미터입니다. 예를 들어, 데이터를 학습 세트와 테스트 세트로 분리할 때 random_state를 설정하면, 코드를 여러 번 실행해도 동일한 방식으로 데이터가 분할됩니다. 즉, 실험의 재현성을 위해 사용되는 값입니다.

random_state=2022random_state=0같이 지정되는 숫자 자체는 특별한 의미를 가지지 않으며, 어떤 숫자를 사용하더라도 해당 숫자로 고정하면 결과의 재현성을 보장할 수 있습니다. 여기서 중요한 점은 해당 값이 고정되어 있어야 같은 데이터셋에 대해 동일한 무작위 선택을 보장받을 수 있다는 것입니다.

이와 관련하여, 작업형2 기출 등과 해서 계속 반복해서 연습하던 중에요에서 random_state의 용도에 대해 설명하고 있습니다. 지식공유자는 random_state가 랜덤적인 요소를 고정하기 위한 시드값으로, 주고 싶은 숫자를 아무거나 주면 되며, 같은 값으로 고정하면 다음에 같은 값으로 했을 때와 같은 결과가 나오되, 다른 값을 넣으면 결과가 달라지기 때문에 비교하기 위해선 고정이 필요하다고 설명합니다.

즉, random_state 값을 사용하는 이유는 데이터 분할이나 랜덤 요소를 포함하는 모델링 과정에서 결과의 일관성을 유지하기 위함입니다. 이에 대한 추가적인 질문이나 다른 궁금한 점이 있으시다면, 언제든지 질문해 주세요.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

hz님의 프로필 이미지
hz

작성한 질문수

질문하기