묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
테스트 데이터 전처리 시 범주형, 수치형에 따른 차이가 있나요?
위와 같이 작성해주신 코드를 보는 중 의문이 생겨 질문 남깁니다!train 데이터를 전처리할 때에는 train데이터의 최빈값, 중앙값, 평균으로 결측치를 대체하는데 반해,test 데이터 전처리 시 범주형 데이터는 test 데이터의 최빈값으로 대체/ 수치형 데이터는 train 데이터의 평균, 중앙값으로 대체하고 있습니다. 왜 test 데이터 처리 시 train/test 데이터 모두 다 사용하나요? 일관성 있게 하나만 사용해서는 안되는지 궁금합니다.
-
미해결
플라스크 실행 안됨 도와주세요...!
제 컴퓨터에서 프로젝트 관련 플라스크 코드와 그 외 템플릿 등등을 작성했고그 모든 폴더가 있는 전체 폴더를 압축해서팀원에게 넘겼습니다.이후 팀원이 압축을 풀고 똑같이 터미널에서 해당 폴더가 있는 경로로 이동 후,python app.py 명령어와flask run 명령어모두 실행해보았지만 Python 이라는 메시지만 나올 뿐, 실행도 오류 메시지도 출력되지 않고 있는 상황입니다. 설정도 다 맞게 해놨고 제 컴퓨터에서는 잘만 돌아가는데 뭐가 문제일까요...?당연히 팀원도 플라스크 install 했습니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1 모의문제 3 문제 8
df.groupby(['city','f2']).sum().reset_index() 이 코드문을 작성했을떼 id, f3과 같은 문자열 데이터도 같이 들어가서 선생님께서 하신 코드와 다르게 나옵니다. 그래서 따로 숫자형 데이터만 묶어서 그룹을 만든 다음 해결을 하긴 했는데, 선생님과 똑같이 했을땐 왜 같게 안나오는건지, 버젼이 바뀐건지 궁금해 여쭤봅니다
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
ANOVA 질문드립니다
안녕하세요,독립표본검정 시 정규성을 만족하나 등분산성을 만족하지 않는 경우 equal_var = False라는 파라미터를 추가한다고 가르쳐주셨는데요,분산분석에서도 정규성은 만족하였으나 등분산성을 만족하지 않는 경우 추가해야 하는 조건이 있는지 문의드립니다.학습에서 정규성을 만족하지 않을 경우 kruskal-wallis 비모수검정을 활용한다고 말씀해주셨는데, 등분산성을 만족하지 않는 경우는 설명이 되지 않은 듯 해서요.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
MinMaxScaler 에러
안녕하세요. MinMaxScaler하는데 qsec을 인지하지 못했다는 에러가 뜨네요. 어떤 부분이 잘 못 되었는지 알 수 있을 까요?자료는 df=pd.read_csv("mtcars.csv")코드를 통해 내려받아서 head확인하였습니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
RandomForestRegressor 실행할때 마다 성능평가값이 달라집니다.
RandomForestRegressor 실행할때 마다 성능평가값이 달라집니다.반복해서 실행하니, 처음보다 유의미하게 수치가 낮아졋습니다.강의에서는 스케일링 한거 보다 베이스라인이 성능평가가 더 낫다고 하는데, minmaxsclaler 를bmi 만 한 성능평가 수치가 가장 좋습니다.질문1) 랜덤포레스트는 원래 돌릴때마다 성능이 좋아지나요? 질문2) 시험환경에서는 랜덤포레스트를 반복해서 실행하면 안되나요? (성능평가 결과가 좋아져서 신뢰성 하락이 되나요?
-
미해결(2025) 일주일만에 합격하는 정보처리기사 실기
printf문에 설명안된부분 문의
17:40초에 문의드립니다.설명하시다가 %.5 까지는 자리수라고 이해 했는데그 뒤에 붙은lf는 어떤의미인지 모르겠습니다.보다보니 float에서도 %.2뒤에 f가 붙어있네요.같이 설명 부탁드립니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
세션 6-1) 모델 & 평가 문의
안녕하세요? 선생님.모델 평가 시에, 랜덤포레스트/레이블인코딩/원핫인코딩을 모두 돌려보시더라고요..실제 시험에서도 이렇게 진행을 해서 최적의 값을 찾는지, 아니면 유사하다면 하나로 암기해서 시험을 치뤄도 되는지 문의드리고 싶습니다. 정확도가 얼마 이상 나오는 모델이라는 기준이 따로 없어 궁금합니다 😄
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
컬럼리스트 반복실행시 오류
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
print 시 float, int
문제 1번의 답은 float형이고 2,3번이 답은 int형인 것을 보고 궁금한 점이 생겼습니다. 1번 답 역시 3261.0 으로 Int로 나타낼 수도 있는 값인데, 실제 시험 볼 때에 출력되는 데이터타입도 고려해야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀계수 중 가장 큰 값 구할 때 상수항도 포함해야 하나요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요케글 https://www.kaggle.com/code/agileteam/t3-regression-py 이 주소의 문제 1번에서 회귀계수 중 가장 큰 값을 구하라고 하였는데, 상수항도 포함인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험장 환경 질문입니다.
안녕하세요 강의 노트북을 통해 colab에서 빈칸을 채우다 보면 자동완성 기능으로 힌트를 제공받는데요, 시험장 환경에서도 동일하게 자동완성으로 힌트가 제공되는것인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
sum 사용시 numeric_only=True
안녕하세요 선생님,새소식에 이제 sum 사용시 numeric_only=True 작성이 필요하다고 했는데sum을 사용하는 모든 항목에서 아래와 같이 사용하면 되는건가요?sum(numeric_only=True) 간단하게 합계를 구할때도 .sum(numeric_only=True)로 작성을 해야하나요?
-
해결됨직장인에게 꼭 필요한 파이썬-아래아한글 자동화 레시피
초심자의 향후 학습방향에 대해 조언을 듣고 싶습니다~!
2-5. 문서의 필드목록 및 필드 값 취득하기강의 중 아래의 내용과 관련입니다. 이후 과정들은 배우고 익히는 데 시간이 많이 걸리지만,그리 효용성이 높지 않은,비교적 특이한 케이스에 사용되는 코드들이기 때문입니다.그래서, 여기까지 읽기를 마치고여러분의 업무를 하나씩 자동화해보시다가한/글 누름틀과 셀필드로는 해결되지 않는 문제를 만나셨을 때 다시 찾아오셔서 이후 과정을 이어 읽어주시기를 권장드립니다. 라고 말씀하셨는데요.즉, 정주행 독파 보다는 발췌독을 통한 학습을 권장하시는데..제가 궁금한 점은 이렇게 발췌독이 가능한가가 궁금합니다.무슨 말이냐면,2-5 강의까지 오는데만도 저로서는 상당히 어려웠습니다.이해 안되는 것들을 여러 번 다시 보면서 고민해 보니 지금은 그래도 1-1 ~ 2-5 강의 까지의 내용은 어느정도 이해할 수 있게는 된 거 같습니다.막혔던 부분이 그 이후의 강의 내용을 통해 해소되는 것도 여러 번 있었던 거 같습니다. (순차적으로 들어도 이해될 수 있는 순서로 강의 내용이 배치된다면 더욱 좋을 거 같다는 의견을 조심스레 드려 봅니다.)아무튼 어떤 것을 이해해야 그 보다 더 복잡한 것을 이해할 수 있고 이런 식의 느낌을 받는데요.더 어려운 기법까지 배워보고는 싶은데..제 수준에서는 발췌독으로 필요한 부분만 찾아서 듣는 것 만으로 이해가 가능할지 모르겠어서요.여기서 강의해 주신 더 어려운 기법을 배우고자 하는 코딩 초심자에게도 정주행 보다도 발췌독을 권장하실까요?두서 없는 질문이지만, 배움의 욕심은 많고 실력은 부족한 초심자에게 일코님은 어떤 조언을 주실지 들어보고 싶습니다.거북이 같이 왔지만 2-5까지 오고 또 그 과정의 코드들이 실행되는 경험을 한 게 정말 즐거웠고 감사드립니다.오래 걸리겠지만 실력을 더 높이고 싶습니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
가설검정 유의수준
안녕하세요, 혹시 가설검정 (ttest, correlation, anova) 에서 유의수준 0.05가 아닌 0.01, 0.10 등으로 수정하고 싶을 경우 어떤 파라미터를 추가하면 될지 문의드립니다.
-
해결됨실전! FastAPI 활용(비동기)
메시지 브로커
안녕하세요,Redis Pub/Sub 수강 중위와 같이 메시지 브로커에 문제가 있는 것 같은데, 백엔드 지식이 부족해서 정확히 어떤 부분에서부터 원인을 찾아야할지 모르겠습니다.서버/컨테이너 재시작 해봤는데 동일한 걸로 봐서 다른 문제인 것 같아서 도움 요청드립니다.https://github.com/wozlsla/fastapi-async/blob/prac/src/shared/message_broker.py
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6-1 sort_values를 통해 눈으로 확인한 후 print문으로 정답을 도출해도 될까요?
# sort_values를 통해 눈으로 확인한 후 print문으로 정답을 도출해도 될까요? a=pd.to_datetime(df['출동시간']) b=pd.to_datetime(df['도착시간']) df['seconds']=(b-a).dt.seconds df.groupby('소방서')['seconds'].mean().sort_values(ascending=False) print(round(4839.533333/60))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 연장 문의
안녕하세요~수강이 11월 25일 만료인데 11월 30일까지 연장 가능할지 문의드립니다.seraut@naver.com
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
한가지 방법으로 풀기 오류
ValueError: The feature names should match those that were passed during fit. Feature names unseen at fit time:Feature names seen at fit time, yet now missing: 원핫인코딩 후 타겟 설정후 한가지 방식으로 풀기와 동일하게 진행했는데pred=model.predict(test) 위와 같은 문제가 발생되는데 이유가 무엇일가요? 실제시험때는 문제없었거든요 원인 및 답변 방안 문의드립니다 train=pd.get_dummies(train)test=pd.get_dummies(test)from sklearn.model_selection import train_test_splittarget=train.pop('TotalCharges')X_tr, X_val, y_tr, y_val = train_test_split(train,target,test_size=0.2,random_state=0)print(X_tr.shape, X_val.shape, y_tr.shape, y_val.shape)from sklearn.ensemble import RandomForestRegressormodel=RandomForestRegressor(random_state=0)model.fit(X_tr,y_tr)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 모의고사 3에서 평가 값이 강의내용이랑 달라요
강의 내용 그대로 코딩했는데 평가 값이 다를 수 있나요?강의에서는 xgb에서 max_depth 값을 키울수록 평가값이 커졌는데 제가 했을 땐 값을 키울수록 평가결과가 작아져서요