묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
# 어절 나눈 후 첫 번째 값
질문 : 첫 데이터의 첫단어, 두번째 데이터의 첫단어, 세번째 데이터의 두번째 단어 추출 # 블루베리 딸기 바나나 이렇게 추출하고 싶으면? 어떻게 해요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
ID를 Drop 하지 않았을 때
custom id를 drop 하지 않고 검증 데이터 분리해서 랜덤포레스트 하면could not convert string to float: 'CUST0734'이러한 에러메시지가 뜨더라구요. 무조건 drop을 진행해야 하는건지..어쩔때 drop하고 어쩔때 안하는건지 비교가 가능할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출2 작업형 1
안녕하십니까 기출2 작업형 1번 - 1번문제에서 문제 : (1)주어진 데이터셋(members.csv)의 'views' 컬럼 상위 10개 데이터를 상위 10번째 값으로 대체한 후 (2)'age'컬럼에서 80 이상인 데이터의 'views' 컬럼 평균값 구하기코드: import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p1/members.csv") df.head(5) df = df.sort_values('views',ascending=False) df.head(10) #min = df['views'][:10].min() min_value = df['views'].head(10).min() #print(min_value) = 9690 df.iloc[:10,-1] = min_value #print(df.head(11)) cond = df['age'] >= 80 =(K) print(df[cond]['views'].mean())문제에서 크게 (1), (2)를 구하라고 하는것 같은데 시험에서 답안을 제출할때 최종적으로 (K)부분에만print 붙여서 제출하는게 맞을까요? Q2. 실제 시험장에서 문제를 보았을때 import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p1/members.csv")이런 setting이 되어있나요, 아니면 문제의 데이터위치를 보고 직접 코드를 쳐야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
반복학습 방법
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요강의수업 반복 수강 후에, 모의고사나 실제 기출문제 보는게 나을까요? 아니면 모의고사, 기출문제 까지 일단 같이 반복 하는게 나을까요? 그리고 작업형 3은 버리고, 1,2 위주로 학습 해도 괜찮을까요? 비전공자에다가 노베이스라서 선택과 집중 해야할거 같아서요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
라벨인코딩, 원핫인코딩
라벨인코딩과 원핫인코딩의 차이점이 뭔가요? 어떤 상황에서 라벨인코딩을 쓸지 원핫인코딩을 쓸지 잘 모르겠습니다..!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
한가지 방법으로 풀기 질문
ID,Segmentation 열로 최종 제출해라고 했는데 한가지 방법으로 풀기 강의에는 Segmentation만 pop으로 처리하고 1열 index 2열 pred 를 대입해서 제출을 해서요, 이와 같이 제출해도 무관한건지 궁금합니다. 그리고, 푸는방식도 바뀌는게 있을까요? 아래와 같이 하니 오류가 나는데 한가지 방법으로 풀기 방식으로 풀이가 가능할까요?target1=train.pop('Segmentation')target2=train.pop('ID') submit=pd.DataFrame({'ID':target2,'Segmentation':pred})
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 연장
안녕하세요강의 수강하고 있는 수강생입니다.강의가 11월 21일 곧 마감이라 11월 30일까지 강의를 연장하고 싶어 문의드립니다.
-
미해결빅데이터분석기사 실기대비 (R 활용)
작업형 1유형 코드 과정 및 답안
작업형 1유형의 경우 코드(하드 코딩)에 관계 없이 제출하는 답만 맞으면 정답으로 인정되어 점수를 받을 수 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
ols
from statsmodels.formula.api import ols로 쓰나 from statsmodels.formula.api import smf로 쓰나 같은거죠? ㅠㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경에서 실행결과 복사
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 시험환경에서 적응하려고 연습중인데, run하고 실행결과 창에서 칼럼이름 같은것을 그대로 복사해서 코드에 쓰려니까 복사가 안되요, 원래 그런가요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험 때 loc iloc 사용
문제 2번에서 80% 데이터를 활용한다고 할 때 반드시 df = df.iloc[:line] 와 같이 iloc를 사용해야 하나요?loc를 사용하면 끝값이 포함되어 81%의 데이터가 활용되기 때문에 틀린 것이라 이해하면 될까요?
-
미해결빅데이터분석기사 실기대비 (R 활용)
작업형2유형 rmse값
작업형2유형 회귀모델 구축에 있어...평가지표가 rmse라면 만점을 받기위해서절대적인 rmse 값이 기준이 있을까요?rmse는 아무래도 데이터의 절대값의 영향을 받아서 f1스코어처럼 기준이 없을 거 같아 질문드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
분류 모델 학습 강의에 대하여 질문드립니다.
안녕하세요 강의에서, data info를 확인하고 여러 숫자형, 문자형이 존재하였는데 문자형은 무시하고 숫자형만을 , 또 어떤 숫자에 대한 스케일링 없이 학습을 하였는데 이것은 강의를 위해 축소한 것인가요 혹은, 이것만 해도 충분한것인가요? 또한 실전에서 스케일링, 문자형 숫자형 선택 파라미터 수정, 모델선택등 모두 고려하면 수많은 비교를 해야할것 같은데, 실전에서는 모든걸 비교할 시간이 주어지나요? 혹은 시험자가 임의로 판단하여 어떤 데이터는 별로 영향이나 필요없어 보일거 같다는 판단하에특정 컬럼을 배재하거나 스케일링은 생략하거나 하나요? 감사합니다. 모든
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
sumsum
sumsum을 하는 이유는 뭘까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5-3 랜덤포레스트 평가지표 출력 결과 이상
안녕하세요. 작업형 2 모의문제 3 코드 작성후 랜덤포레스트 평가지표 (accuracy, f1_score, roc_auc score) 출력결과가 모두 1.0 으로 나오는데, 혹시 이런 경우가 있나요? (수업에선 0.7~0.8대로 출력) 없다면 문제가 뭐인지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
범주형 변수일 때 formula 질문있습니다
회귀분석 강의에서 범주형 변수가 있을 때 1) 그냥 ols 돌려도 된다2) 원핫인코딩 한 담에 ols 돌려도 된다 라고 말씀 주시는 것 같습니다.근데 또, 다른 강의에선 formula 생성 시 범주형 변수 일 때 C로 감싸라고 하시기도 하셨어서 조금 헷갈리는 것 같습니다. 어떤 차이가 있는지요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
로지스틱회귀분석에서 패널티
로지스틱회귀분석에서 패널티를 줄때 입력 코드는 어떻게 쓰나요? 패널티부과안함일 경우는 그냥 아무것도 안하면 되죠~~~
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
rmse
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요sklearn.metrics 안에 root_mean_squared_error이 있던데 이거로 rmse 구하면 안되는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1 모의문제1 - 문제 1
70%의 데이터를 추출하는 과정에서 그냥 df[:int(len(df)*0.7)을 한 것과 df.loc[int(len(df), : ]과 결과값에 차이가 존재하는 걸 확인했습니다. 왜 차이가 발생하는지 알 수 있을까요? 이전 작업까지의 결과물은 수치가 정상적으로 나오는 것을 확인했습니다. df[:int(len(df)*0.7) 의 경우 df.loc[int(len(df), : ]
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제2 ID 삭제 여부 및 성능 기준
안녕하세요 선생님, 1) ID 삭제 여부ID는 삭제해도 되고, 삭제 안해도 무방하며 이 경우 가중치가 낮게 적용이 된다고 답변 주신 것을 보았습니다. 그런데 모의문제1번과 2번을 풀어보니 ID를 포함하여 학습시켰을 때 성능 점수가 높더라구요...^^;; 무슨 연관이 있을까요..? 시험에서도 ID 포함해도 문제가 되지는 않겠지요? 2) 회귀 성능 기준r2 점수가 0.18이 나왔는데 이런 결과가 나와도 시험에서 점수 받는데 문제가 없을까요? 실무에서는 낮은 점수라고 볼 수 있을 것 같은데 성능을 높이기 위해 별도로 조치하지 않고 제출해도 되는지 궁금합니다.