묻고 답해요
143만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
레이블 인코딩관련
from sklearn.preprocessing import LabelEncoder le=LabelEncoder() for col in cols: train[col]=le.fit_transform(train[col]) test[col]=le.transform(test[col] 이렇게 레이블 인코딩을 했는데요.. object안에 갯수가 많을 경우 fit을 통해서 매팅사전을 만드는데요. 제가 궁금한것은 매핑이 어떻게 되었는지 확인하는 방법이 궁금합니다. 예) 사과, 배, 수박, 메론이 있으면 무엇이 1, 2,3,4로 매핑되었는지 확인하고 싶을때 그 방법이 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
ID값
id 말고도 다른 object값이 있는데 왜id만 nunique값을 구하고 전처리때 drop하는지 알 수 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
교재 오타 관련 문의
정오표(구글독스)에P344아메리카노 한 잔의 원두의 -> 팝콘 라지 사이즈의 로 나와있는데,H_1 : 120g이 아니다 -> 120g 보다 작다이부분 또한 수정이 필요해보입니다. 또한 3번째 문장"여기서 120은 팝콘의 알려진 무게 (중앙값) p-value가 0.05보다 크기 때문에 귀무가설을 채택한다."무슨 의미인지는 알겠지만 문장이 뭔가 어색한 것 같습니다. 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
로버스트와 라벨 인코딩 문의
from sklearn.preprocessing import RobustScaler cols = ['Age','AnnualIncome', 'FamilyMembers', 'ChronicDiseases',] scaler = RobustScaler() train[cols] = scaler.fit_transform(train[cols]) test[cols] = scaler.fit_transform(test[cols])from sklearn.preprocessing import LabelEncoder cols = ['Employment Type', 'GraduateOrNot','FrequentFlyer', 'EverTravelledAbroad' ] for col in cols: le = LabelEncoder() train[col] = le.fit_transform(train[col]) test[col] = le.fit_transform(test[col]) 위처럼 로버스트와 라벨인코딩 후, 랜덤포레스트 하였습니다. 최종값이 로버스트 스케일 + 라벨인코딩 = 0.77라벨인코딩 = 0.78이 나왔는데,둘다 한다고 성능이 더 좋아지는것은 아닌가요?이 상황일 때 시험칠때 둘 중 높은 라벨인코딩만 적용해서 제출하면 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
로버스트 스케일러 문의
from sklearn.preprocessing import RobustScaler cols = ['Age','AnnualIncome', 'FamilyMembers', 'ChronicDiseases',] for col in cols: scaler = RobustScaler() train[col] = scaler.fit_transform(train[col]) test[col] = scaler.fit_transform(test[col]) trainValueError: Expected a 2-dimensional container but got <class 'pandas.core.series.Series'> instead. Pass a DataFrame containing a single row (i.e. single sample) or a single column (i.e. single feature) instead.로버스트 스케일러를 라벨인코딩처럼 for 문으로 사용안되는 것인가요?에러가 발생하네요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
df['컬럼'].sum()과 sum(df['컬럼'])의 차이가 궁금합니다.
두개 번갈아가며 쓰시는거 같은데 둘 중 아무거나 써도 되는건가요? 값은 똑같이 나옵니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
# 어절 나눈 후 첫 번째 값
질문 : 첫 데이터의 첫단어, 두번째 데이터의 첫단어, 세번째 데이터의 두번째 단어 추출 # 블루베리 딸기 바나나 이렇게 추출하고 싶으면? 어떻게 해요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
ID를 Drop 하지 않았을 때
custom id를 drop 하지 않고 검증 데이터 분리해서 랜덤포레스트 하면could not convert string to float: 'CUST0734'이러한 에러메시지가 뜨더라구요. 무조건 drop을 진행해야 하는건지..어쩔때 drop하고 어쩔때 안하는건지 비교가 가능할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출2 작업형 1
안녕하십니까 기출2 작업형 1번 - 1번문제에서 문제 : (1)주어진 데이터셋(members.csv)의 'views' 컬럼 상위 10개 데이터를 상위 10번째 값으로 대체한 후 (2)'age'컬럼에서 80 이상인 데이터의 'views' 컬럼 평균값 구하기코드: import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p1/members.csv") df.head(5) df = df.sort_values('views',ascending=False) df.head(10) #min = df['views'][:10].min() min_value = df['views'].head(10).min() #print(min_value) = 9690 df.iloc[:10,-1] = min_value #print(df.head(11)) cond = df['age'] >= 80 =(K) print(df[cond]['views'].mean())문제에서 크게 (1), (2)를 구하라고 하는것 같은데 시험에서 답안을 제출할때 최종적으로 (K)부분에만print 붙여서 제출하는게 맞을까요? Q2. 실제 시험장에서 문제를 보았을때 import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p1/members.csv")이런 setting이 되어있나요, 아니면 문제의 데이터위치를 보고 직접 코드를 쳐야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
반복학습 방법
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요강의수업 반복 수강 후에, 모의고사나 실제 기출문제 보는게 나을까요? 아니면 모의고사, 기출문제 까지 일단 같이 반복 하는게 나을까요? 그리고 작업형 3은 버리고, 1,2 위주로 학습 해도 괜찮을까요? 비전공자에다가 노베이스라서 선택과 집중 해야할거 같아서요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
라벨인코딩, 원핫인코딩
라벨인코딩과 원핫인코딩의 차이점이 뭔가요? 어떤 상황에서 라벨인코딩을 쓸지 원핫인코딩을 쓸지 잘 모르겠습니다..!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
한가지 방법으로 풀기 질문
ID,Segmentation 열로 최종 제출해라고 했는데 한가지 방법으로 풀기 강의에는 Segmentation만 pop으로 처리하고 1열 index 2열 pred 를 대입해서 제출을 해서요, 이와 같이 제출해도 무관한건지 궁금합니다. 그리고, 푸는방식도 바뀌는게 있을까요? 아래와 같이 하니 오류가 나는데 한가지 방법으로 풀기 방식으로 풀이가 가능할까요?target1=train.pop('Segmentation')target2=train.pop('ID') submit=pd.DataFrame({'ID':target2,'Segmentation':pred})
-
미해결[EduAtoZ] Python 활용&COS Pro 2급
안녕하세요 혹시 수강연장 가능할까요?
내일 만료가 된다고 하여서 혹시나 하고 질문을 남겨봅니다 수강 연장이 가능하다고 한다면 1개월 정도 연장이 가능할까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 연장
안녕하세요강의 수강하고 있는 수강생입니다.강의가 11월 21일 곧 마감이라 11월 30일까지 강의를 연장하고 싶어 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
ols
from statsmodels.formula.api import ols로 쓰나 from statsmodels.formula.api import smf로 쓰나 같은거죠? ㅠㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경에서 실행결과 복사
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 시험환경에서 적응하려고 연습중인데, run하고 실행결과 창에서 칼럼이름 같은것을 그대로 복사해서 코드에 쓰려니까 복사가 안되요, 원래 그런가요??
-
미해결파이썬 무료 강의 (기본편) - 6시간 뒤면 나도 개발자
print 출력값 관련 궁금한점 있습니다.
출력식 1~9번째는 자리수가 한자리인데 이걸 두자리수로 만들 수 있나요? 01번째 손님...02번째 손님....50번째 손님... 마찬가지로 소요시간도 맞추려면 어떻게 해야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험 때 loc iloc 사용
문제 2번에서 80% 데이터를 활용한다고 할 때 반드시 df = df.iloc[:line] 와 같이 iloc를 사용해야 하나요?loc를 사용하면 끝값이 포함되어 81%의 데이터가 활용되기 때문에 틀린 것이라 이해하면 될까요?
-
미해결실전도커: 도커로 나만의 딥러닝 클라우드 컴퓨터 만들기
azure 처음 가입했을 때 주는 200달러가 없는 것 같아요..
azure에 새로 가입했고 그대로 따라가고 있었는데 저는 $200가 있다는 문구가 따로 안뜨는데 어디서 확인할 수 있나요?예산 탭에 들어가도 예산이 없다고 나오네요
-
해결됨2주만에 통과하는 알고리즘 코딩테스트 (2024년)
[Python] 백준 1090번 문제
n = int(input()) list = [list(map(int, input().split())) for _ in range(n)] fi_answer = [int(1e6)] * n #초기 배열 생성 x_list = [] y_list = [] for x, y in list: #후보군 리스트 생성 x_list.append(x) y_list.append(y) for x_pnt in x_list: for y_pnt in y_list: answer = [] for x, y in list: #입력 x, y #어느 한 점에서 입력위치로부터의 거리 최솟값 계산 answer.append(abs(x_pnt-x) + abs(y_pnt-y)) # ex) [1,4,6,7], [0,2,3,4] answer.sort() distance_cost = 0 #k번째 마다 이동 비용의 최소값 계산 for i in range(n): distance_cost += answer[i] #1~k if fi_answer[i] > distance_cost: fi_answer[i] = distance_cost print(*fi_answer)안녕하세요! 백준 1090번 문제에 대한 질문입니다. 다음과 같이 짠 코드에서 IDE에서는 결과가 잘 나오지만, 백준 제출했을 경우 틀렸습니다만 나옵니다. 아무리 수정하고 찾아봐도 이유를 잘 모르겠어서 문의드립니다.