묻고 답해요
143만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결RAG 마스터: 기초부터 고급기법까지 (feat. LangChain)
langchain 적용 서비스 배포/운영
안녕하세요 양질의 강의 감사히 잘 듣고 있습니다.다름이 아니라 이렇게 langchain으로 RAG 를 접목시킨 서비스를 배포/운영 하는데에는 어떤 걸 더 배워야하는지 궁금합니다. 지금 생각으로는 1) langchain 소스코드로 gradio나 streamlit 챗봇을 만들고2) 도커 이미지 같은걸 만들어서3) AWS 서버에 배포 (혹은 서버리스) 혹시 제가 생각하는 과정이 맞는지, 아니면 현업에서는 다른 방법을 사용하는지 궁금합니다.이번 강의를 듣고 만든 서비스 배포를 위해서는 어떤 기술을 더 익혀야하는지 알려주시면 감사하겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경 코드 실행 방법
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요시험환경에서 실행 버튼을 눌러야 코딩이 실행되나요? Colab, 쥬피터 노트북에서 shift+ enter로 코드를 실행했었는데 시험환경에서는 실행이 되지 않네요. 시험 환경에서 코드 실행 방법이 불편해서 혹시 다른 방식이 있나 여쭤봅니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
fit_transform 관련 질문
from sklearn.preprocessing import MinMaxScaler mms = MinMaxScaler() df['co'] = mms.fit_transform(df[['co']])MinMaxScaler에서 fit_transform에 [] 를 두번 쓰는 이유가 무엇인가요?강의에서는 문법이라 외워야되는 것처럼 이야기하셨는데 그냥 문법 만든 사람이 저렇게 쓰도록 해서 그런 건가요?시험에 쓰는 함수 중에 저런 특이한 것들이 더 있나요? [], (), [[]] 쓰는 게 헷갈리는데 쉽게 외울 수 있는 기준이나 공식이 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
최종모델 확률값 소수점 범위 다른 경우
최종 모델의 확률 값의 소수점 자리수가 다른경우는 어떻게 해야할까요..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
최종 모델 선택 후, 같은 조건으로 validation까지 학습해도 되나요?
안녕하세요, 강의 듣던 중 궁금한 점이 생겨 질문드립니다 !강의에서 모델링 및 평가를 할 때 보면 순서가피처 엔지니어링여러 회귀/분류 모델 학습 성능 평가위의 세 단계를 반복하며 제일 성능이 좋은 조건과 모델을 선택하는 것으로 이해했습니다. 위의 과정을 통해 성능 좋은 모델과, 피처 엔지니어링 방법을 알았다면, 검증 데이터로 나눈 것을 다시 학습 데이터로 합쳐서 해당 모델과 조건으로 다시 학습 시켜서 제출하는 방법이 가능한가요?더 많은 데이터셋으로 학습하는 것이 좋지 않을까 하여 질문 드렸습니다 !
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1, 3 제출방식
선생님 실제 시험환경에서 제출방식에 대한 질문이 있습니다.7회차부터 답안 제출 방식이 바뀌었다고 들었습니다. 작업형1, 3유형에서 (풀이용) 코드는 따로 제출하지 않고 풀이만 해서 저장하고(답안제출)에서 답만 제출하면 되는건가요?? 그렇다면 실제로 (풀이용) 탭에서 작성한 코드에 대해서는 따로 채점을 하지 않는다는 걸까요? 실제 체험환경과 강의에 올려주신 9회 응시가이드 화면이 달라서 문의드립니다. <응시가이드> <체험환경>
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인코딩 및 ensemble 관련 문의사항입니다.
LabelEncoder를 해도 되고 원핫 인코딩을 해도 아무 상관이 없나요예를 들면 기출 6 작업형 2에 LabelEncoder를 쓰니 성능이 잘 나오는데 성능이 잘 나오는 것으로 쓰면 되는 지요그리고 작업형 어떤 ensemble을 쓰던 적당한 값이 나오면 40점을 받을 수 있는 것인가요?metrics으로 자체 확인을 하지 않고 내더라도 낸 결과가 적당한 결과이면 점수를 받는 것인가요?순전히 시험 점수 측면 획득 측면에서 여쭤 봅니다. 시험이 아니라면 이것 저것 해보겠지만 시험에서는 실수하는 것보다 단순하게 하는 것이 좋을 것 같습니다. 보통 RandomForest로 해도 적당한 결과가 나오는데 과거 기출 기준에서는 validation 예측/비교 없이(생략하고) 1~2개의 기법으로 test값만 예측해도 되는 것인지요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4회 기출유형 작업형 1
2번 문제를 len이 아니라 result_count = sum(cond1 & cond2 & cond3) print(result_count) 이런 방법으로 풀어도 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출2회 문제3
mean = df['age'].mean() std = df['age'].std()*1.5 lower = mean-std upper = mean+std cond1 = df['age']<lower cond2 = df['age']>upper print(df[cond1|cond2]['age'].sum())이렇게 구했는데, 값이 368.5로 나옵니다. 왜일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 로지스틱 회귀 문제 질문입니다.
t3-logit-py # 문제 1-2: 독립변수 income만 사용해 학습한 모델에서 test 데이터의 purchase를 예측하고, 정확도 계산 predictions_income = result_income.predict(test) predicted_classes_income = (predictions_income > 0.5).astype(int) 이 문제에서 왜 prediction_income > 0.5를 하는건가요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
샤피로-윌크 검정과 관련된 질문
앞의 강의 단일 표본 검정에서의 샤피로 윌크 검정처럼 대립가설을 '정규성을 따른다' 라고 세우려면 어떻게 코드를 짜야할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인코딩 시 unique값 순서
안녕하세요! 회귀 코드를 보던 중 궁금한 점이 생겨 질문 남깁니다. 강의에서는 원핫인코딩 전에 describe(include= 'object')를 통해 train, test의 범주형 데이터 unique 수가 일치하는 것만 확인하고, train/test 병합 작업 없이 원핫 인코딩을 수행했습니다. 제가 실습하는 중에, train/test의 각 unique값을 출력했는데 캡쳐본과 같이 smoker 에서 yes,no의 순서가 바뀌어서 나왔습니다. 이 경우에는 unique값의 종류는 같지만, 병합 없이 각자 인코딩을 할 경우 train 데이터 -> yes:0, no:1test 데이터 -> no:1, yes:1와 같이 인코딩되지 않을까 생각이 들었습니다. unique 종류만 일치하면, 순서가 다르더라도 따로 병합하여 인코딩 하지 않아도 되는 것일까요?
-
미해결[2024 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
강의 꿀팁 내용 중 echoMode 속성을 Password로 어떻게 바꾸나요?
제목 그대로의 질문입니다!
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
Encoders require their input argument must be uniformly strings or numbers. Got ['int', 'str'] 라는 오류가 떴습니다.
보니깐 int와 str이 혼합되어서 뜬것 같은데..cols = X_train.select_dtypes(include = 'object').columns print(list) from sklearn.preprocessing import LabelEncoder cols = X_train.select_dtypes(include = 'object').columns le = LabelEncoder() for col in cols : le = LabelEncoder() X_train[col] = le.fit_transform(X_train[col]) X_test[col] = le.transform(X_test[col]) 그래서 이렇게 cols라는 코드를 사전에 지정해줬는데... 왜 뜰까요?처음부터 숫자와 str 데이터를 분리해서 인코딩 했어야 할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2에서 예시가 1, 0으로 되어있어도 상관없이 소수점으로 제출해도 되나요?
작업형 2에서 예시가 1, 0으로 되어있어도 상관없이 소수점으로 제출해도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글에서는 아직 rmse를 쓸 수 없는건가요?
mae 평가 방법은 정상 작동하는 걸 확인했는데,rmse를 제가 잘못 작성한건가요?아니면 캐글에서는 아직 안되는 걸까요?만약 작성이 옳은거면 저대로 시험에서도 사용할 예정이고그렇지 않다면, 함수식을 그냥 외워가야 하나 싶어서요.
-
해결됨38군데 합격 비법, 2024 코딩테스트 필수 알고리즘
동일 값 로직 처리
1. 현재 학습 진도1-5 알고리즘과 친해지기(2) 2. 어려움을 겪는 부분# def find_max_occurred_alphabet(string): # alphabet = [0] * 26 # for i in string: # if i.isalpha(): # alphabet[ord(i) - ord('a')] += 1 # # max = alphabet[0] # index = 0 # for i in range(len(alphabet)): # if alphabet[i] > max: # max = alphabet[i] # index = i # # return chr(index+ord('a')) from collections import Counter def find_max_occurred_alphabet(string): string = [char for char in string if char.isalpha()] counter = Counter(string) print(counter) return max(counter, key=counter.get) result = find_max_occurred_alphabet print("정답 = i 현재 풀이 값 =", result("hello my name is dingcodingco")) print("정답 = e 현재 풀이 값 =", result("we love algorithm")) print("정답 = b 현재 풀이 값 =", result("best of best youtube")) 3. 시도해보신 내용 안녕하세요. 첨부한 코드 중 주석 처리한 부분은 문제를 보고 사전에 제가 작성한 코드입니다. 결과는 예상과 동일하게 출력됩니다.그 밑에는 다른 풀이 방법을 찾다가 Counter 클래스를 사용하여 작성한 코드입니다. 본 강의에서는 카운터가 동일한 경우, 기존의 값을 변경하지 않는 방식이라 i가 출력되지만, 해당 방법을 사용하면 입력 순으로 o가 출력됩니다.이 경우 최빈값을 찾아내는 코드는 맞지만, 값이 동일한 경우에 처리하는 로직이 다르기 때문에 발생한다고 이해하면 될까요?답변해주신다면 감사하겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2회 기출유형 작업형 2
17:13 부분 궁금해서 물어봅니다. 이미 pd.concat으로 데이터를 합쳤는데... 학습과 검증데이터를 나눌때 X_train, y_train 나눠서 작업해야 하나요? X_train['Reached.on.Time_Y.N']으로 하면 안되나요??
-
해결됨직장인에게 꼭 필요한 파이썬-아래아한글 자동화 레시피
pyinstaller 빌드 시 바이러스 탐지 문제
안녕하세요 일코님,, 업무들을 순차적으로 자동화 하는데 많은 도움을 받았습니다.이제 또 새로운 문제에 직면을 했는데요, pyinstaller로 배포파일 빌드 시 자꾸 알약에 탐지가 됩니다.직원들에게 배포하고 사용하면서 알약에 바이러스 파일로 탐지가 된 것인지 모르겠지만 어느 순간부터 탐지되어 삭제가 되네요.이것저것 조치하다가 pyinstaller -F -w 에서 -w를 제외하고 배포하니 또 탐지가 안 되었다가, 하루 지나니 제외한 파일도 탐지가 됩니다.혹시 이 경우도 있었는지요? 프로그램의 과정이 아니라 배포의 과정에서 이러니 너무 답답합니다..
-
미해결파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기
데이터프레임 칼럼명 문의 드립니다.
데이터 프레임 칼럼을 뽑았더니 이렇게 나와요 !! 칼럼에 대한 한글 정보도 알고 싶은데 ㅜㅜ 깃에서 보이는 칼럼명이랑 좀 많이 달라서요!!! 초보다보니 변경된 부분이 좀 있어서 헷갈리는게 많은 것 같아요 ㅜㅜ