묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[MOCK EXAM] T2. EXAM template 코랩, 캐글에서 코드가 안돌아갑니다
https://www.kaggle.com/code/agileteam/mock-exam-t2-exam-template이 문제를 풀고 있는데, 코랩과 캐글 모두 코드가 안돌아갑니다(RAM을 모두 사용했다고 실행이 멈춥니다) 코드가 잘못된 부분이 있어서 그럴까요?? # your code # 라이브러리 불러오기 import pandas as pd X_test = pd.read_csv("../input/hr-data/X_test.csv") X_train = pd.read_csv("../input/hr-data/X_train.csv") y_train = pd.read_csv("../input/hr-data/y_train.csv") # EDA # X_train.info() # y_train.info() # X_test.info() # X_train.shape, y_train.shape # 전처리(타겟, 결측치, 인코딩, 스케일링) # X_train.isnull().sum() # 결측치가 모두 범주형 컬럼이므로 특정값 "x"로 채워주기 # gender 4508 object # enrolled_university 386 object # education_level 460 object # major_discipline 2813 object # experience 65 object # company_size 5938 object # company_type 6140 object # last_new_job 423 object # X_test.isnull().sum() # 결측치가 모두 범주형 컬럼이므로 특정값 "x"로 채워주기 # gender 510 object # enrolled_university 31 object # education_level 52 object # major_discipline 310 object # experience 5 object # company_size 621 object # company_type 634 object # last_new_job 40 object # y_train.isnull().sum() X_train = X_train.fillna("x") X_test = X_test.fillna("x") # X_train.shape # (8955, 13) # 학습, 예측에 사용되는 데이터만 인코딩(정답지인 y_test는 인코딩x) X_train = pd.get_dummies(X_train) X_test = pd.get_dummies(X_test) # # X_train.shape, y_train.shape # ((19158, 187), (19158, 1)) # 모델링(학습, 예측, 평가) # 평가지표를 사용할거면 train_test_split 해야 함 from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import roc_auc_score rf = RandomForestClassifier(random_state = 42) rf.fit(X_train, y_train) pred = rf.predict_proba(X_test)[:, 1] # predict_proba : 분류 문제에서 확률을 예측할 때 # roc_auc_score, accuracy, f1 : 분류에서만 사용 # error가 들어가는 지표 : 회귀에서 사용 # 제출 result = pd.DataFrame({ "pred" : pred }) result.to_csv("result.csv", index = False)
-
해결됨실전! FastAPI 입문
session.scalars(select(ToDo))에러
orm.py를 다음과 같이 작성했고 from sqlalchemy import Boolean, Column, Integer, String from sqlalchemy.orm import declarative_base Base = declarative_base() # base란 클래스로 db모델링 class ToDo(Base): __tablename__ = 'todo' # table이름 id = Column(Integer, primary_key=True, index=True) content = Column(String(256), nullable=False) is_done = Column(Boolean, nullable=False) # todo 객체의 출력을 쉽게 보기위해 repr def __repr__(self): return f'<ToDo(id={self.id}, content={self.content})>, is_done={self.is_done}'connection.py도 다음과 같이 작성했으나from sqlalchemy import create_engine from sqlalchemy.orm import sessionmaker DATABASE_URL = "mysql+pymysql://root:todos@127.0.0.1:3306/todos" engine = create_engine(DATABASE_URL, echo=True) # echo는 쿼리의 처리를 확인 SessionFactory = sessionmaker(autocommit=False, autoflush=False, bind=engine)강의안에서 말씀하신대로 import까지 완료하고명령어 session.scalars(select(ToDo)) 를 실행하는 과정에서 자꾸 이렇게 뜹니다 에러가 한두개가 아니라서 감도 안잡힙니다.. 도와주세요2024-06-06 20:53:23,126 INFO sqlalchemy.engine.Engine SELECT todo.id, todo.content, todo.is_done FROM todo2024-06-06 20:53:23,126 INFO sqlalchemy.engine.Engine [cached since 368.2s ago] {}Traceback (most recent call last): File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\sqlalchemy\engine\base.py", line 1967, in _exec_single_context self.dialect.do_execute( File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\sqlalchemy\engine\default.py", line 924, in do_execute cursor.execute(statement, parameters) File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\pymysql\cursors.py", line 153, in execute result = self._query(query) ^^^^^^^^^^^^^^^^^^ File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\pymysql\cursors.py", line 322, in _query conn.query(q) File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\pymysql\connections.py", line 563, in query self._affected_rows = self._read_query_result(unbuffered=unbuffered) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\pymysql\connections.py", line 825, in _read_query_result result.read() File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\pymysql\connections.py", line 1199, in read first_packet = self.connection._read_packet() ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\pymysql\connections.py", line 775, in _read_packet packet.raise_for_error() File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\pymysql\protocol.py", line 219, in raise_for_error err.raise_mysql_exception(self._data) File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\pymysql\err.py", line 150, in raise_mysql_exception raise errorclass(errno, errval)pymysql.err.OperationalError: (1054, "Unknown column 'todo.content' in 'field list'")The above exception was the direct cause of the following exception:Traceback (most recent call last): File "C:\Program Files\JetBrains\PyCharm 2024.1.2\plugins\python\helpers\pydev\pydevconsole.py", line 364, in runcode coro = func() ^^^^^^ File "<input>", line 1, in <module> File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\sqlalchemy\orm\session.py", line 2459, in scalars return self._execute_internal( ^^^^^^^^^^^^^^^^^^^^^^^ File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\sqlalchemy\orm\session.py", line 2236, in _execute_internal result: Result[Any] = compile_state_cls.orm_execute_statement( ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\sqlalchemy\orm\context.py", line 293, in orm_execute_statement result = conn.execute( ^^^^^^^^^^^^^ File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\sqlalchemy\engine\base.py", line 1418, in execute return meth( ^^^^^ File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\sqlalchemy\sql\elements.py", line 515, in _execute_on_connection return connection._execute_clauseelement( ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\sqlalchemy\engine\base.py", line 1640, in _execute_clauseelement ret = self._execute_context( ^^^^^^^^^^^^^^^^^^^^^^ File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\sqlalchemy\engine\base.py", line 1846, in _execute_context return self._exec_single_context( ^^^^^^^^^^^^^^^^^^^^^^^^^^ File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\sqlalchemy\engine\base.py", line 1986, in _exec_single_context self._handle_dbapi_exception( File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\sqlalchemy\engine\base.py", line 2353, in _handle_dbapi_exception raise sqlalchemy_exception.with_traceback(exc_info[2]) from e File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\sqlalchemy\engine\base.py", line 1967, in _exec_single_context self.dialect.do_execute( File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\sqlalchemy\engine\default.py", line 924, in do_execute cursor.execute(statement, parameters) File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\pymysql\cursors.py", line 153, in execute result = self._query(query) ^^^^^^^^^^^^^^^^^^ File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\pymysql\cursors.py", line 322, in _query conn.query(q) File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\pymysql\connections.py", line 563, in query self._affected_rows = self._read_query_result(unbuffered=unbuffered) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\pymysql\connections.py", line 825, in _read_query_result result.read() File "C:\Users\yhkim\inflern_project\todos\Lib\site-packages\pymysql\connections.py", line 1199, in read first_packet = self.connection._read_packet() ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측치
X_train['occupation'] = X_train['occupation'].fillna('X') X_train.isnull().sum()안녕하세요 선생님, 좌측 x_train 에서 x_train[occ~]이 아닌 a = X_train['occupation'].fillna('X') 로 해서 진행해서 결측치로 채우는 방법은 어떻게 하는걸까요 ??좌측은 변수명인데 꼭 파일명['컬럼명']을 작성해야할까요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
pandas
안녕하세요 선생님, pandas로 코드를 처리하고 있는데,visual studio code 파이썬으로입력해도 문장처리나 결과는 똑같나요 ??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
model.predict -> 1일 확률값
안녕하세요 선생님, 수업질문드립니다~7회 기출유형(작업형3) 12:54 부분에서pred = model.predict(test) 하면 1일 확률값이 나오는데요! 지난 작업형2에서 배울때 predict가 아닌 predict_proba를 할때 확률값이 나왔던걸로 기억합니다. 뭐가 다른 것인가요? 로지스틱 회귀모델은 확률값이 나오는건가요?
-
해결됨실전! FastAPI 입문
갑자기 웹페이지 수정사항이 적용되질 않습니다.
from fastapi import FastAPI, Body from pydantic import BaseModel # 쉽게 requestbody(입력받는 함수인자) 처리 app = FastAPI() # 앱이란 객체에 api연결해서 서버를 띄우면 HTTP요청 보낼 수 있다. @app.get("/") def health_check_handler(): return {"ping": "pong"} todo_data = { 1: { "id": 1, "contests": "실전! FastAPI 섹션 0 수강", "is_done": False, }, 2: { "id": 2, "contests": "실전! FastAPI 섹션 1 수강", "is_done": False, }, 3: { "id": 3, "contests": "실전! FastAPI 섹션 2 수강", "is_done": False, } } @app.get("/todos") def get_todos_handler(order: str | None = None): ret = list(todo_data.values()) if order and order == "DESC": return ret[::-1] return ret @app.get("/todos/{todo_id}") def get_todo_handler(todo_id: int): return todo_data.get(todo_id, {}) class CreateTodoRequest(BaseModel): id: int contests: str is_done: bool @app.post("/todos") def create_todo_handler(request: CreateTodoRequest): todo_data[request.id] = request.dict() return todo_data[request.id] @app.patch("/todos/{todo_id}") def update_todo_handler( todo_id: int, is_done: bool = Body(..., embed=True), ): todo = todo_data.get(todo_id) if todo: todo["is_done"] = is_done return todo return {}해당 코드까지 진행했고, (todos) PS C:\Users\yhkim\inflern_project\todos\src> uvicorn main:app --reload로 실행했는데 어느순간부터 웹페이지가 수정사항이 적용되지 않습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 평가지표 다 외워야 하나요?
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, roc_auc_score # 정확도 print(accuracy_score(y_val, pred)) # 정밀도 print(precision_score(y_val, pred)) # 재현율 (민감도) print(recall_score(y_val, pred)) # F1 print(f1_score(y_val , pred)) 상기 사진의 평가지표(from~, 정확도, 정밀도 등) 식은 문제에서 주어지지 않는지 궁금합니다.모두 암기해야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
라벨/원핫 인코딩 시
만약에 라벨/원핫 인코딩시에 트레인에서 fit_transform할때 없었던 데이터가 테스트에 있어서 transform 처리가 안되면 어떤식으로 처리해야지 가장 간단하게 처리할수 있을까요? 데이터를 합쳐서 인코딩 하고 다시 나누는 방법밖에 없을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코랩 환경에서 나오는 미리보기? 따라치기? 창.. 어떻게 없애나요?ㅠ
언제부터인가 미리보기? 처럼미리 답변이 나와요 그러니까 올려주신 노트북 링크에서import sk까지 쓰면, 연한 색으로 import sklearn.ensemble이게 미리 노출된채로 나와있어요ㅠ이거 너무 거슬리는데.. 어떻게 끄나요????
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
t검정 질문드립니다.
피어슨, 스피어맨, 켄달타우의 귀무가설(?)이 뭔지 궁금합니다. p-value < 유의수준 : 귀무가설 기각 (상관관계 없음)p-value > 유의수준 : 귀무가설 채택 (상관관계 있음) 이렇게 되나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션6 독립표본검정 shapiro-wilk 검정 부분에서 print문 괄호 질문있습니다
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요print문에서 괄호를 A에만 묶고 B에는 안묶었는데 결과는 A, B 모두 나오는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실제 시험에서 이상치 발견 시
만약 시험 환경에서 age 데이터가 주어지고 - 값이 있는 것을 확인했다면,따로 이상치를 제거하란 말이 없으면 - 값을 그대로 놔둬야 할까요, 아니면 제가 스스로 판단해서 - 값을 제거해주어야할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
라벨인코딩, 원핫인코딩 중 선택하는 기준이 무엇인지 궁금합니다.
인코딩 시, 라벨인코딩, 원핫인코딩 중 선택하는 기준이 무엇인지 궁금합니다.
-
해결됨실전도커: 도커로 나만의 딥러닝 클라우드 컴퓨터 만들기
강의 음량 설정 문제
섹션 6의 강의들이 서로 음량이 다르게 녹화된 것 같습니다. 혹시 확인이 가능하실까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의고사 2번 (5-2) 오류 질문
선생님 안녕하세요. 작업형2 모의고사 2번 관련하여 질문드립니다. train_test_split까지 잘 넘어온 다음에 sklearn.ensemble 작성하려고 다시 코드 실행하니, 자꾸 같은 부분에서 해당 이미지처럼 에러가 나는데요. 선생님이 작성하신 답안 그대로 ctrl c / v 했는데도 같은 에러가 뜨는데, 어떤 것 때문일까요? import pandas as pd test = pd.read_csv("test.csv") train = pd.read_csv("train.csv") print(train.shape,test.shape) #결측값 찾기 # train.isnull().sum() 'name', 'host_name', 'last_review','reviews_per_month' #object값 확인 # train.info() -> object 6개 #2 EDA처리 # train.info() last_review 빼고 전부다 object형임 print(train.shape) train = train.drop(cols, axis=1) test = test.drop(cols, axis = 1) print(train.shape) #reviews_per_month는 결측값 채워주기 train['reviews_per_month'] = train['reviews_per_month'].fillna(0) test['reviews_per_month'] = test['reviews_per_month'].fillna(0) # 결측치 없음 #id제거 train = train.drop('id', axis =1) test_id = test.pop('id') test.head(2) #라벨인코딩 cols = train.select_dtypes(include = 'object').columns from sklearn.preprocessing import LabelEncoder for col in cols: le = LabelEncoder() train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col]) #train_test_split from sklearn.model_selection import train_test_split X_tr,X_val,y_tr,y_val = train_test_split(train.drop('price',axis=1), train['price'] , test_size = 0.3,random_state = 42) ## 전부 train에서 뽑는거임 # print(X_tr.shape,X_val.shape, y_tr.shape, y_val.shape) from sklearn.ensemble import RandomForestRegressor model = RandomForestRegressor() model.fit(X_tr,y_tr) pred = model.predict(X_val) test.head()그리고 작업형2 회귀문제가 나온다면, 해당 이 부분은 외워야 하는 걸까요..? 필수적이면 닥암기하려고 합니다..# 평가 import numpy as np from sklearn.metrics import r2_score, mean_absolute_error, mean_squared_error def rmse(y_test, y_pred): #RMSE return np.sqrt(mean_squared_error(y_test, y_pred)) def rmsle(y_test, y_pred): #RMSLE return np.sqrt(np.mean(np.power(np.log1p(y_test) - np.log1p(y_pred), 2))) def mape(y_test, y_pred): #MAPE return np.mean(np.abs((y_test - y_pred) / y_test)) * 100
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코랩 노트북을 못찾겠습니다.
시계열 데이터 강의를 듣고있는데... 그전까지는 코랩 노트북 링크를 화면에 띄워주셔서그거 입력해서 들어가서 제 구글 드라이브로 복사했는데 시계열 데이터 강의부터는 제공되는 코랩 노트북을 찾지 못하겟네요ㅠ ㅠ확인 부탁드립니다.
-
미해결개념부터 철저한 gRPC! (with Python)
강의 노트와 소스코드 다운로드 문의 드립니다.
혹시 강의 노트나 소스코드는 어디서 다운로드를 받을 수 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코랩 실습 중 발생되는 문제 해결 방법 문의
안녕하세요영상을 따라 실습을 하는데, 코드를 치지도 않았는데알아서 자동완성이 됩니다.혹시 이 기능을 끄기 위해선 어떻게 해야할까요...(아무리 서칭해도 안나와서.. 여기에 문의드립니다 ㅜㅅㅜ.. 도와주세요,,,)
-
미해결프로그래밍 시작하기 : 파이썬 입문 (Inflearn Original)
강의 재생이 안됩니다
갤럭시탭으로 듣는 중이었는데 이틀 전까진 정상재생되더니 어제부터 재생을 눌러도 되질 않네요. 안드로이드 스마트폰과 pc에서는 또 정상재생이 됩니다. 아래 문의글에도 재생이 안된다는 말이 있는데 확인 부탁드립니다. 브라우저는 삼성브라우저와 모바일크롬 둘 다 시도해봤는데 다 안되네요.
-
미해결파이썬 알고리즘 문제풀이 입문(코딩테스트 대비)
Combination 공식과 강사님의 설명이 잘 연결이 되지 않습니다.
안녕하세요 강사님. 수업 잘 듣고 있습니다.조합에서 nCr = n!/((n-r)!r!) 인 것으로 알고 있습니다.b=[1,3,3,1] 정의하는 설명에서 3C1이 3을 1로 나눈다라고 하셨는데 이 부분의 설명이 이해가 가지 않아서 질문드립니다. 공식에 대입해서 계산해보면3C1일 때 3!/(3-1)!*1!이 결과적으로 3이 되는것이 맞긴 합니다만, 어떻게 하면 앞의 숫자에서 n-1을 곱 하고 i를 나눌 생각을 할 수 있는지 직관적으로 떠오르지가 않아서 질문 드립니다.