묻고 답해요
144만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
분위수 질문 드립니다
안녕하세요분위수 구할 때,df[컬럼명].describe()[‘75%‘]시험에서 위와 같은 방법으로 구해도 무관한가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코드 암기 범위 질문드립니다.
선생님, 이전에 데이터 불러오는 코드는 문제에서 제시 해준다고 했는데 마지막 제출 하는 코드예를들어submit = pd.DataFrame( { 'id':X_test['id'], 'income':pred } )submit.to_csv("11111.csv", index=False)이런거도 다 외워서 써야하나요? 아직 완강을 안해서 지엽적인 질문을 하는건지..ㅠ일단 다 듣고 한번 더 들으면 개념이 확실히 잡히려나요...분석이나 문제 풀이에 대한 코드들은 외우고 있는데 위와 같은 제출코드나 데이터 불러오는 코드 같은건 어디까지 외워야 하는지 감이 도통 안잡히네요! 이 부분에 대한 강의도 뒷부분에 있을까요~?
-
해결됨Do It! 장고+부트스트랩: 파이썬 웹개발의 정석
doitdjango 블로그 게시판 작동 오류
안녕하세요.요즘에 'aws lightsail 로 프로젝트 옮기기'를 듣고 있습니다.거기서 블로그 글을 참고하라고 하셔서, 블로그를 들어갔더니, 해당 블로그 게시판이 작동하지 않습니다.확인 부탁드려도 될까요? 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
구버전 영상 (삭제 예정)
마지막 4개의 구버전 영상 (삭제 예정)은 학습하지 않아도 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
random_state
회귀, 분류 모델에서 하이퍼파라미터 튜닝 시 random_state를 이용하는데, 이 random_state 역할이 '회귀, 분류 모델에서 매번 코딩 실행 시 동일한 학습용 데이터셋을 생성하여 동일한 결과를 출력하게 한다'가 맞는 걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
피처엔지니어링 - 원핫인코딩 get_dummies()
안녕하세요, 덕분에 재미있게 빅분기 실기 시험 준비 중입니다 : )범주형 변수의 unique 수가 train 데이터셋과 test 데이터셋에서 서로 다를 때, 원핫인코딩을 진행하게 되면 Feature의 수가 다르므로 일치시키기 위해... train 데이터셋과 test 데이터셋을 먼저 concat으로 합친 후에 원핫인코딩을 진행하고 분리하는 것으로 이해했습니다!기존 질문과 답변주신 것들을 살펴보니, get_dummies() 사용 시, 자동으로 범주형 변수만 선택하여 원핫인코딩하고 전체데이터를 반환하므로 X_train 데이터를 사용해도 무관하다고 하셨는데요~ 수업에서는 all_df = pd.get_dummies(all_df[cols])로 작성하니 범주형 변수 cols에 해당하는 데이터만 원핫인코딩되어 전체데이터가 아닌 범주형 변수의 원핫인코딩 결과만 all_df에 담기게 되는 것 같습니다. 말씀주신 것처럼, 자동으로 범주형 변수만 원핫인코딩하고 전체 데이터를 반환하기 위해서는, 이 코드를 all_df = pd.get_dummies(all_df)로 바꾸어야 되는게 맞는건가요?
-
미해결파이썬 동시성 프로그래밍 : 데이터 수집부터 웹 개발까지 (feat. FastAPI)
RuntimeWarning: Enable tracemalloc to get the object allocation traceback
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. # app 폴더 아래 main.py @app.post("/collect", response_class=HTMLResponse) async def collect(request: Request): brandlist = BrandList() brands = await brandlist.run() oy_models = [] for brand in brands: oy_model = BrandListModel( code=brand["code"], brand=brand["brand"], collection_time=brand["time"], status=brand["status"], ) oy_models.append(oy_model) await mongodb.engine.save_all(oy_models) return templates.TemplateResponse( "./index.html", {"request": request, "title": "수집기", "brands": brands}, ) # app 폴더 아래 spcrper.py class BrandList: URL = "https://www.#######.co.kr" def unit_url(self): url = f"{self.URL}/store/main/getBrandList.do" return url async def fetch(self): async with aiohttp.ClientSession() as session: async with session.get(self.unit_url()) as response: soup = BeautifulSoup(await response.text(), "html.parser") area_info = soup.select("a[data-ref-onlbrndcd]") branddics = [] for info in area_info: code = info["data-ref-onlbrndcd"] name = info.text collectiontime = date.today() item = [i["code"] for i in branddics] if code in item: pass else: branddic = { "code": f"{code}", "brand": f"{name}", "time": f"{collectiontime}", "status": "Old", } branddics.append(branddic) await session.close() return branddics def run(self): return asyncio.run(self.fetch()) 안녕하세요. 강사님. scraper.py 는 terminal에서 값을 잘 가져오고 있습니다. server.py에서 구동 시, 아래와 같은 error가 나오는데 원인을 찾지 못해서요 ㅠ RuntimeError: asyncio.run() cannot be called from a running event loopC:\Users\user\Desktop\Project_Scraper\venv\Lib\site-packages\uvicorn\protocols\http\httptools_impl.py👎 RuntimeWarning: coroutine 'BrandList.fetch' was never awaitedRuntimeWarning: Enable tracemalloc to get the object allocation traceback 코드 리뷰 좀 부탁드리겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
predict_proba 관련 질문
작업형2 모의문제1 - 29:00 경 pred 값 할당할 때, predict_proba 를 사용하는 이유는roc_auc 값을 구해야 하기 때문인가요?roc_auc 값 외에도 다른 평가지표들이 있는데 그냥 predict를 사용하면 안되는지 문의드립니다. 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제2
안녕하세요, 코린이입니다문제가 age 컬럼의 이상치를 제거하고 제거전후 views 컬럼 편차를 구하는거고..age 컬럼 이상치를 제거하면 views 컬럼에 있는 age 이상치 행도 같이 날라가나요 ? 그래서 제거전후 편차를 구하게 되는걸까요 ? import pandas as pd df = pd.read_csv("members.csv") r1 = df['views'].std() cond = df['age'] <= 0 # print(df.shape) df = df[~cond] # print(df.shape) # print(df.shape) cond = df['age'] == round(df['age'],0) # 소숫점 나이 구하기, 반올림 했을 때 같으면 정수형 , 다르면 소수점 df = df[cond] # print(df.shape) r2 = df['views'].std() print(round(r1 + r2, 2))
-
미해결처음하는 파이썬 백엔드 FastAPI 부트캠프 (FastAPI부터 비동기 SQLAlchemy까지) [풀스택 Part1-2]
pip install 해야할 목록을 알고 싶습니다.
강의를 다 듣고 코드를 실행하는데 실행이 되지 않아 pip install 해야할 목록을 알고 싶습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
질문입니다!
from statsmodels.formula.api import ols과 summary만 사용해서 회귀계수, P-value값 등을 읽을 줄만 알아도 시험문제를 푸는데 문제없을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원 핫 인코딩에서...
선생님 저는 왜 false/true 값으로만 나올까요?수업 자료 코드에 있던거 그대로 실행 했는데도..display(c_train.head()) c_train = pd.get_dummies(c_train[cols]) c_test = pd.get_dummies(c_test[cols]) display(c_train.head())
-
해결됨직장인에게 꼭 필요한 파이썬-아래아한글 자동화 레시피
탭 선택 관련 문의 입니다.
특정 탭에 진입할 수 있어야 합니다.이렇게 초반에 탭이 3개가 있는 프로세스가 있는 경우현재는 test2라는 탭이 활성화 되어있습니다.저는 test라는 탭을 편집하여야하는데test2를 종료 하더라도 test 탭으로 정확히 이동이 안되는데혹여 특정 탭에 접근이 가능한 방법이 있을까요?우선 현재 띄워져 있는 창의 탭 이름을 가져오는 것에는 성공을 하였습니다. from pyhwpx import Hwp hwp = Hwp() documents = hwp.XHwpDocuments for i in range(documents.Count): doc = documents.Item(i) doc_name = doc.FullName if doc.FullName else "저장되지 않은 문서" print(f"문서 {i}: {doc_name}") if 'test.hwpx' in doc_name: selected_doc = doc selected_num = i break if 'selected_doc' in locals(): # 해당하는 문서가 탭에 존재하면 해당 문서를 편집할 수 있게 선택 만약 탭이름을 활용해서 선택하는 방법이 없다면hwp.Run("WindowNextTab")을 통하여 현재 탭의 이름과 하나하나 비교하여 일치하는 경우까지 이동하게 하는 방식이 나을지 아니면 탭에 접근하는 방법이 있을지 질문드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
kaggle 오류
케글 T1-3 연습중인데 아래와 같은 오류가 발생하는데 어떻게 해결할 수 있을까요? maximum recursion depth exceeded while calling a Python object
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
괄호 사용이 헷갈려서 질문드립니다.
예시는 9번문제로 질문을 하지만 9번문제 뿐만아니라 다른 문제를 풀이하는데 있어서 괄호 사용이 헷갈려서 질문드립니다.대충 대괄호하나는 시리즈로 불러오는거고 대괄호 2개는 데이터프레임으로 불러오는걸로 알고있었습니다. 그런데 문제를 풀면서 왜 groupby함수나 sort_values함수를 포함한 기타 다른경우에 소괄호안에 대괄호없이 컬럼명만 사용해도 되는지 궁금합니다. 컬럼명을 쓸때 대괄호를 써야할때와 필요없을때의 구분을 어떻게 해야할까요?import pandas as pd df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/members.csv') df['subscribed'] = pd.to_datetime(df['subscribed']) df['year'] = df['subscribed'].dt.year df['month'] = df['subscribed'].dt.month df['day'] = df['subscribed'].dt.day df = df.groupby('month').count() df.sort_values('subscribed').index[0]
-
미해결Airflow 마스터 클래스
powershell 이 없어 질문드립니다.
안녕하세요, wsl을 이용한 linux설치 강의를 따라하고 있었는데 시작버튼을 눌러 powershell 을 검색하면windows powershell ISE 만 나오고windows powershell 은 나오지 않습니다.별도의 windows powershell 설치가 필요할까요?구글링을 해봐도 아직 방법을 못찾았기에 질문드립니다.어떻게 진행하면 될까요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
.
.
-
미해결남박사의 파이썬 기초부터 실전 100% 활용
소수 너무 어려워요
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 사이트 내 강사님 사이트 알려주세요
수업을 들으면서 강사님께서 캐글에 있는 데이터와 함께 전처리 문제들을 올려놓으셨다고 하셨는데 제가 찾지를 못하겠습니다.주소를 알려주시면 들어가서 열심히 공부하겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 - 스케일링
안녕하세요!작업형2의 데이터 전처리 스케일링 관련하여 문의사항이 있어 질문 남깁니다.카테고리형 데이터의 경우, 라벨 인코딩, 원-핫 인코딩을 사용하고,숫자형인 경우, 표준화, 정규화를 사용하는 것 같은데, 각각의 기법을 언제 사용하는지 궁금합니다!데이터 타입별 기법들의 차이는 이해했는데, 어떤 경우에 어떤 기법을 선택해서 사용해야 하는지 문의드립니다. 감사합니다.