묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[ChatGPT 활용 실전 데이터분석 특강] 런던 MBA학생들이 배우는 Data Analytics 강의
범주형 데이터 세트의 불균형 문제
안녕하세요, 수업을 듣다가 fraud detection을 예시로 주셨던 범주형 데이터 속성중에 세트 자체에서 불균형이 큰 경우, 예를 들어 yes 는 1000 개고 no 가 5개 밖에 없는 극단적인 불균형이 있을 때는 모델의 정확도를 맞추기 어렵다고 설명주신 부분에 질문이 있어요. 저도 사실 제 프로젝트를 하던중에 비슷한 문제가 있었어서 SMOTE같은 방법을 써서 어떻게 해서든 불균형 문제를 완화해보려고 노력했는데 주어진 데이터 자체가 너무 불균형이 심하면 설명주셨던 것처럼 별다른 방법을 찾지 못했습니다. 만약 그럼에도 불구하고 그 데이터가 중요한 속성들과 데이터라면 어떻게 다루는 것이 좋을까요? 제가 예전에 했던 방법은 정확하게는 기억이 나지 않지만 그 그룹군을 아예 나누어 data frame을 따로 짜서 분석을 진행해보려고 했던 것 같아요. (예시: no = fraud 그룹군 df, yes = non_fraud 그룹군) 실질적으로는 보통 어떻게 접근하거나 해결하는 지 궁금합니다...!
-
해결됨파이썬 코드로 배우는 데이터분석
공지
강좌 운영이나 강의 내용에 관해 궁금한 점이 있으면 자유롭게 나누어주세요.교수자, 수강생 누구나 글쓰기와 댓글 쓰기가 가능합니다.
-
해결됨데이터 마이닝
공지
강좌 운영이나 강의 내용에 관해 궁금한 점이 있으면 자유롭게 나누어주세요.교수자, 수강생 누구나 글쓰기가 가능합니다.
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
from sklearn.datasets import load_boston
강의중 from sklearn.datasets import load_boston자료를 읽어올시 오류가 발생합니다.
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
df.get_dummies 실행시 이진법이 아닌 false 또는 True로 반환됨.
df = pd.get_dummies(df, columns = ['Location', 'WindGustDir', 'WindDir9am', 'WindDir3pm']) MinTemp MaxTemp Rainfall Evaporation Sunshine WindGustSpeed WindSpeed9am WindSpeed3pm Humidity9am Humidity3pm ... WindDir3pm_NNW WindDir3pm_NW WindDir3pm_S WindDir3pm_SE WindDir3pm_SSE WindDir3pm_SSW WindDir3pm_SW WindDir3pm_W WindDir3pm_WNW WindDir3pm_WSW 0 13.4 22.9 0.6 4.4 8.2 44.0 20.0 24.0 71.0 22.0 ... False False False False False False False False True False 1 7.4 25.1 0.0 4.4 8.2 44.0 4.0 22.0 44.0 25.0 ... False False False False False False False False False True 2 12.9 25.7 0.0 4.4 8.2 46.0 19.0 26.0 38.0 30.0 ... False False False False False False False False False True 3 9.2 28.0 0.0 4.4 8.2 24.0 11.0 9.0 45.0 16.0 ... False False False False False False False False False False 4 17.5 32.3 1.0 4.4 8.2 41.0 7.0 20.0 82.0 33.0 ... False True False False False False False False False False 5 rows × 106 columns one hot encoding시에 이진법(0 또는 1)로 반환되어야하는데 false 또는 True로 반환됨.
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
선형회귀 곡선 응용편에서 alpha값이 의미하는 것은 무엇인가요?
선형회귀 곡선 응용편에서 alpha값이 의미하는 것은 무엇일까요?알파값이 감소할수록 성능이 좋아지는 것인지 아니면 적당한 값이 있는것인지요?
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
수업자료 요청 skahffk94@naver.com
수업자료 요청부탁드립니다.skahffk94@naver.com
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
실습중에 주가_데이터.T.loc T는 무엇인가요?
my_df = 주가_데이터.T.loc['2020-09-09':,'A005930':'A005990']
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
parsererror
실습을 똑같이 따라하는 중인데 parsererror가 뜹니다.이유가 무엇을까요? 주가_데이터 = pd.read_csv('stock.adj_close.csv', index_col=0) my_series = 주가_데이터.loc['A005930']['2020-09-09':] ParserError Traceback (most recent call last) <ipython-input-16-e728d7ea27ad> in <cell line: 1>() ----> 1 주가_데이터 = pd.read_csv('stock.adj_close.csv', index_col=0) 2 my_series = 주가_데이터.loc['A005930']['2020-09-09':] 8 frames/usr/local/lib/python3.10/dist-packages/pandas/_libs/parsers.pyx in pandas._libs.parsers.raise_parser_error() ParserError: Error tokenizing data. C error: Expected 583 fields in line 238, s
-
해결됨[멘토링] 데이터로 미래를 그리다: 모두를 위한 데이터 리터러시
3가지의 머신 러닝 타입 살펴보기 챕터가 재생되지 않습니다.
많은 질문 부탁드립니다. 상세히 작성해주시면 더 좋습니다.단 앞서 비슷한 질문이 있었는지 검색 부탁드리겠습니다.서비스 운영 관련 문의는 1:1 문의하기를 이용 부탁드리겠습니다.
-
미해결현업 실무자에게 배우는 Kaggle 머신러닝 입문 - ML 엔지니어 실무 꿀팁
강의자료 요청드립니다.
강의자료 중 교안이 없어 연락드립니다. 교안(PPT) 요청드립니다. 아래 메일로 전달해주시면 감사하겠습니다. actorarnie@gmail.com
-
해결됨EDA 기반 Microservice 구현 (with Hexagonal, DDD)
domain.model.event에 정의되는 객체들에 대한 질문이 있습니다
MSA강의 재밌게 잘 보고 있습니다 👏 강의를 보던 중 카프카 연동을 위해 kafkaadapter와 event 패키지를 정의하고 객체들을 넣고있는데, 저희 회사에서도 겪고 있는 문제가 떠올라서 궁금한게 생겼는데, 프로듀싱하는 서비스와, 컨슘하는 서비스의 프로토콜을 ItemReturned, ItemRented등으로 정의하고 내부 값에서IDName등을 사용한다고 할 때 이 프로토콜 스펙이 변경될 때마다 각 팀별로 객체 정보를 수정한다고 하면, 마치 서비스내에 코드 중복들이 된 상태에서 기능이 변경될때마다 중복된 코드들을 같이 관리하며 싱크를 맞춰줘야하는 작업들과 유사해보이는데, 이에 대해서는 어떻게 풀어나가야 하나요? 즉, 서비스간에 데이터 송수신을 위한 객체들이 중복코드처럼 보이는데 스펙변경이 있을때마다 각 서비스마다 직접 코드 수정을 하는건 한 팀에서 수정을 누락하거나 관리를 놓친 프로젝트에서 수정이 누락되면 문제가 될 수 있을 것 같은데 어떤식으로 풀어나가는지 궁금합니다.
-
미해결[비전공자 대환영] 캐글 데이터를 활용한 Optuna with MLFlow - 캐글다지기
jupyter nbextension enable --py widgetsnbextension 에러발생
vscode 터미널에서 jupyter nbextension enable --py widgetsnbextension 실행시 아래와 같은 에러가 발생합니다.Jupyter command jupyter-nbextension not found.해결방법이 어떻게 될까요??
-
미해결EDA 기반 Microservice 구현 (with Hexagonal, DDD)
수업에 사용한 소스코드 문의
안녕하세요.혹시 수업에 사용한 소스코드 받을수 있을까요?감사합니다..
-
미해결EDA 기반 Microservice 구현 (with Hexagonal, DDD)
EDA 이해
EDA가 결국 이벤트를 기반으로 비즈니스적으로 응집력 있게 관리되어야 하는 데이터들을 어떻게 핸들링할 것인가 인것 같은데, 제가 맞게 이해한 걸까요? 이를 위해서는 결국 도메인 중심적으로 생각하는게 좋구요!
-
미해결EDA 기반 Microservice 구현 (with Hexagonal, DDD)
보상트랜잭션 후 클라이언트 알림 방법 등
강사님 덕분에, EDA, DDD, 헥사고날 등 어려운 개념에 대해 좀더 친숙해질 수 있어서 너무 감사합니다!강의를 다 듣고 몇가지 궁금증이 생겨 질문 남겨요! 대여 취소, 반납 취소 등으로 보상트랜잭션이 필요한 경우, 보통 클라이언트에게 알림(?)은 어떻게 보내나요? 알림 서버를 사용하나요?EDA 시, 1개의 서버의 응답이 너무 느린 경우, 비동기더라도 느릴수 있는데, 이럴 걸 대비하여 자체적으로 타임아웃시간을 정해서 해당 시간 초과면 시간 초과 응답을 클라이언트한테 보내나요?
-
미해결EDA 기반 Microservice 구현 (with Hexagonal, DDD)
MSA 구조에서 공통 클래스
강의를 듣다보면, 여러 MS 사용되는 클래스의 경우, 복붙해서 사용하시는데, 실무에서는 여러 MS 사용되는 클래스의 경우 어떻게 처리하나요? MS 서버별로 팀이 다르다고 했을 때에는 복붙으로만 해결되지 않을 수도 있을 것 같아서요!
-
해결됨EDA 기반 Microservice 구현 (with Hexagonal, DDD)
@Repository 두 곳에서 사용하시는 이유
코드를 보면, Adpater 클래스와 Repository 인터페이스, 이렇게 2곳에서 @Repository을 사용하고 계시는데, 2곳에서 사용하시는지 이유가 궁금합니다!
-
미해결EDA 기반 Microservice 구현 (with Hexagonal, DDD)
Entity와 VO에 대해..
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요.도메인모델을 만들때 Entity와 VO는 단순히 불변성을 가지고 구분하는 것인지요?그리고 JPA에서의 Entity와는 다른 개념인지 궁금합니다.감사합니다.
-
미해결EDA 기반 Microservice 구현 (with Hexagonal, DDD)
DTO 클래스의 위치에 대해 질문있습니다!
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요! 좋은 강의 감사드립니다 ㅎㅎ (강의에서 나온대로 패키지와 클래스를 구성한 상태입니다.) 혹시 DTO를 framework 패키지에 넣는 이유가 있을까요? 저는 개인적으로 UseCase나 InputPort에 framework 패키지에 대한 import가 생기기 때문에 의존성이 생긴다고 판단해 application에 DTO를 생성할 것 같습니다. 혹시 제가 생각하지 못한 다른 이유가 있는지 궁금합니다!