묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결빅데이터분석기사 실기대비 (R 활용)
예시문제 작업형2번
안녕하세요전처리를 할 때 bagImpute 로 결측치 처리를 전체 했더니, auc >1 로 나오는데이 경우에는 하신 대로 mean 평균으로 대체하는게 맞을까요? scale(데이터, center=TRUE, scale=TRUE) 대신에 preProcess (caret 패키지) 를 추천해주신 이유가 있으실까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션 3 : "머신러닝"과 줄다리기
안녕하세요.빅데이터 분석기사 교재 보다가 비전공자라 그런지 조금 어려워서 인강까지 흘러오게 되었네요. 앞으로 잘 부탁드립니다 : ) 섹션 3 : "머신러닝"과 줄다리기 > 모델링 및 평가(분류) 문제 1번을 아래 링크와 같이 풀어보았습니다.혹시 이런식으로 푸는게 맞는건지 봐주실 수 있을까요?https://colab.research.google.com/drive/17FKBC1yxD5yHil49ubGXElCm2Tq40kDs#scrollTo=n8EH3M_AgD4k
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가지표 기준 관련
안녕하세요? 선생님!작업형 2에서 검증데이터를 분리해서 문제에서 제시한 평가지표로 평가를 수행한 후 어느 정도 점수가 나온 경우에 테스트 데이터로 예측을 하여 답안을 제출하는 것으로 알고 있습니다.점수가 좋지 않은 경우 전처리, 피쳐엔지니어링, 하이퍼파라미터 튜닝 등의 과정을 거쳐서 일정 점수 이상이 나오는지 확인을 한후 테스트 데이터 예측을 하는 것으로 알고 있습니다.그런데, 궁금한 점이 각 평가지표 별로 어느정도 점수 이상이거나 이하로 나와야 답안 제출을 할 수 있는지요? 평가지표별로 어느정도 기준 점수가 있는지요?
-
해결됨빅데이터 파이프라인 마스터; 성공을 위한 도구와 기술
[질문] replication 변경 질문드립니다.
안녕하세요!강의 수강하면서 HDFS 명령어를 구글링하면서 만져보고 있는데요, 강의 실습에서 hdfs-site.xml에서 replication을 1로 설정해서, hdfs setrep 명령어를 사용해 replication configuration 3으로 변경을 시도했다가 잘 되지 않아서 질문드립니다.w 옵션 없이 setrep 3 / 명령어 입력 시에,./bin/hdfs dfs -stat "%b %F %g %n %o %r %u %y %Y" {파일 경로}결과 %r = 3으로 변경이 되는데./bin/hdfs fsck / -files -blocks결과를 확인해보면, Default replication factor가 여전히 1로 나옵니다.Default replication factor를 변경할 수 있는 방법 질문드립니다. 또 기다려도 hdfs에 올린 파일들이 자동으로 복제가 되지 않고 개수가 계속 1이라(fsck 명령어로 상태 확인 시에 missing replicas 확인됨), 강제로 setrep에 w옵션을 사용해서 기다려봤는데, 계속 복제본을 만들지 않는 결과를 확인했습니다.이게 Pseudo Distributed Operation 모드에서 동작을 시켜서 발생시키는 결과인지, 아니면 어떤 부분이 문제일지 질문드립니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2번 문제 유형관련 질문
안녕하세요!덕분에 공부 잘 하고 있습니다!다름이 아니라 작업형 2번 문제에 지도학습 중 분류와 회귀 위주로 기출이 나오고 강의를 해주시는데, 비지도 학습의 군집분석이나 연관분석 문제는 배제하고 공부를 해도 될런지요?만약 공부를 해야 한다면 어디를 참조하여 공부를 하면 될까요? (예시문제 등)
-
해결됨데이터분석 준전문가(ADsP) 자격증 대비
2-19 주성분분석에 대한 강의가 2-18 차원축소기법 강의 내용 뒷부분과 중복됩니다
2-19의 강의내용이 2-18 차원축소기법의 주성분분석 강의 내용과 동일하네요확인 부탁드립니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제3 변환 관련 문의
# your code #데이터 변환은 replace!! import pandas as pd df = pd.read_csv('members.csv') df = df.dropna(subset=['views']) df['f3'] = df['f3'].fillna(0) df = df.replace('silver',1).replace('gold',2).replace('vip',3) df.head(10)위 처럼 numpy를 불러오지 않고, f3컬럼에 결측값을 0으로 먼저 채운 후 변환문을 사용했는데 결과와 데이터프레임이 같아서혹시 이 방법으로 해도 상관 없는건지 여쭤보려고 합니다~ 다시 확인좀 하려고 지웠다가 다시 문의합니다!그리고 map사용 시 #map import pandas as pd df = pd.read_csv("members.csv") df = df.dropna(subset=['views']) dict_list = {np.nan:0, 'silver':1, 'gold':2, 'vip':3} df['f3'] = df['f3'].map(dict_list) print(df['f3'].sum())numpy를 불러야하는것이 맞겠죠?.. 위에서 이미 한번 numpy 불러와서 에러가 발생하지 않은 것 같아서요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모델링 에러 관련
랜덤포레스트 분류 모델링을 하는데 당므과 같은 에러가 나타납니다. 해결 방법이 무엇인가요? "사용 가능한 RAM을 모두 사용한 후 세션이 다운되었습니다."
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1의 문제3에 대해 여쭙습니다~
공부하다가 마지막 문제3 "f3 컬럼의 결측치는 0, silver는 1, gold는 2, vip는 3으로 변환한 후 총합을 정수형으로 출력하시오"이 문제를 해결할 수 있는 세 개의 비단주머니(…ㅎ)를 알려주셔서 고맙습니다.저 문제에서는 '변환한 후' 총합을 정수형으로 출력하라고 해서요. 마지막 세 번째 방법은 1번과 2번을 모를 때 마지막 궁여지책으로 작성할 방법 같습니다.파이썬이 문법이 쉬운 것 같으면서도 막상 해보려고 하면 어려워서요. ;; 혹시 마지막 세 번째 방법을 저렇게 조건문 식으로 해서 아예 컬럼의 값 자체를 바꿀 수 있는 방법이 있을까요? 오전 내 고민하다가 도저히 안 되겠어서 여쭤봅니다. 이건 뭐 그냥 생각해본 거니까 곤란하시면 답해주지 않으셔도 됩니다. 좋은 강의 정말 감사합니다~
-
해결됨빅데이터 파이프라인 마스터; 성공을 위한 도구와 기술
[섹션5] 실습 2 수업에서 S3 advanced assignment 질문 드립니다.
안녕하세요, 선생님. 이 글의 제목에 관련된 질문을 드리고 싶습니다.저는 코딩을 할 때 주로 Windows 환경에서 해왔고 그래선지 Python code를 실행시킬 때 script 실행을 하는 경험이 없었고 함수 지향 프로그래밍을 하면서 네임 내장 함수를 써가며 script 실행 시 argument를 사용하게 끔 코딩해본 적이 없습니다.본 강의에서 앞선 수업 때 이런 내용에 대해 다뤄주신 적이 있다면 모르겠지만, 그게 아니다보니 선생님께서 이 수업에서 내주신 숙제가 조금 overtraining처럼 느껴집니다. 관련 자료를 뒤져가며 공부하는게 도움이 될 수도 있겠지만 사정이 있어서 빠르게 본 강의를 마스터하고 싶은 마음이 큽니다. 선생님께서 답안을 주시면 그것가지고 공부를 하고 싶습니다. 허락해주신다면요.. 감사합니다.
-
미해결15일간의 빅데이터 파일럿 프로젝트
오라클 Virtualbox 설치 후 서버 실행시 오류입니다.
VM Name: Server01Failed to open/create the internal network 'HostInterfaceNetworking-VirtualBox Host-Only Ethernet Adapter' (VERR_INTNET_FLT_IF_NOT_FOUND).Failed to attach the network LUN (VERR_INTNET_FLT_IF_NOT_FOUND).Result Code:E_FAIL (0X80004005)Component:ConsoleWrapInterface:IConsole {6ac83d89-6ee7-4e33-8ae6-b257b2e81be8} 이런 오류가 뜨는데 어떻게 해결하면 좋을까요?? 구글링 해보니 host-only-ethernet을 새로만들고 다시 해보라고 하던데 그 방법도 되지 않습니다.Virtualbox 버전은 7.0.8 최신버전입니다.
-
해결됨데이터분석 준전문가(ADsP) 자격증 대비
1-3 데이터베이스 정의와 특징, 관련 용어 강의에서 24분쯤 풀어주시는 문제 질문있습니다.
1-3 데이터베이스 정의와 특징, 관련 용어 강의에서 24분쯤 풀어주시는 문제 질문있습니다. 고객과 상품의 대응관계 도식화를 보고 고객과 상품간의 관계를 고르는 것인데 고객 두명이 상품 1개를 고르는 것도 있지만 (n:1)맨 윗칸에 고객 1명이 상품 1개를 고르는 (1:1)도 있는 것 같은데 답이 복수가 아니라 n:1 이라서 질문드립니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
워닝 문제
<ipython-input-25-475204a37c2b>:2: FutureWarning: The default value of numeric_only in DataFrame.corr is deprecated. In a future version, it will default to False. Select only valid columns or specify the value of numeric_only to silence this warning. X_train.corr()워닝이 뜨는데 어떻게 해결해야 하는걸까요....
-
해결됨빅데이터 파이프라인 마스터; 성공을 위한 도구와 기술
강의 자료
안녕하세요, 선생님.지금 섹션2 Data Acquisition[Advanced] 파트를 듣고 있는데수업에서 보여주시는 자료들을 수강생들이 구할 수는 없는지 궁금합니다. 수업 중에 선생님께서 자료에 있는 링크를 누르시면서 "여기 링크를 누르셔서 이 페이지를 확인해보시면~" 와 같은 흐름으로 이어지는 부분이 있는데, 이렇다 보니 자료가 더욱 필요하다고 느껴져 여쭤봅니다.그리고 섹션7에 있는 [실습 및 과제 데이터]를 다운받아서 압축 해제를 시도해보니 10%에서 멈추는 현상이 있습니다. 사용하는 압축해제 프로그램은 7zip입니다. 현재 사용하는 Laptop이 기업용이라 라이센스 문제가 생기지 않는 프로그램을 쓰고 있습니다. 프로그램 문제보단 압축파일 문제이지 않을까 싶은데 확인 부탁드립니다.감사합니다.
-
미해결[핵집] 2024 빅데이터 분석기사(필기)_과목 1~2
통합교재
안녕하세요?본 강의의 통합교재를 부탁드립니다.cmn6861@jejunu.ac.kr 입니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
XGBoost 실행 중 에러 관련 문의드립니다~!
위의 의사결정나무나 랜덤포레스트에서는 괜찮았는데,강사님처럼 위 코드를 불러와 수정했는데학습부분에서 에러가 발생합니다.영상과 비교해도..코드가 같은데 왜 오류가 날까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
한 번에 주석처리 하는 법 궁금합니다.
안녕하세요? 설명하실 때에 가령, 프린트 라고 적힌 부분을 모두 선택 하셔서 한꺼번에 주석처리를 빠르게 하시던데 어떻게 하시는지 알려 주시면 감사하겠습니다.
-
해결됨빅데이터 파이프라인 마스터; 성공을 위한 도구와 기술
본 강의에서 사용되는 OS
안녕하세요, 선생님. 강의에서 사용되는 Linux를 혹시 Docker 위에서 돌려도 괜찮을까요? 제가 Docker 사용에 능숙하지는 못해서 GUI환경은 구축하지 못했는데 혹시 CLI로만 수업을 따라간다고 했을 때 문제가 생기는 점이 있을지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
라벨인코딩
라벨인코딩시 object대신 숫자로 대치되던데 어떤 object이 어떤 숫자로 매칭되었는지 어떻게 알수 있나요? 감사합니다.
-
해결됨데이터분석 준전문가(ADsP) 자격증 대비
2-18 차원축소기법에 관한 강의가 2-17강의와 동일합니다
2-18 차원축소기법의 강의가 말그대로 2-17 상관분석에 대한 강의와 똑같은 내용의 영상이 업로드 되어 있습니다