묻고 답해요
144만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
linear regression 과 PCA, p_value 질문
선생님 안녕하세요좋은 강의 감사합니다. linear regression(statsmodel)에 PCA를 적용하여 test 데이터로 예측하는 경우에 질문이 있습니다. 예를 들어, 기존의 20개의 피쳐 --> PCA를 통해 10개의 새로운 피쳐(x1~x10)를 추출했다고 가정하고,이 중에 statsmodel로 linear regression 을 돌렸는데, 이 중 x6, x7, x8 의 p_value 가 0.05 이상이어서 유의미한 피쳐가 아니라고 볼 수 있는 상황입니다. 그러면 test 데이터(valid 데이터 아님)를 가지고 실제로 예측을 해야 하는 상황에서는, test 데이터를 가지고 PCA를 돌려서 10개의 새로운 피쳐를 추출그 중에 x1~x5, x9, x10 --> 7개의 피쳐를 추출하고, train 데이터에서 나온 7개의 coef 를 가지고 만들어진 선형 모델로 예측 수행을 하면 되는 것이 맞나요? 제가 궁금한 것은 PCA를 사용하여 나온 피쳐 중 일부만을 사용하는 경우에도, train 을 통해 나온 coef 를 pca로 변환한 test 데이터에 사용할 수 있는지 여부 입니다. 감사합니다.
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
group by agg function failed 에러
1.5 groupby 까지 안막히고 잘 오다가여기서 막힙니다.df_last.groupby(["지역명"]).mean()작성했을때 TypeError: agg function failed [how->mean,dtype->object]에러가 뜹니다. 그런데 이어서 ["평당분양가격"]을 타이핑 하면 정상 결과가 나옵니다. 무슨 문제일까요.,?
-
해결됨파이썬/장고 웹서비스 개발 완벽 가이드 with 리액트 (장고 4.2 기준)
04-13) slugify가 작동하지 않습니다
질문을 온전히 이해할 수 있도록, 모든 맥락을 전달해주세요.질문은 질문자가 번거로워야 보다 좋은 답변을 얻으실 수 있습니다.시행착오를 알려주시면 곧바로 원하는 문제에 집중할 수 있습니다.오류 메시지는 일부만 알려주시기보다 전체 오류 메시지를 캡처해서 주시면, 오류 파악에 도움이 됩니다. 당신의 파이썬/장고 페이스메이커가 되겠습니다. ;-)인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. ===================================Song 모델, slug 필드 추가에서 질문이 몇 가지 있습니다.우선, Meta 속성 추가는 makemigration을 위한 것이고, get_absolute_url method는 template에서 호출하기 위해 정의한 것으로 이해했습니다.첫 질문은 makemigration을 두 단계로 나눈 이유가 있나요? class Migration(migrations.Migration): dependencies = [ ("hottrack", "0001_initial"), ] operations = [ migrations.AddField( model_name="song", name="slug", field=models.SlugField(allow_unicode=True, blank=True), ), migrations.AddIndex( model_name="song", index=models.Index(fields=["slug"], name="hottrack_so_slug_7cf104_idx"), ), migrations.RunPython(forward_code, reverse_code=migrations.RunPython.noop) ] 이런식으로 한번에 처리하면안되나요? 또한 영상 8:06 실습 영상에서는 생략되어있지만 5:40 설명하실 때는 class Song(models.Model): melon_uid = models.CharField(max_length=20, unique=True) rank = models.PositiveSmallIntegerField() album_name = models.CharField(max_length=100) name = models.CharField(max_length=100) artist_name = models.CharField(max_length=100) cover_url = models.URLField() lyrics = models.TextField() genre = models.CharField(max_length=100) release_date = models.DateField() like_count = models.PositiveIntegerField() slug = models.SlugField(allow_unicode=True, blank=True) class Meta: # Model의 related field, primary key에 대해서는 자동으로 index가 생성된다. # 이외에 model을 쿼리할 때 자주 사용되는 field인 경우 index 생성을 고려해보는 것이 좋다 indexes = [ models.Index(fields=["slug"]) ] def slugify(self, force=False): if force or not self.slug: self.slug = slugify(self.name, allow_unicode=True) def save(self, *args, **kwargs): self.slugify() super().save(*args, **kwargs) @property def get_absolute_url(self) -> str: # slug = slugify(self.name, allow_unicode=True) ###################################################### print("-----------check-----------") self.save() # 강의 상에서 누락 ####################################################### return reverse( viewname="hottrack:song_date_detail", args= [ self.release_date.year, self.release_date.month, self.release_date.day, self.slug, ] # kwargs={"pk": self.pk} )get_absolute_url 내부에 self.slugify()를 호출하여 detail 버튼을 클릭하였을 때 slug가 없으면 name으로 부터 slugify를 수행하는 것으로 이해하였는데 그 경우 db에 저장되지 않습니다. 그래서 제 경우 임으로 self.save()로 줄을 추가하여 db에 저장되도록 하였습니다.테스트를 위해 0002 migration만 진행하여 빈 slug필드만 생성하였습니다.그러나 버튼을 눌러 페이지를 호출 시url은 정상적으로 생성되었으나 db 업데이트가 이루어지지 않아 404 not found가 발생합니다. 추가적으로print 문도 stream에 나오지 않습니다. 아마 template단에서 method를 콜해서 그런거 같은데 문제가 뭔가요?만약 제가 이해한 바가 틀리다면, save와 slugify method는왜 정의했으며 어디에 사용되는 건가요?
-
해결됨2주만에 통과하는 알고리즘 코딩테스트 (2024년)
[탑다운] 상담문제
if day > N: return -999999999999해당 부분을 -2 혹은 -99 등으로 조건을 바꾸면 왜 통과가 안되는지 궁금합니다. -999까지는 통과가 되더라고요 import sys N = int(sys.stdin.readline()) answer = 0 plan = [] for _ in range(N): plan.append(list(map(int, sys.stdin.readline().split()))) #dp[day]를 계산하는 함수 def rec(day): if day > N: return -999999999999 if day == N: return 0 #dp[day]가 한번이라도 계산된적 있다면 두번 할 필요없음 if dp[day] != -1: return dp[day] dp[day] = max(rec(day + plan[day][0]) + plan[day][1], rec(day + 1)) return dp[day] dp = [-1 for _ in range(N + 1)] rec(0) print(dp[0]) #dp[0]은 첫째날 선택했는지 아닌지까지 포함한 최대값
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제2 age 컬럼의 이상치 관련
안녕하세요, 퇴근후딴짓 선생님~!작년 6차 실기에서 5점 차이로 떨어지고,7차 때는 바빠서 응시를 못했다가 다시 필기 보고8차 실기에 응시하게 된 장수생(…)입니다.6차 때가 혜자였는데… 노력이 부족했던 것 같습니다.바쁘실텐데, 본론을 말씀드리면'age'컬럼의 이상치(소수점 나이와 음수나이, 0포함)요 조건에서 선생님께서는df['age'] <= 0요렇게 설정을 해주셨는데요.그런데, 소수점 나이를 생각하면0.1이나 0.2 이런 것도 있을 수 있잖아요?members.csv의 'aget'컬럼 상에는 0~1사이의값은 없습니다만…df['age'] < 1이게 어떨까 싶어 이렇게 여쭈어봅니다.요번 실기 때는 열심히 해서 한 번 후기 남겨보겠습니다.항상 감사합니다~
-
미해결파이썬 동시성 프로그래밍 : 데이터 수집부터 웹 개발까지 (feat. FastAPI)
비동기 함수를 동기적인 실행으로 만드는 부분 질문입니다
안녕하세요. 강의 잘 보고 있습니다. 다름이 아니라 [섹션1 - 동기 vs 비동기] 강의 내용 중 "비동기 함수로 정의된 것들을 동기적인 실행으로 만드는 부분"을 설명해주셨는데요! 예를 들어, 수업 내용에서 언급된 아래와 같은 코드일 때입니다. import asyncio async def delivery(name, mealtime): print("start:", name) await asyncio.sleep(mealtime) print("end") async def main(): await delivery('A', 10) await delivery('B', 5) await delivery('C', 3)그러면 위 코드를 async def가 아닌 일반적인 동기 함수 def 로 정의해서 아래처럼 동기적으로 프로그래밍한 것이랑 성능적인 차이가 있나요? 비동기 함수로 정의하고 굳이 동기적인 프로그래밍을 작성하는 경우가 예시로 뭐가 있으려나요..? 단순히 생각했을 때 어차피 동기적인 프로그래밍으로 작성할 것이라면 애초에 동기함수로 작성하는 게 코드를 읽는 다른 사람들에게도 좀 더 헷갈리지 않게 하는 게 아닐까..싶은데 궁금합니다! import time def delivery(name, mealtime): print("start:", name) time.sleep(mealtime) print("end") async def main(): delivery('A', 10) delivery('B', 5) delivery('C', 3)
-
해결됨[2024 신규] 어서와, Fast API는 처음이지?
실행을 했음에도 연결이 안되는 경우는 어떻게 해야할까요
(base) PS C:\Users\JaeJun> curl http://127.0.0.1:8000 StatusCode : 200 StatusDescription : OK Content : {"Hello":"World"} RawContent : HTTP/1.1 200 OK Content-Length: 17 Content-Type: application/json Date: Sun, 28 Apr 2024 07:59:31 GMT Server: uvicorn {"Hello":"World"} Forms : {} Headers : {[Content-Length, 17], [Content-Type, application/json], [Date, Sun, 28 Apr 2024 07:59:31 GMT], [Server, uvicorn]} Images : {} InputFields : {} Links : {} ParsedHtml : mshtml.HTMLDocumentClass RawContentLength : 17powershell을 통해 호출할 경우 위와 같이 GET이 정상적으로 되지만웹브라우저를 통해서 접근할 경우에는Chrome이나 Edge 모두 연결할 수 없다고 합니다..인바운드,아웃바운드 모두 8000을 혹시 몰라 열어둔 상태이며,8000이 아닌 8000-8010까지 포트를 변경해봤는데 안되고 있습니다. 어떻게 해야할까요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
Robustscaler 질문
수치형은 robustscaler를 사용하려고 하는데여from sklearn.preprocessing import RobustScaler scaler = RobustScaler() cols = x_train.select_dtypes(exclude='object') for col in cols: x_train[col] = scaler.fit_transform(x_train[col]) x_test[col] = scaler.transform(x_test[col])이렇게 하면 ,ValueError: Expected 2D array, got 1D array instead:array=[ 888. 1308. 151. ... 173. 1244. 893.].Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.이런 오류가 납니다... 어떻게 수정해야 하나여
-
미해결파이썬 알고리즘 문제풀이 입문(코딩테스트 대비)
미로탐색 상태트리
안녕하세요 선생님. dfs 문제 풀이 할 때 항상 상태트리를 그려보려고 하고있는데,미로탐색 DFS 문제의 경우에는 어떻게 그려야 할 지 감이 안잡혀서 질문 드립니다. 이 문제에 대한 상태트리는 어떻게 그려야하는 건가요?
-
해결됨파이썬/장고 웹서비스 개발 완벽 가이드 with 리액트 (장고 4.2 기준)
04-04 강의에서 질문 있습니다
질문을 온전히 이해할 수 있도록, 모든 맥락을 전달해주세요.질문은 질문자가 번거로워야 보다 좋은 답변을 얻으실 수 있습니다.시행착오를 알려주시면 곧바로 원하는 문제에 집중할 수 있습니다.오류 메시지는 일부만 알려주시기보다 전체 오류 메시지를 캡처해서 주시면, 오류 파악에 도움이 됩니다. 당신의 파이썬/장고 페이스메이커가 되겠습니다. ;-)인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. JS로 토스트 스타일 메시지 노출에서 JS와 장고 템플릿이 강하게 결합되어 있어 react와 같은 것을 적용하기 어렵다고 하셨는데 그게 무슨 뜻인가요?| 가 템플릿에서 원래 필터라고 배웠는데 json_script를 키로 하여 closure 함수를 매핑하는 것은 어떤 원리인가요?--> 이와 관련하여 단순히 views.py 에서 serialize된 List[dict]를 context에 반환 시키는 것보다 저런 식으로 context processor를 사용하는 것은 toast 메시지를 여러 페이지에서 사용할 수 있을 수도 있기 때문인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3. 메뉴 중 가격이 가장 비싼 순으로 정렬해 상위 3개 값을 구하시오
안녕하세요! 강의 잘 듣고 있는 학생입니다. 위 문제에서 설명을 보면 새로 저장한 후 위에 3개를 뽑았는데요, 그 대신에 다음과 같이 하면 안될까요? 바로 head(3)을 추가해서 뽑았습니다. 답은 같은데 실제 시험에서 이렇게 해도 될까요?df.sort_values("가격", ascending=False).head(3)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3회 기출문제 작업형 2 인코딩
3회 기출문제 작업형2에서 인코딩이 원핫인코딩으로 되어 있는데요. 이걸 레이블인코딩으로 해보려고 보니까 아래와 같은 에러가 떠서요.. 어떤 부분이 잘못됐는지 모르겠어요 ㅠㅠ
-
해결됨직장인에게 꼭 필요한 파이썬-아래아한글 자동화 레시피
핸드폰으로는 못보나요?
핸드폰으로는 볼 수 없나요?커리큘럼 눌러도 내용이 안보이네요.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
LightGBM의 min_child_samples 와 min_child_weight
안녕하세요.LightGBM의 min_child_samples 와 min_child_weight는 같은 것인가요?둘 다 그 갯수가 되지 않으면 더 이상 child를 만들지 않게 하려는 용도의 parameter인것이죠? 감사합니다.
-
해결됨파이썬/장고 웹서비스 개발 완벽 가이드 with 리액트 (장고 4.2 기준)
django htmx 외에 몇 가지 질문 있습니다.
@login_required_hx def note_delete(request, pk): note = get_object_or_404(Note, pk=pk, author=request.user) if request.htmx: note.delete() messages.success(request, "기록을 삭제했습니다.") return HttpResponseClientRedirect(redirect_to=reverse_lazy("photolog:index")) photolog 삭제 기능은 다루시지 않으셨길래 htmx로 구현해보고 있었습니다. 여기서 get_object_or_404를 설정하면 해당하는 쿼리셋 결과가 없을때 404오류를 반환해야하는데 htmx때문에 404 오류를 발생시키지 않습니다. 이 경우엔 어떻게 에러를 해결해야하나요?HttpResponseClientRedirect을 통한 리다이렉트 요청은 함수기반뷰에서는 작동하지만 클래스 기반뷰에서는 작동하지 않았습니다. 이유가 무엇일까요? (form_valid 메서드에 HttpResponseClientRedirect만 추가해서 재정의 했습니다) 여러 파일을 등록해보았는데 같은 png 파일이지만 특정 파일은 등록할 수 없었습니다.OSError at /new/ cannot write mode P as JPEG 오류가 발생하길래 기존 RGBA를 RGB로 변환하는 부분을 아래와 같이 수정했습니다.if pil_image.mode != "RGB": pil_image = pil_image.convert("RGB") jpeg로 변환시에는 모든 타입에 대해서 RGB로 변환을 하는게 일반적인건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경 체험링크가 들어가지지 않습니다.!
시험환경 체험링크에서 코딩을 하려고 했는데.위사진처럼 링크를 들어가면 계속 저렇게 뜹니다. ㅠ 이럴땐 어떻게 해야될까요.?? (작업형1 모의고사 부분입니다)
-
해결됨코딩테스트 [ ALL IN ONE ]
반복문 강의에서
vscode에서 for 문 디버그하는 거 어떻게하나요 ?
-
미해결파이썬을 활용한 머신러닝 딥러닝 입문
DBSCAN 실습 결과
수업에서 DBSCAN 결과가 이렇게 내왔는데 그러면 OUTLIER도 파란색이고 모여있는데도 색깔이 다른 곳들이 있으니 학습이 잘 된 건 아닌 케이스일까요? 감사합니다!
-
미해결파이썬을 활용한 머신러닝 딥러닝 입문
DBSCAN 질문
늘 강의 잘 듣고 있습니다! DBSCAN에서 Radius(R)와 Minimum Neighbor number(M)을 가르쳐주시고 Core, Border 개념을 소개해주셨는데 헷갈리는 부분이 있어 질문 드립니다. pdf 자료를 보며 R에 2unit 이렇게 되어 있는데 이 Unit이라는 건 데이터 포인트의 점 크기를 말하는 걸까요? 그리고 정한 M 값 이상의 데이터 포인트들이 R 안에 들어오면 Core고 Border는 R안에 데이터포인트가 M 보다 작은 수만큼 있는 경우, 다른 Core가 R 안에 있는 경우를 말하는 건가요? (R안에 다른 데이터포인트가 하나라도 있으면 Border인지 궁금합니다)
-
미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
연습 4번에서 featured 를 가져오는 방법
영상과 답안지를 보면 featured 를 가져오기 위해서 featured = soup.select_one('section.featured-post') 를 추가하는 작업이 있는데요...import requestsfrom bs4 import BeautifulSoupurl = 'https://davelee-fun.github.io/'res = requests.get(url)soup = BeautifulSoup(res.content, 'html.parser')items = soup.select('section.featured-posts h4.card-text')for item in items: print (item.get_text().strip())이렇게 하는 방법으로도 동일한 결과값이 나오긴 하는 데 이렇게 하는 방법에 추후 문제나 단점이 있을까요??