묻고 답해요
144만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1 memberes 파일 저장이 되지 않습니다.
작업형1 모의문제1에서 코딩을 하려고 입력했는데members파일이 저장되지 않아 시작을 하지 못하고 있습니다. 어떻게 해야될까요??
-
미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
ConnectionError
import requestsclient_id = '*********'client_pwd = '********'naver_open_api = 'https://openapi.naver.com/v1/search/shop/query=아이스크림'headers_parms = {'X-Naver-Client-Id':client_id, 'X-Naver-Client-Secret':client_pwd}res = requests.get(naver_open_api, headers = headers_parms)print(res.json()) 해당 코드에서 오류가 나는 이유를 모르겠습니다,,
-
미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
쥬피터 노트북 사용 방법
어떻게 실행하는지 모르겟어요.jupyternotebook.ipynb 을 open으로 누르면 Token authentication is enabledIf no password has been configured, you need to open the server with its login token in the URL, or paste it above. This requirement will be lifted if you enable a password. 위와 같은 페이지가 뜨는데요 어떻게 해야하나요?
-
미해결파이썬을 활용한 머신러닝 딥러닝 입문
Feature Scaling 강의 질문 있습니다!
(1) Feature scaling 실습 강의를 듣다가 궁금한 점이 있어 질문드립니다! 타이타닉 자료에서 나이에 대한 결측치는 중간값으로 처리하고, Embarked의 경우 drop을 하는 걸로 알려주셨는데요 🙂 원래 없는 값인데 중간 값으로 결측치를 채워주는 것도 그렇구 다른 FEATURE값이 있는데 결측치가 있는 row라고 지워버리는 것도 그렇고 결측치가 주는 영향이 그만큼 크기 때문인가요?? 값이 비어있는 것보다는 평균으로라도 채워놓는 게 좋은 건지, 다른 feature 정보가 있더라도 결측치가 있는 row는 지우는 게 좋은 건지 feature engineering에 대해 제대로 이해하지 못한 것 같아 여쭤봅니다! (2) SKEW된 FARE에 log를 취해주셨는데요! 사실 그래프만 보면 parch도 sibsb도 한 쪽으로 쏠려있고 한 쪽이 많은 느낌인데 왜 fare만 skew로 log를 취해주신 걸까요? (3) 교재에서는 train_test_split 부분을 이렇게 해주셨는데요! X_train = df_titanic[:700]X_test = df_titanic[700:]y_train = X_train.pop('Survived')y_test = X_test.pop('Survived')X_train, X_test에서 survived 부분을 안 빼줘도 되는 건가요?? 늘 감사합니다!!
-
미해결파이썬을 활용한 머신러닝 딥러닝 입문
heatmap에서 numeric_only=True
타이타닉 탑승자 자료로 Feature scaling을 실습하는 강의에서, heatmap을 그리는 부분을 듣고 있는데요!g=sns.heatmap(df_titanic.corr(numeric_only=True),annot=True,cmap='coolwarm') 교재에는 이렇게 되어 있는데 실제 강의에서는 numeric_only=True 부분을 작성하지 않고도 똑같이 그리셨더라구요! 교재 코드에 해당 부분이 있는 이유가 궁금해 여쭤봅니다! 감사합니다 :)
-
미해결프로그래밍 시작하기 : 파이썬 입문 (Inflearn Original)
10:26 popitem() 질문입니다
argument가 필요한 pop(arg)와 달리 popitem()는 변수 없이 무작위로 key 하나를 pop 한다고 하셨는데요. 아무리 돌려봐도 무작위가 아니라 맨 마지막에 선언한 key부터 차례대로 pop 하는 것 같습니다. dictionary는 순서가 없는 자료형이라 key 간 순서가 있는 것 같진 않은데 제일 마지막에 선언한 key부터 pop되는게 맞나요? 코드 아래 첨부드립니다.----------- # Chapter03-5 # Python Dictionary # 범용적으로 가장 많이 사용 # 순서x, 키 중복x, 수정o, 삭제 o # 선언. 중괄호 사용 a = {'name': 'Kim', 'phone': '01033337777', 'birth':'870514'} # 중괄호 + 키 + : + 값. 키는 int등 다른 자료형도 가능 b = {0: 'Hello Phtyon'} # 키는 숫자도 가능 c = {'arr': [1, 2, 3, 4]} # 값 역시 리스트 등 어떤 자료형도 가능 d = { 'Name' : 'Niceman', 'City' : 'Seoul', 'Age' : 33, 'Grade':'A', 'Status': True } # 가독성 좋게 보통 이렇게 많이 선언함. e = dict([ ('Name', 'Niceman'), ('City', 'Seoul'), ('Age', 33), ('Grade', 'A'), ('Status',True) ]) # 사실 이게 가장 정석임. dict 명령어 안에 list 안에 튜플. 어려워서 많이 쓰진 않지만 정석코드 선호하는 사람은 씀 f = dict( Name = 'Niceman', City = 'Seoul', Age = 33, Grade = 'A', Status = True ) # e의 개선형. 이걸 d와 더불어 가장 많이 사용함. 이거로 선언하는 습관 들이는게 좋음. print('a - ', type(a), a) print('b - ', type(b), b) print('c - ', type(c), c) print('d - ', type(d), d) print('e - ', type(e), e) print('f - ', type(f), f) print('>>>>>>') # 출력 print('a - ', a['name']) # 직접 key로 접근. 존재하지 않는 key를 가져오려하면 error print('a - ', a.get('name1')) # get 명령어로 접근. key로 접근하는 방식과 달리, 없는 key도 None으로 가져오므로 안정적. 많이 씀. print('b - ', b[0]) print('b - ', b.get(0)) print('f - ', f.get('City')) print('f - ', f.get('Age')) print('>>>>>') # 추가 a['address'] = 'seoul' print(a.get('address')) print(a['address']) a['rank'] = [1, 2, 3] print(a) print(len(a)) # key의 갯수 print(len(b)) print('>>>>') # 함수 : dict_keys, dict_values, dict_items : 반복문에서 사용 가능 print('a - ', a.keys()) # value는 무관. key만 가져옴 print('a - keys list', list(a.keys())) # key를 list 형태로 반환 print('b - ', b.keys()) print('c - ', c.keys()) print() print('a - ', a.values()) # value만 반환 print('b - ', b.values()) print() print('a - ', a.items()) # key-value가 튜플 형태로 한쌍으로 묶여서 리스트로 반환. 정석대로 선언할 때처럼 key-value 튜플 형태로 반환되는거임. print('a - items list', list(a.items())) # list로 형변환 print() print('a - ', a.pop('name')) # pop : 꺼내서 반환 후 원래 리스트에서는 삭제 print('a - after pop', a) print('c - ', c.pop('arr')) print('c - after pop', c) # 빈 dict print() print('f - ', f.popitem()) # popitem : 이름 지정 안해도 자동으로 뒤부터? 랜덤으로? pop print('f - after popitem', f) print('f - ',f.popitem()) print('f - after popitem', f) print('f - ',f.popitem()) print('f - after popitem', f) print('a - ', a.popitem()) print('a - after popitem', a) print('a - ', a.popitem()) print('a - after popitem', a) print('a - ', a.popitem()) print('a - after popitem', a)
-
미해결파이썬 Streamlit 활용한 웹 자동화 업무, 데이터 검색 및 시각화
강의 자료는 어떻게 볼 수 있어요?
강의 자료 링크를 눌러도 어떤 링크도 보이지를 않는데 어떻게 볼 수 있나요?
-
해결됨Airflow 마스터 클래스
파이참에서 외부 파이썬 함수 수행하기
안녕하세요. 외부 파이썬 함수 수행하기가 안되어서 문의드리게 되었습니다. 저는 Pycharm이 익숙해서 Pycharm으로 하고 있었는데,Pycharm의 경우 .env파일이 인식이 안되는 걸까요..?common 모듈을 발견하지 못하네요....env파일을 아래와 같이 설정하였고dags_python_import_func.py에서도Enable EnvFile에 체크표시를 하였는데여전히 해당 모듈을 읽지 못하네요...ㅠㅠ혹시 Pycharm의 경우 .env파일을 다르게 설정해야하는 걸까요...?
-
해결됨파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
강의 크롤링 엑셀 파일로 저장하는 것까지 추가해 봤습니다.
## 엑셀 시트 연습겸 추가했습니다. ## 좋은 강의 감사합니다. import re from bs4 import BeautifulSoup import requests import openpyxl res = requests.get('https://davelee-fun.github.io/blog/crawling_stock_example.html') soup = BeautifulSoup(res.content, 'html.parser') items = soup.select('li.row_sty') excel_file = openpyxl.Workbook() excel_sheet = excel_file.active excel_sheet.title = 'Sheet1' excel_sheet.append(['회사명','주식 가격','변동율']) for i in items: a = i.select_one('div.st_name').get_text().replace(" ","").replace('\n','') b = i.select_one('div.st_price').get_text().replace('\n','').replace(" ","") c = i.select_one('div.st_rate').get_text().replace('\n','').replace(" ","") excel_sheet.append([a,b,c]) excel_file.save('stock.xlsx') excel_file.close()
-
미해결실습으로 끝장내는 웹 크롤링과 웹 페이지 자동화 & 실전 활용
선생님이랑 똑같이 적었는데 저는 왜 오류가 날까요?ㅠ
안녕하세요! 차근차근 잘 보고 있습니다.선생님이랑 똑같이 따라하고 있는데 저는 자꾸 에러가 나서요ㅠㅠ".logo_naver"가 없어진거 같아서 다른걸 붙여서 했는데도 오류가 나는데 뭐가 잘못된 걸까요ㅠㅠㅠㅠ답변이 선생님이랑은 다르게 이렇게 나와서요ㅠㅠ똑같이 따라하는데 뭐가 잘못된 건지 모르겠어요ㅠㅠ
-
미해결파이썬을 활용한 머신러닝 딥러닝 입문
pd.Series
랜덤포레스트와 그래디언트부스팅 강의에서 마지막에 FEATURE importance를 pd.series로 하는 과정이 나오는데, 그래프를 그리기 전 이 과정이 왜 필요한 건가요? 감사합니다!
-
미해결파이썬을 활용한 머신러닝 딥러닝 입문
Feature Scaling
feature scaling에서 X_test는 fit_transform이 아니라 transform만 해야한다고 하셨는데요! (logistic regression 실습 18분 부근) 어차피 X_train과 평균과 표준편차가 동일할 거라는 건 이해가 되지만, 미래 값인 X_test의 평균/표준편차를 구할 순 없다는 말씀은 이해가 잘 되지 않습니다 ㅠㅠ, 그리고 어차피 동일하다면 X_test에 fit_transform을 해도 같은 결과가 나와야 하는 거 아닌가요? 늘 감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1 에서 에러가 나는데 왜이럴까요 ?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요위와 같은 에러가 나서 info로 확인해봤는데 df는 데이터프레임형태였습니다..다시 실행해보아도 똑같이 나오는데 어디에서 문제가 있었던걸까요?
-
미해결프로그래밍 시작하기 : 파이썬 입문 (Inflearn Original)
강의자료 부탁드립니다.
안녕하세요. 강의자료 부탁드립니다.이메일은 linseong00@naver.com 입니다.감사합니다!
-
해결됨실리콘밸리 엔지니어가 가르치는 파이썬 기초부터 고급까지
dictionary comprehension
correct_score_dict = {name: score + 5 for (name, score) in incorrect_score_dict.items() if score < 80}이 코드를 print 하면 {'Lisa' : 80} 만 출력되는데,만약 80점 이하의 점수만 수정해서 원래대로 {'Tom': 80, 'Lisa':80, 'Sarah':90} 이렇게출력 하려면 if 뒤에 추가적인 코드가 필요할 것 같은데 그런 경우에는 코드를 어떻게 작성해야할까요?
-
미해결[2024 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
뉴스기사 크롤링 css선택자 선정의 어려움......도와주세요....
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요!쌤 인프런, 유튜브 강의 보면서 잘 만들어 가고 있었는데현재 코드에서 아무리 수정을 해도 css를 잘못 가져오는건지 오류가 생겨서 답답해서 질문 들고 왔습니다현재 css 코드 찾기 좀 부탁드릴게요ㅠㅠ안되는 항목✔연예뉴스 -> 내용을 못 가져옴✔스포츠뉴스 -> 제목, 날짜, 내용 다 못 가져옴css를 여러개 바꿔서 넣어봐도 저는 자꾸 찾을 수 없다고 크롤링 됩니다 도와주세요,,,,,,,#네이버기사 크롤링 엑셀저장 import requests from bs4 import BeautifulSoup import time import pyautogui from openpyxl import Workbook #사용자입력 keyword = pyautogui.prompt("검색어를 입력하세요") lastpage = int(pyautogui.prompt("몇 페이지까지 크롤링 할까요?")) #엑셀 생성 wb = Workbook() #엑셀시트 생성 ws = wb.create_sheet(keyword) #열 너비 조절 ws.column_dimensions['A'].width = 60 ws.column_dimensions['B'].width = 30 ws.column_dimensions['C'].width = 60 ws.column_dimensions['D'].width = 150 #행 번호 row = 1 #페이지 번호 pageNum = 1 for i in range(1, lastpage*10, 10) : print(f"{pageNum}페이지 크롤링중입니다 =================") response = requests.get(f"https://search.naver.com/search.naver?where=news&query={keyword}&sm=tab_opt&sort=1&photo=0&field=0&pd=3&ds=2024.04.11&de=2024.15.20&news&query={keyword}&start={i}") html = response.text soup = BeautifulSoup(html, 'html.parser') articles = soup.select("div.info_group") #뉴스기사 div 10개 추출 for article in articles: links = article.select("a.info") #리스트 time.sleep(0.7) if len(links) >= 2: #링크가 2개 이상이면 url = links[1].attrs['href'] #두번째 링크의 href를 추출 response = requests.get(url, headers={'User-agent': 'Mozilla/5.0'}) html = response.text soup_sub = BeautifulSoup(html, 'html.parser') content = soup_sub.select_one("#newsct_article") if content: content_text = content.get_text(separator="\n") else: content_text = "내용을 찾을 수 없습니다." title = None date = None #만약 연예 뉴스라면 if "entertain" in response.url: title = soup_sub.select_one(".end_tit") date = soup_sub.select_one("div.article_info > span > em") content = soup.select_one("#articeBody") #만약 스포츠 뉴스라면 elif "sports" in response.url: title = soup_sub.select_one(".Main_article_title") content = soup.select_one("._article_content") else: title = soup_sub.select_one(".media_end_head_headline") date = soup_sub.select_one("span.media_end_head_info_datestamp_time._ARTICLE_DATE_TIME") #본문 내용안에 불필요한 div, p제거 divs = content.select("div") for div in divs: div.decompose() paragraphs = content.select("p") for p in paragraphs: p.decompose() print("=======제목======= \n", title.text.strip() if title else "제목을 찾을 수 없습니다.") print("=======날짜======= \n", date.text if date else "날짜를 찾을 수 없습니다.") print("=======URL======= \n", url) print("=======내용======= \n", content.text.strip() if content else "내용을 찾을 수 없습니다") # 'else' 블록에서 'date' 변수 정의는 여기서 끝나도록 수정 ws['A1'] = '제목' ws['B1'] = '날짜' ws['C1'] = 'URL' ws['D1'] = '내용' ws[f'A{row}'] = title.text.strip() if title else "제목을 찾을 수 없습니다." ws[f'B{row}'] = date.text.strip() if date else "날짜를 찾을 수 없습니다." ws[f'C{row}'] = url ws[f'D{row}'] = content_text.strip() if content else "내용을 찾을 수 없습니다." row=row+1 #마지막 페이지 여부 확인하기 next_button = soup.select_one("a.btn_next") if next_button: isLastPage = next_button.attrs.get('aria-disabled', None) if isLastPage == 'true': print("마지막 페이지 입니다.") break pageNum = pageNum+1 wb.save(f"{keyword}_4월_뉴스기사_크롤링(4)_내용까지_0411~0415(3).xlsx")
-
해결됨(2024년) 파이썬 알고리즘 트레이딩 파트1: 알고리즘 트레이딩을 위한 파이썬 데이터 분석
하드웨어 용량 사용 승인 요청 거부
안녕하세요. 강의 영상을 보면서 Korea Central 지역에 Quotas 요청을 보냈는데 아래와 같이 나오면서 승인이 안되네요QMS Update - Status: ResourceType: crpCores { Quota Bucket: TotalLowPriorityCores Status Description: Due to very high rates of Spot consumption, Microsoft is unable to approve additional quota at this time State: SpotVMNotAllowedForPayGCustomer Current Quota: 3 New Quota: 16 } Properties: [location, koreacentral] } Korea South 지역에 요청해도 동일하게 되지 않습니다. 어떻게 해야할까요?QMS Update - Status: ResourceType: crpCores { Quota Bucket: TotalLowPriorityCores Status Description: Due to very high rates of Spot consumption, Microsoft is unable to approve additional quota at this time State: SpotVMNotAllowedForPayGCustomer Current Quota: 3 New Quota: 16 } Properties: [location, koreasouth] }
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
sort()함수를 이용한 문자 가나다순 정렬 관련 문의드립니다
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 데이터 분석을 위한 파이썬 기초2 / 2:44 관련 문의드립니다. sort()함수를 이용하면 list 내의 문자를 가나다순 정렬가능하므로, 해당 리스트에서 가나다순 정렬되면 아래와 같이 되어야할 것 같은데,to be: [동그라미', '네모', '세모',]강의 및 실습해보니, 다음과 같이 실행되어 문의드립니다.to be: ['네모', '동그라미', '세모']
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
파이썬 기초 2강, 딕셔너리 부분에서 질문이 있습니다.
딕셔너리 파트 맨 첫번째 부분에서# dictbox = {'name' :' 네모' , 'level', 5}라고 적혀있었는데이거를 di = { } 형태로 바꿀 때 아레처럼 바꾸셨는데di = {'name' : 'sam' , 'level':5} 왜 '네모' 에서 'sam'으로 바뀌었는지 이해가 되지 않습니다.
-
미해결5개 거래소별 코인차익알림봇, 구체적인 개발 가이드 with Python
파이썬 기초전자책, 업그레이드 버전소스, 발송부탁드립니다. 수강평 작성완료 gaidbdhial@gmail.com
파이썬 기초전자책, 업그레이드 버전소스, 발송부탁드립니다. 수강평 작성완료 gaidbdhial@gmail.com