묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨한 방에 끝! 빅데이터분석기사 실기 작업형
판다스와 머신러닝, 문제풀이 쪽 세부 커리큘럼을 알 수 있을까요?
수강생들을 위해 만든 질문입니다~
-
미해결
(크롤링, 엑셀연동, 데이터분석, 업무자동화용) 파이썬 공부방향 질문드립니다. [어떤 라이브러리를 추가로 공부하면 될지]
안녕하세요. 귀중한 조언 감사드립니다. 파이썬 이제 막 기초를 끝낸 파이썬 초보입니다. 책과 강의로 파이썬 기초서적을 3회독 점도 하였고, 별도로, pandas, numpy, matplotlib, 셀레니움 라이브러리를 공부했습니다. (질문) 저는 전문 프로그래머나 개발자는 아니고, 별도의 사업과 투자를 하는 사람입니다. 제 사업이나 주식, 부동산 자료분석에 활용하고자 파이썬이라는 도구를 활용하려는 것입니다. ● 주로, 방대한 인터넷 세계에서 제가 원하는 자료만을 크롤링해 올수 있는 방법으로 활용 ● 그 크롤링한 자료들을 a. 제가 지정한 폴더에 한번에 다운로드 받거나 (예컨대, 이미지 파일들을 폴더에 대량으로 다운받거나) b. 제가 원하는 크롤링한 내용들(글자 내용 등)을 엑셀에다가 일목요연하게 정리되게 출력해주는 식으로 활용도 해 나가고.. (예컨대, 네이버 연관검색어를 쫙 모아서 엑셀에다가 정리해준다던지) ● 그렇게 크롤링되어 엑셀로 재정리된 그 자료를 데이터 분석도 하고, 그래프도 만들고, 통계도 만들고 아울러 ● 업무 자동화도 만들어나가는 식으로 파이썬을 활용해나갈 것을 염두에 두고 있습니다. =================================== 결국, 크롤링, 엑셀연동, 데이터분석, 업무자동화용으로 파이썬을 활용하고자 합니다. ■ 파이썬 기초에 + 판다스, 셀레니움, 넘파이, matplotlib를 공부한 상태인데 크롤링, 엑셀연동, 데이터분석, 업무자동화용으로 파이썬을 활용하려면 여기에, 어떤어떤 라이브러리(모듈)을 추가로 공부해나가야 하는지, 여기에 자주 사용하는 라이브러리(모듈)은 무엇무엇이 있는지 질문드립니다. 귀중한 답변 정말 감사드립니다. 오늘도 좋은 하루 되세요 ^^
-
미해결파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기 Part1
검색으로 해결 못해서 질문 드립니다.
안녕하세요. 예를 들어서 df ['매수'] = df['5이평'] > df['20이평'] 이렇게 하면 해당되는 매수칼럼에 1이란 값이 들어가는데 신호가 발생후에 1이란 신호를 계속 유지할수 있는 방법이 혹시 있을까요? 이게 단순히 매수 매도가 같은 신호이면 상관은 없는데 , 매수와 매도가 다른 신호로 구성되었다고 치면 이벤트 방식의 for loop 를 사용하면 따로 변수를 이용하여 하면 되는데, 판다스 백터방식의 백테스터를 하려고하니깐 저 신호가 유지가 되어야 하는데 5 / 20 이평의 데드가 나는순간 바로 매수칼럼의 값이 0으로 바뀌어서 ,,, 이리저리 생각을 해보고 검색을 해봤는데 딱 해결방법을 못찾아서 질문을 남깁니다.. ㅜㅜ 신호값이 1로 바뀌고 매도시그널이 뜨기전까지 1의 값이 유지되면 좋은데, 그런 방법이 떠오르지가 않네요. 백터계산을 하지 않으니 너무 오랜시간의 백테스터가 걸려서 더 간단하게 할수 있는 방법을 찾고 있습니다.ㅜㅜ 감사합니다~
-
미해결파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기
안녕하세요, loc에 관한 질문입니다.
안녕하세요, loc에 관한 질문입니다. loc['기업이름']을 하면 잘 찾아지는데... 데이터프레임을 리스트로 만들어서 loc[리스트]로 하면 에러가 나서 어떻게 수정해야 하는지 질문 드립니다 ㅠ import pandas as pd import seaborn as sns import matplotlib as mpl import matplotlib.pyplot as plt from tqdm.auto import tqdm tqdm.pandas() mpl.rc('font', family='AppleGothic') plt.rcParams['axes.unicode_minus'] = False # url = "https://finance.naver.com/sise/sise_group_detail.nhn?type=upjong&no=261" table = pd.read_html(url, encoding="cp949") raw = table[2] print(raw.shape) raw = raw.dropna(how="all").dropna(axis=1, how="all") raw["종목명_전처리"] = raw["종목명"].str.replace("*", "") raw["종목명_전처리"] = raw["종목명_전처리"].str.strip() # raw의 종목명을 index로 만들고, index를 리스트로 만들기 raw = raw.set_index('종목명_전처리') raw raw를 부르면 제약업종 데이터 프레임이 나옵니다. 아래는 제가 따로 만들어 놓은 데이터프레임을 리스트로 전환한겁니다. test = pd.DataFrame([['이수앱지스', '111', '222'], ['메드팩토','333','444'], ['부광약품','555','666']], columns = ['종목명', '매출액','영업이익']) # 종목명을 index로 바꿈 test = test.set_index('종목명') # index를 리스트로 변환 test_list = test.index.to_list() test_list 이 상태에서 raw.loc[['메드팩토']]는 되는데 test_list는 어떻게 해도 안 되네요. 어떻게 질문해야 할지 몰라서 인터넷으로도 검색을 못하겠어요 ㅋㅋㅋ큐ㅠㅠ raw.loc[['메드팩토']] raw.loc[[test_list]]