묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결
HTML 에서 a 태그의 href 만 뽑아오기
파이썬으로 왓차피디아 사이트를 크롤링 하려고 하는데요.requests 랑 Beautifulsoup 모듈을 사용하고 있습니다.{영화 제목: ~~~,제작연도 : ~~~,링크: ~~~}이렇게 만들고 싶습니다. 근데 링크를 뽑아오는 데서 문제를 겪고 있습니다. 보시다시피 아래에서 두 번째 줄에서 리스트 컴프리헨션을 활용했는데요.soup_links 에 데이터가 비어서 나옵니다.웹에서 개발자 도구로 확인했는데도 저렇게 나오는데 혹시 고수님들 어떻게 해야 링크를 크롤링 할 수 있을까요?url_watcha = "https://pedia.watcha.com/ko-KR" req_watcha = requests.get(url_watcha) html = req_watcha.text soup = BeautifulSoup(html, "lxml") soup_titles = soup.select("div.css-1ntmtyn-ContentTitle-makeTypeFunction-handleHorizontalUlRender") soup_year_countries = soup.select("div.css-zb5qbk-StyledContentYearAndNation-createMediaQuery-makePediaTypeFunction") soup_links = soup.select("li.css-1ofozqs.ei3ci1h10 > a") titles = [t.get_text(strip=True) for t in soup_titles[:10]] year_countries = [y.get_text(strip=True) for y in soup_year_countries[:10]] links = [l["href"] for l in soup_links] time.sleep(1)
-
미해결스프링 핵심 원리 - 기본편
'code' 질문입니다
12번째줄에서FixDiscountPolicy discountPolicy =new FixDiscountPolicy();이렇게써도 정상적으로 test에는 성공하던데, 선생님의 DiscountPolicy discountPolicy=new FixDiscountPolicy();와FixDiscountPolicy discountPolicy =new FixDiscountPolicy();뜻 차이는 뭔가요?그리고 선생님처럼 써야하는 이유는 무엇인지 궁금합니다.
-
미해결실전 데이터 사이언스 Part2. 데이터 전처리
In[42] 14:50 코드 질문
안녕하세요 선생님. 질문이 너무 많아 죄송스럽네요..! 매번 질문에 답을 쉽게 이해할수있게 달아주셔서 감사합니다. 이번엔 좀 코드적인 부분에서 궁금했는데 # 가중치의 컬럼 이름을 확인하고 큰 값 순으로 정렬하여 보겠다 result = pd.DataFrame({'feature':X.columns,'weight':model.coef_[0].round(3)}) result.sort_values('weight', ascending=False, inplace=True) result 여기서 42번 cell에서 코드가 조금 이해가 안됩니다. feature이란 column은 X라는 우리 data에서 column을 가져온거 같고 weight은 어떤원리로 가져왔는지 모르겠습니다. model.coef[0]이라는게 41번째 cell에서 저희가 array로 본거중 0번째만갖고온다는게 무슨뜻인지 잘 모르겠습니다. array의 shape이 (1,12)인걸 알아냈고 여기에서 알아서 feature이랑 weight값 12개랑 자동적으로 매칭이 되나요? (즉, 순서가 다 있다는건가요?) 조금 질문이 난해한거 같네요.. 죄송합니다. 그리고 inplace=True는 뭐하는 함수인가요?