인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

교육님의 프로필 이미지
교육

작성한 질문수

[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)

텍스트를 포함하는 태그 찾기 (feat.정규표현식)

특정 텍스트가 포함되는 태그 여러개 찾기

작성

·

15

0

안녕하세요, [텍스트를 포함하는 태그 찾기(정규표현식)] 강좌에서 특정 텍스트로 시작하는 태그 여러개 찾기와, 특정 텍스트로 끝나는 태그 여러개 찾기 실습을 하면서 궁금증이 생겨 질문 드립니다.

 

[for*="obb"]처럼 for 속성자 중에 obb가 포함되어 있는 것을 찾는 코드처럼

soup.find_all 명령어를 활용해서 제목 중간에 256GB가 적혀있는 태그를 여러개 찾으려면 *를 활용해서 어떻게 코드를 작성할 수 있는지 궁금합니다!

답변 1

0

안녕하세요, 인프런 AI 인턴입니다. 교육님 질문에 도움이 될 만한 자료를 찾아보았습니다.

태그 속성에서 특정 문자열을 포함한 요소들을 찾기 위해 BeautifulSoup의 find_all 메서드를 활용할 수 있습니다. 특히, 중간에 특정 텍스트가 포함된 태그들을 찾고자 할 땐 RegEx(정규 표현식)를 사용하여 좀 더 정교한 검색을 수행할 수 있습니다.

아래에 관련된 유사한 질문과 답변 링크를 몇 가지 공유드립니다:

  1. select() class명 질문입니다. - 이 질문에서는 정규 표현식을 사용하여 정교하게 찾는 방법에 대해 설명하고 있습니다.

  2. 안녕하세요. G마켓에서 해당태그를 찾는데 너무 어렵습니다. - 이 질문에서는 select와 함께 CSS 선택자를 사용하여 특정 속성의 조건을 입력하는 방법을 소개하고 있습니다.

  3. 궁금한 거 있어요 - 이 질문에서도 클래스를 두 개 이상 포함하는 태그를 찾는 방법에 대한 설명이 포함되어 있어 참고하시면 좋을 것 같습니다.

find_all을 사용할 때 정규 표현식을 포함할 수 있기 때문에 다음과 같이 사용할 수 있습니다:

import re
from bs4 import BeautifulSoup

# HTML 예제 코드
html_doc = """
<div for="1obbGBKe"></div>
<div for="2abc128GB"></div>
<div for="obb"></div>
<div for="3mno256GB"></div>
"""

soup = BeautifulSoup(html_doc, 'html.parser')

# 정규표현식을 이용하여 256GB가 포함된 태그 찾기
tags_with_256GB = soup.find_all(attrs={"for": re.compile("256GB")})

for tag in tags_with_256GB:
    print(tag)

위와 같은 방식으로 find_all 함수에 정규표현식을 포함하여 특정 텍스트 패턴을 매칭할 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

교육님의 프로필 이미지
교육

작성한 질문수

질문하기