인프런 커뮤니티 질문&답변

짱구는못말려님의 프로필 이미지
짱구는못말려

작성한 질문수

쉽게 처음하는 파이썬 고급 크롤링 [Scrapy, Selenium, Headless Chrome]

Scrapy 다양한 사용법: Scrapy 로 네이버 Open API 크롤링하기2

Scrapy 다양한 사용법: Scrapy 로 네이버 Open API 크롤링하기2 [12:12]

작성

·

262

0

 

궁금한게 있어서 여쭤봅니다.

re.sub 정규표현식을 써서 b태그 처리된것을 없앴습니다.<b></b>

 

근데 뒤에 아이폰 내용중에 대괄호로 시작하는 내용들은 안없어지나요? 대괄호도 특수문자 아닌가요? ----> [자급제]

답변 2

0

질문자분 궁금증은 강의에 나온 <\S+>를 써서 특수문자처럼 생긴 <p>태그를 없앴는데 뒤에 []대괄호는 왜 안없어지냐고 물어보신거 같네요 <\S+>는 1개 이상의 whitespace를 제거하는 정규표현식이고 찾아보니 p tag는 whitespace를 만든다고하네요 그래서 ptag만 제거된것같습니다

  • The <p> tag generates a paragraph break. It is applied to a section of text that is a block of text separated from nearby blocks of text by a blank space and/or first-line indent.

0

그것은 요구사항에 따라, 정규표현식을 만든 것이니까요.

제 생각에는 <b> 이런 태그는 사람이 이해하는데에는 이상한 글자 같아서, 그것만 없앤 케이스를 설명드린 것이고요. 모든 특수문자를 다 없애는 정규표현식은 아니고, 대괄호는 사람이 이해하는데 크게 문제가 없는 것 같아서, 특별히 그런 부분을 삭제할 이유는 잘 모르겠어서요.

 

짱구는못말려님의 프로필 이미지
짱구는못말려

작성한 질문수

질문하기