인프런 커뮤니티 질문&답변

작성자 없음

작성자 정보가 삭제된 글입니다.

파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)

크롤링과 업무 자동화 기술: 네이버 Open API 활용, 네이버쇼핑 엑셀 보고서 만들기

네이버 쇼핑 API 엑셀로 옮길 떄 질문있어요!

작성

·

572

0

안녕하세요. 끝까지 수강하기위해 노력중인 수강생이에요..

마지막갈수록 어려워지는건 기분탓일까요.. 

Open API를 사용해서 랭킹, 제목, 링크까지 뽑아내는건 성공했습니다. 

그런데 동영상 13분 30초에서도 보면 title로 뽑아낸 자료들에 

전부 <b> </b> 태그가 붙는데 이 태그를 없애는 방법이 따로 있나요? 

전에 썼던것 처럼 get_text 이런걸 써주면 해결되는 부분인가요? 

제가 나름대로 get_text 를 써서 리스트 안에 넣어봤는데 안되더라구요. 어찌해야할까요? 

답변 5

1

            excel_sheet.append([num, item['title'], item['link']])

이부분에서 그대로 하면 /b 와같은 텍스트도 같이 나오는데 어떻게 하면 필요한 제목만 뽑을 수 있을까요?

0

문자열 변경 함수 사용해서 특정 값 제거 할 수 있습니다.

replace("찾을값", "바꿀값")

.replace('<b>', '') 이렇게 해서 ''로 변경하실 수 있습니다.

0

저도 같은 고민중인데 혹시 해결하셨다면.. 해결 방법 공유 부탁드립니다 ㅠㅠ

0

import requests, pprint

import openpyxl

excel_file = openpyxl.Workbook()

excel_sheet = excel_file.active

excel_sheet.column_dimensions['B'].width = 100

excel_sheet.column_dimensions['C'].width = 100

excel_sheet.append(['번호','제목','링크'])

client_id = 'gK2JvAAN997VlvpHrZbV'

client_secret  = 'yXIHkID5kR'

num = 0

for index in range(10):

    start_num = 1 + (index*100)

    naver_open_api = 'https://openapi.naver.com/v1/search/shop.json?query=android&display=100&start' + str(start_num)

    header_params = {'X-Naver-Client-Id': client_id ,'X-Naver-Client-Secret':client_secret}

    res = requests.get(naver_open_api, headers = header_params)

    if res.status_code == 200:

        data = res.json()

        for item in data['items']:

            num += 1

            excel_sheet.append([num, item['title'], item['link']])

    else:

        print('Error:', res.status_code)

excel_file.save('0710연습.xlsx')

excel_file.close()

0

안녕하세요. get_text() 로 태그 없이 텍스트만 추출이 가능합니다. 코드를 보여주시면 get_text()로 변경하는 부분도 알려드리겠습니다. 감사합니다.

작성자 없음

작성자 정보가 삭제된 글입니다.

질문하기