인프런 커뮤니티 질문&답변

최경완님의 프로필 이미지

작성한 질문수

python pandas dataframe을 엑셀 vlookup처럼 활용하고 싶은데 쉽지 않습니다. 도와주세요

23.09.10 11:04 작성

·

775

1

하고 싶은 것

  • 일부 주문이 서비스 유형: 픽업임에도 배달메뉴코드로 생성되어 이를 찾고 싶습니다.
    (배달메뉴와 픽업메뉴 코드는 서로 다름)

  • 엑셀 vookup을 사용해서 상품코드를 배달 메뉴 테이블에서 검색하고, 검색되지 않으면 오주문으로 판단하는 코드를 구현했습니다.

  • 같은 프로그램을 파이썬을 통해 구현해보고 싶은데, 다른 dataframe에 없는 값을 찾아 행을 추가하는 과정이 어려워 조언을 구하고 싶습니다.

파이썬 코드

df_pickup = 픽업 주문내역 데이터 프레임
delivery_menu_code = df_delivery_menu["상품코드"]
df_misorder = pd.DataFrame()

# 픽업 주문내역에서 상품코드를 꺼내 해당 상품코드가 배달 메뉴 코드에 포함되어 있는지 확인
# 만약에 코드가 없으면 해당 row를 df_misorder에 추가

for idx, row in df_pickup.iterrows():
    misorder = df_delivery_menu[delivery_menu_code.str.contains(row["상품코드"], na = False)]

    if len(misorder) != 0:
        df_misorder.concat(row) 
    else:
        pass

# 어떻게 추가해도 계속 0개로 나와서, 도와주시면 감사드리겠습니다! 
len(df_misorder)

 

답변 1

1

인프런 AI 인턴님의 프로필 이미지

2023. 09. 11. 11:06

안녕하세요, 인프런 AI 인턴이에요.

문제를 해결해 드리겠습니다. 코드를 보니 concat 함수를 사용하는 부분에 문제가 있습니다. concat 함수를 사용하여 데이터프레임에 행을 추가하려면, concat 함수의 첫 번째 인자로 추가할 데이터프레임을 전달해야 합니다. 그리고 ignore_index=True 옵션을 설정하여 새로운 인덱스를 할당해야 합니다. 아래 코드를 참고하여 수정해보세요.

df_misorder = pd.DataFrame()

for idx, row in df_pickup.iterrows():
    misorder = df_delivery_menu[delivery_menu_code.str.contains(row["상품코드"], na=False)]

    if len(misorder) != 0:
        df_misorder = pd.concat([df_misorder, row.to_frame().T], ignore_index=True)
        
len(df_misorder)

이렇게 수정하면 df_misorder에 원하는 결과가 잘 추가될 것입니다. 추가로, df_delivery_menu의 “상품코드” 열에 중복된 값이 없다는 가정하에 코드가 작성되었습니다. 만약 중복된 값이 있다면, concat 함수로 인해 중복이 발생할 수 있습니다. 이 경우, drop_duplicates 함수를 사용하여 중복된 행을 삭제할 수 있습니다.

더 도움이 필요하시면 언제든지 물어보세요. 즐거운 프로그래밍 하세요!