인프런 커뮤니티 질문&답변

qnvr31p님의 프로필 이미지
qnvr31p

작성한 질문수

CS 지식의 정석 | 디자인패턴 네트워크 운영체제 데이터베이스 자료구조

조인 알고리즘 #2. 정렬병합조인(Sort Merge Join) ★★★

정렬병합조인 질문드립니다.

작성

·

157

0

- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.

 

코드 내에서 값이 같은 경우 append를 하고

indexA += 1, indexB += 1을 해주셨는데

그럼 테이블B에 id가 중복된 경우 해당 행을 조인하지 못하고 건너뛰는 상황이 발생하지 않나요?

 

예를 들어 A의 id가 1, 2, 3, 4, 5이고

B의 id가 3, 3, 6, 7 이라고 하면

조인의 결과가 2행이 나와야 하는데

indexA = 2 indexB = 0 에서 매칭 후

바로 둘다 indexA = 3, indexB = 1이 되면

조인의 결과가 1행만 나올 것 같아요

답변 1

0

큰돌님의 프로필 이미지
큰돌
지식공유자

안녕하세요 ㅎㅎ

그럼 테이블B에 id가 중복된 경우 해당 행을 조인하지 못하고 건너뛰는 상황이 발생하지 않나요?

>> 네 맞습니다. 해당 실습 코드의 경우 id가 유니크한 경우를 기반으로 만들었습니다.

만약에 qn님이 생각하신 반례를 처리하는 코드를 만든다면 다음과 같이 만드시면 됩니다.

tableA = [{'id': 1, 'value': 'A1'}, {'id': 2, 'value': 'A2'}, {'id': 3, 'value': 'A3'}]
tableB = [{'id': 2, 'name': 'B2'}, {'id': 2, 'name': 'B3'}, {'id': 2, 'name': 'B4'}]

# 먼저 두 리스트를 'id'를 기준으로 정렬합니다.
sorted_tableA = sorted(tableA, key=lambda x: x['id'])
sorted_tableB = sorted(tableB, key=lambda x: x['id'])

joined_table = []

indexA, indexB = 0, 0
while indexA < len(sorted_tableA):
    rowA = sorted_tableA[indexA]
    temp_indexB = indexB  # 임시 인덱스
    while temp_indexB < len(sorted_tableB) and sorted_tableB[temp_indexB]['id'] <= rowA['id']:
        rowB = sorted_tableB[temp_indexB]
        if rowA['id'] == rowB['id']:
            joined_row = rowA.copy()
            joined_row.update(rowB)
            joined_table.append(joined_row)
        temp_indexB += 1

    indexA += 1  # 다음 rowA로 이동

    # ID가 더 작은 rowB를 건너뛰기 위해 indexB를 업데이트
    while indexB < len(sorted_tableB) and sorted_tableB[indexB]['id'] < rowA['id']:
        indexB += 1

# 결과 출력
for row in joined_table:
    print(row)

 

위 코드도 괜찮지만 정렬병합조인 설명하기에는 제가 설명했던 코드가 더 단순 + 설명하기 쉽기 때문에 해당 예제 코드를 사용했습니다.



또 질문 있으시면 언제든지 질문 부탁드립니다.

좋은 수강평과 별점 5점은 제게 큰 힘이 됩니다. :)

감사합니다.

강사 큰돌 올림.


qnvr31p님의 프로필 이미지
qnvr31p

작성한 질문수

질문하기