cursor 동작원리

스프링 배치

해결된 질문

작성

696

안녕하세요 선생님.

https://www.inflearn.com/questions/341918

좋은 강의 잘 듣고있습니다! 감사합니다.

안녕하세요 선생님.
비슷한 고민을 하다가 이 질문을 찾아오게 되었는데요,
예를들어 1000 건의 데이터가 있고, 100건씩 데이터를 처리하려고 하더라도
실제로 SQL 자체는 단 한번 실행되고,
데이터베이스 서버에서 해당 resultSet 을 가지고있으면서
cursor 를 batch application 으로 반환하고,
cursor 를 통해서 필요시 DB server 에 실제 데이터를 요청한다고 이해했습니다. (그리고 받은걸 메모리에 올려서 작업)

그러면 결국 DB 서버에서는 그 많은 데이터를 전부 메모리에 올려놓고 batch 작업이 종료될 때까지 유지해야한다고 이해했는데, 혹시 제가 이해한게 맞나요?!

spring-boot spring-batch

답변 2

myeonjeong

질문자

그리고 executeInternal 을 실행하고 나면, 이런식으로 rows 를 개수만큼 가져오게 되는데

이건 실제 데이터가 아니라 (실제 데이터는 db 메모리에 전부 올라가있고)

그에 접근할 수 있는 자료구조를 따로 제공해줬다.... 그러므로 데이터가 아무리 많아도 메모리 이슈는 생기지 않는다.

라고 생각하면 되는걸까요?

답변 기다리겠습니다! 감사합니다!!

myeonjeong

질문자

더하여 처음 한 번 resultSet 이 만들어지고, 그것을 기반으로 계속 읽기가 진행되니

중간에 조건에 맞는 row 들이 더 추가되더라도

대상건으로 잡히지 않는 것이겠군요!

확인 부탁드립니다! 감사합니다 ㅎㅎ

정수원

지식공유자

네

java 에서 resultSet 은 db 의 데이터를 가지고 있는 상태가 아니라 데이터를 담기 위한 작업을 마찬 상태라 보시면 됩니다.

즉 rs.next() 로 호출하는 순간 db 로 부터 fetchSize 만큼 데이터를 자바의 메모리로 로드하고 나서 다음 re.next() 를 호출하게 되면 db 가 아닌 자바의 메모리로부터 데이터를 참조하게 됩니다. 그리고 나서 fetchSize 만큼 데이터를 다 참조하고 나면 다시 db 로 부터 fetchSize 만큼 다시 데이터를 자바 메모리로 로드하게 됩니다.

여기서 db 에서 1000 건의 데이터를 자체 메모리에 다 올릴 것인지 아니면 일정한 크기의 버퍼만큼 올릴 것인지는 db 설정에 따라 결정될 것입니다.

다만 cursor 방식은 한번 연결된 db 커넥션이 모든 데이터를 db 로 부터 다 가져오기까지 커넥션이 열려있기 때문에 커넥션 타임아웃이 발생하지 않도록 대응이 필요합니다.

인프런 커뮤니티 질문&답변

cursor 동작원리